sistema de captação de imagem por comando de voz

Propaganda
SISTEMA DE CAPTAÇÃO DE IMAGEM POR COMANDO DE VOZ
Hélio Alves de Souza1, Lucinéia Aparecida da Silva2, Fernando Luís Guarnieri3
1
Universidade do Vale do Paraíba/FEAU, Estr. Municipal do Limoeiro 250, Bairro Jardim Dora, Jacareí –SP.
[email protected], [email protected], [email protected].
Resumo- Este trabalho apresenta o desenvolvimento de um sistema de captação de som e imagem para
uso em videoconferência, controlado por comando de voz, cujos sinais são capturados através de
microfones dispostos em ângulos previamente determinados ( 0°, 60°, 120° e 180° ). Os sinais capturado s
são amplificados, tratados e enviados a um microcontrolador que identifica a fonte de origem, seleciona a
de maior amplitude e posiciona uma câmera para esta fonte geradora. O posicionamento é feito através de
um mini servo motor que gira a base onde está fixada a câmera. A imagem captada é projetada em um
monitor e pode ser enviada, via software, a qualquer destino desejado.
Palavras-chave: Voz Humana, Intensidade, Microcontrolador, Servo motor, Imagem.
Área do Conhecimento: Engenharia Elétrica
Introdução
A comunicação primária do homem é a fala.
Com o passar do tempo, tecnologias surgiram
possibilitando que a voz e outras fontes sonoras
pudessem ser representadas de forma linear.
Sendo assim, algumas características podem ser
analisadas. A freqüência fundamental do sinal de
voz está relacionada com o número de ciclos de
vibrações completadas por segundo. Esta
freqüência varia de 300Hz a 3,4kHz (ERNANDES,
1995).
Um ponto fundamental para o sucesso de
sistemas automatizados é a sua interação com os
humanos. Um caso em que se destaca esta
necessidade é o ambiente de videoconferência,
onde câmeras e microfones devem ser
direcionados à pessoa que está discursando no
momento. Os sistemas de videoconferência
possibilitam a comunicação entre grupos de
pessoas independentemente de suas localizações
geográficas, através de áudio e vídeo
simultaneamente. Esses sistemas permitem
muitas vezes que se trabalhe de forma
cooperativa e se compartilhe informações e
materiais de trabalho sem a necessidade de
locomoção geográfica (ANDRIANI, 2001).
O uso de telefonia também é uma alternativa
na implementação de conferências remotas. No
entanto, o fato de se poder acrescentar vídeo
sincronizado
ao
som
nas
sessões
de
videoconferência, o que não é possível nas
comunicações telefônicas, representa um grande
avanço nas possibilidades de expressividade
envolvidas no diálogo, uma vez que, sabidamente,
a expressão corporal corresponde a 70-80% das
impressões de uma conversa.
O projeto desenvolvido consiste em um sistema
automatizado que atende às necessidades do
ambiente de videoconferência, não sendo
necessária a interação humana, pois a
movimentação angular da câmera para a captação
da imagem do participante é feita através da
detecção da fonte geradora do sinal de voz, e toda
esta informação é enviada aos demais
participantes.
Metodologia:
Optou-se por utilizar quatro microfones de
eletreto do tipo pedestal, pois favorecem a
aproximação do interlocutor, captando o sinal de
forma eficaz. Uma vez captado, o sinal passa por
um amplificador operacional LM386, cujo ganho é
ajustado através de um resistor variável de 10kΩ.
O circuito da Figura 1 mostra a configuração
utilizada.
Figura 1 – Circuito Amplificador
XIII Encontro Latino Americano de Iniciação Científica e
IX Encontro Latino Americano de Pós-Graduação – Universidade do Vale do Paraíba
1
Para que não haja necessidade de
chaveamento dos sinais captados através dos
microfones, em forma de amostragem, é utilizado
um amplificador para cada entrada.
O LM386 é um pequeno amplificador de áudio
de baixa potência, de oito pinos, alimentado por
uma fonte DC de 5V.
O capacitor C1 tem a função de deixar passar
apenas o sinal de áudio captado pelo microfone 1.
O resistor R1 polariza o microfone de eletreto. C2
e R2 filtram possíveis transientes do amplificador
operacional, deixando passar somente a faixa
audível. Para desacoplar o sinal na saída, utilizase o capacitor C9.
Os demais circuitos amplificadores funcionam
de forma idêntica ao circuito descrito acima.
Uma vez captado e amplificado, o sinal é
enviado a um circuito composto por um
microcontrolador PIC 16F877A, um cristal de
4MHz e dois capacitores de 27pF, utilizados como
oscilador. A Figura 2 mostra a pinagem do PIC
utilizado (SOUSA, 2003).
Este servo não chega a dar sequer uma volta
completa
no
seu
eixo.
Entretanto,
as
características deste motor permitem controlar
com precisão o ângulo de posicionamento dentro
dessa faixa.
Figura 3 - Mini servomotor
De sua carcaça saem três cabos (Figura 4). O
vermelho e o preto são respectivamente para a
tensão de alimentação e para a referência de
terra. O outro fio, que costuma ser branco ou
amarelo, é o cabo de controle, pelo qual chegam
os sinais que informam o ângulo (entre 0 e 180
graus) no qual o servo deve se posicionar (Figura
5).
Figura 2- Pinagem do PIC 16F877A
A partir da identificação da fonte de maior
intensidade o microcontrolador faz a verificação de
posição inicial da câmera, soma ou subtrai o
ângulo necessário para que haja coincidência
entre as fontes de imagem e áudio.
O movimento da base giratória, onde está
fixada a câmera, é efetuado por um mini servo
motor (Figura 3), que não necessita de grande
torque. O motor utilizado neste projeto possui uma
faixa de posicionamento de aproximadamente 180
graus.
Figura 4. Servo de posição desmontado
XIII Encontro Latino Americano de Iniciação Científica e
IX Encontro Latino Americano de Pós-Graduação – Universidade do Vale do Paraíba
2
Figura 5. A imagem acima mostra os tempos de
cada pulso (em milisegundos) e sua posição no
eixo do servo respectiva.
O diagrama em blocos (Figura 6) mostra a
disposição dos principais elementos do circuito.
Figura 7 – Diagrama esquemático
Resultados
O circuito foi elaborado e testado através do
software Proteus, no qual foi confirmado seu
funcionamento. A fase atual do projeto contempla
a elaboração de sua programação, e para tal está
sendo utilizada a linguagem C.
Paralelamente à elaboração do programa, está
sendo realizada a montagem do circuito e após
esta etapa deverá ser submetido a testes em
laboratório.
Discussão
Figura 6. Diagrama em blocos
A movimentação da câmera permite a
aquisição de imagens com um campo de visão de
180 graus. Este tipo de sistema é obtido através
da combinação das imagens provenientes de uma
única câmera que gira em torno de um eixo. Sua
velocidade é controlada para que não haja
trepidações que possam prejudicar a qualidade da
imagem (BIANCHI, 2005).
A Figura 7 apresenta o diagrama esquemático,
que mostra a interligação dos elementos do
circuito. Nas saídas dos amplificadores os sinais
são analógicos, e cada saída é conectada a uma
entrada
analógica
do
microcontrolador.
Internamente o PIC16F877A efetua a conversão
para sinais digitais, tornando possível o
processamento desses sinais.
Na configuração inicial, a idéia seria a
utilização de amplificador
monolítico de
instrumentação, o uso deste tipo de amplificador
seria devido à facilidade na obtenção de ganho
fixo, não sendo necessária a utilização de circuitos
periféricos,
que
poderiam
gerar
ganhos
diferenciados. Porém devido à dificuldade na
obtenção deste tipo de componente optou-se por
utilizar o LM386, uma vez que na simulação não
foi observado grandes variações de ganho e o
circuito funcionou de acordo com o planejado.
A
princípio
seriam
utilizados
circuitos
integradores para tratar os sinais analógicos das
saídas dos amplificadores antes de enviá-las a
PIC. Não foi necessária a utilização deste recurso,
pois o microcontrolador escolhido, tem entre suas
funções, a conversão dos sinais analógicos para
digitais.
XIII Encontro Latino Americano de Iniciação Científica e
IX Encontro Latino Americano de Pós-Graduação – Universidade do Vale do Paraíba
3
Conclusão
Embora os resultados tenham sido obtidos
somente em simulação até esta fase do projeto, foi
observado um bom nível de confiabilidade nas
propostas e os componentes utilizados atendem
perfeitamente às necessidades, e todo esse
conjunto de dados direciona para o sucesso na
implantação deste sistema.
Referências
- ANDRIANI, Ricardo A. e SOVIERZOSKI, Miguel
A.
Localizador
de
fonte
sonora
para
videoconferência, CEFET-PR, 2001. Disponível
em:
http://www.cpdee.ufmg.br/~semea/anais/artigos/Ri
cardoAndriani.pdf. Acesso em 26/03/2009.
- BIANCHI, Reinaldo A. C. Sistema de visão
ominiderecional para o monitoramento de
descargas atmosféricas, Centro Universitário da
FEI,
2005.
Disponível
em:
http://www.fei.edu.br/~rbianchi/publications/sbai20
05.pdf. Acesso em 26/03/2009.
- ERNANDES, Ivan F. The Voice of Men and
Machines,
UFPR,
1995.
Disponível
em:
http://www.eletrica.ufpr.br/marcelo/.../IvanVoiceMenMachines.doc. Acesso em 12/03/2009.
- SOUSA, Daniel R. de e SOUZA, David J. de.
Desbravando PIC. ERICA, 2002.
XIII Encontro Latino Americano de Iniciação Científica e
IX Encontro Latino Americano de Pós-Graduação – Universidade do Vale do Paraíba
4
Download