DO ÁUDIO ANALÓGICO AO DIGITAL E A SUA PROBLEMÁTICA Joaquim J.P. Seixo 1 IPG ESTG Qt do Zambito, 6300 Guarda Portugal Sumário Neste documento apresentam-se alguns conceitos e notícias do âmbito do tratamento do som, sua captura, armazenamento, reprodução e sintetização, com vista à inserção deste artigo como trabalho sobre a matiz multimédia, alguns conceitos sobre outros elementos da matriz podem ser explicitados a fim de providenciar uma melhor compreensão. 0. Introdução A perspectiva de estudo do som e do sistema auditivo está na génese deste artigo, mesmo que a sua reduzida dimensão para abarcar todos os assuntos que lhe dizem respeito. É portanto partido dessa base que podemos compreender como o som pode ser guardado, criado ou reproduzido, pelos modernos sistemas informáticos e as optimizações que tem vindo a sofrer. 1. Os Sons e o ouvido humano O Som é produzido por vibração de um material, essa vibração é conduzida pelo ar até ao ouvido humano que a detecta e interpreta. Podemos afirmar que segundo a ciência que estuda os sons a Acústica, o som é o resultado de uma perturbação mecânica do meio elástico, que ao deslocar-se provoca uma sensação. 1.1 O Som como movimento periódico. O som como fenómeno físico é um exemplo de um movimento ondulatório que apresenta praticamente todas as propriedades deste tipo de movimento: refracção, difracção, interferência e relações entre frequência, comprimento de onda ? , e velocidade de propagação ? . que varia de condutor para condutor, no ar as ondas sonoras propagam-se à velocidade de 340 m/s. Para analogia apresenta-se o efeito da queda de um objecto numa superfície de água em repouso, Fig.1, em que a elevação corresponde a uma zona de pressão e a depressão a uma zona neutra, à quantidade de zonas de pressão geradas por segundo chama-se frequência ? Fig. 1 – Exemplo de uma onda. 1.2 Características de um som As principais características de um som são: altura (Grave ou agudo) e a frequência, amplitude, (forte ou fraco) . Com estas características é possível descrever completamente um som, no entanto existem propriedades que podem interferir com a qualidade de um som nomeadamente: o timbre que se baseia na existência de harmónicos (sons com frequências múltiplas do portadora base), a ressonância que é uma característica do material que produz o som (capacidade de aumentar a amplitude de uma vibração sem necessitar de um grande aumento de energia), a reflexão e reverberação são também propriedades dos materiais que produzem o som ou são obstáculos à sua propagação. Na Fig. 2 apresentam-se gráficos exemplificativos das características do som. Fig. 2 – Características dos sons 1.3 Características do Ouvido Humano O ouvido não é mais que um transdutor (Um conversor de um tipo de energia as ondas sonoras para sinais eléctricos inteligíveis para o cérebro), adiante veremos como esta analogia se aplica aos métodos de recepção e armazenamento dos sons. A gama de frequências que o nosso ouvido pode detectar vai de 20 Hz a 20 kHz para um ouvido normal sendo possível a audição de frequências fora do espectro mencionado, a nossa voz compreende frequências no intervalo de 200 Hz a 8,5 kHz, esta informação vai ser determinante nos processos de armazenamento e transporte de voz. Na fig. 3 podemos observar as gamas de frequências produzidas pela voz e a sua depedência das características do gerador. Fig. 3 – Gama de emissão da voz humana 1.4 Armazenamento do Som O som pode ser guardado em dois formatos fundamentais: Digital e Analógico. No formato digital o som é representado por sequências de 0 e 1 organizados de uma forma predeterminada a fim de poder ser reproduzida e interpretada, daí que existem vários sistemas de armazenamento do som. No formato analógico os som são guardados por níveis diferentes de intensidade da gravação do material de suporte a mantém a analogia apresentada na fig. 1, normalmente bandas magnéticas ou discos de vinil. 2. Som Digital Quando se fala de som digital não estamos a referirmo-nos só ao suporte de armazenamento mas também á sua reprodução e sintetização. 2.1 O Som na Matriz MM Na génese do som está sempre a sua forma analógica de produção e transmissão em meio acústico de forma continua, portanto a captura de um som tem sempre de ser na forma analógica, portanto a sua transferência para o formato digital e o inverso é efectuada por conversores A/D e D/A (Analógico/Digital). Podemos assim afirmar que o áudio é uma forma capturada de continuamente fig 4. Forma Contínua Discreta Capturado Sintetizado Modo Áudio Fig. 4 – Matriz Multimédia para os sons naturais Numa perspectiva mais avançada podemos incluir nesta matriz a possibilidade de sintetização de forma contínua de um som, e o seu reconhecimento por equipamento adequado. Existem vários tipos de formatos de ficheiros de som, são os mais comuns o ficheiros MIDI (Musical Instrument Digital Interface) e os ficheiros WAV (do Inglês Onda). 2.1.1 MIDI São ficheiros constituídos por declarações matemáticas capazes de serem convertidas em sons ou agrupamentos de sons, que quando enviados para um sintetizador produz sons audíveis semelhantes aos produzidos por acções mecânicas na natureza. Nestes ficheiros estão representadas matematicamente todas as características acima descritas para o som. Por ex. A linha seguinte pode corresponder Som(? (475),? (5),? (2,2),?(2)) o que pode significar Nota, Altura, Tempo e Instrumento. Naturalmente este ficheiro terá como grande vantagem a sua dimensão extremamente reduzida chegando ficheiros de musicas bastante elaboradas, e para 6 minutos de reprodução ao tamanho de 50 Kbytes. A grande desvantagem prende-se com a incapacidade de reprodução de voz. 2.1.2 WAV Amplitude São por natureza o suporte dos sons, neste tipo de ficheiros os sons são armazenados em sequências de 0’s e 1’s que representam instantes de amostragem de um som, ou seja para a construção destes ficheiros exige-se a conversão de analógico para digital, através de um conversor A/D, que processa as operações de amostragem, cálculo da frequência de amostragem, e integração num processo descrito na fig. 5. Tempo Amplitude t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 5 4 3 2 Tempo 1 t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 Fig. 5 – Conversão A/D Amplitude Existem regras para a determinação dos intervalos de tempo ti em que devem ser colhidas as amostras, assim uma onda é representada por colunas que correspondem ao valor da amplitude da onda nesse preciso instante, t1 tem valor 2, t2 tem valor 4 assim como t3, ... esta representação exige uma amostragem mínima para que na reprodução se tenha um som bastante aproximado do original. Na fig. podemos verificar que a onda obtida na reprodução não é igual à inicial, mas estas aproximar-se-ão se fizermos aumentar a frequência da amostragem. Fig. 6 5 4 3 2 Tempo 1 t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 Fig. 6 – Conversão D/A Nas fig. podemos observar as características o que o fabricante Motorola está a incluir nas suas unidades de conversão. Fica-nos assim a ideia de que uma qualidade CD standard tem uma codificação de 16 Bits para uma frequência de 33 Khz e 24 bits para a frequência de 44.1 kHz. 2.1.2.1 Especificações do Fabricante Motorola Fig. 7 e fig. 8 TLV320AD543, 3 V SINGLE CHANNEL CODEC W/HYBRID OP AMPS & SPEAKER DRIVER WL1101, VOICE-BAND AUDIO PROCESSOR Parameter Name Parameter Name TLV320AD54 3 TLC320AD90 Resolution (Bits) 20 SNR (typ) (dB) 90 Architecture AC97 Codec Resolution (Bits) 16 Sampling Rate (kHz) 11.025 Bandwidth (kHz) up to 4.96 Supply Voltage(s) (V) 3.3, 5 Conversion Method sigma-delta Bandwidth (Hz) 20 - 20K Number of Channels 1 Pd (typ) (mW) 235 Pd (typ) (mW) 90 Sampling Rate (max) (kHz) 48 Fig. 7 – Características de conversores DIGITALIZAÇÃO FREQUÊNCIA/PALAVRA Fig. 8 – Processos e Frequências 2.1.3 Outros processos Foram experimentados e existem ainda outros processos de codificação permitindo uma redução de tamanhos dos ficheiros sem que se possa falar de compressão, é de salientar que a segurança e a portabilidade são bastante importantes quando se transmite um ficheiro deste tipo, no entanto não tem grande significado se o ficheiro se mantiver sempre no mesmo suporte físico Amplitude Podemos imaginar que uma onda só tem duas possibilidades de variação ou aumenta de amplitude ou diminui, se dividirmos o tempo em pequenas porções e em cada ponto comparando com o anterior verificarmos que a amplitude aumenta escrevemos um 1 se diminuir escrevemos um 0 conforme fig.9 . Este processo obrigaria a um reduzido número de falhas a à marcação de um tempo e valor inicial, situação facilmente resolvida no processo anterior onde existe um comprimento definido para cada registo 8,16, ou 20 bits. Tempo t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 Registo (0,1) (1,2) (2,3) (3,4) (4,5) 1 1 0 0 0 1 ... Fig. 9 – Outro Processo de digitalização 3. Compressão Compressão é a redução do tamanho de dados com a finalidade de poupar espaço e aumentar a possibilidade de transmissão desses dados numa rede de computadores, reduzindo o tempo de transmissão. A Compressão pode começar na remoção de espaço desnecessário, no seccionamento de zonas escuras (gamas de frequência inaudíveis) ou ainda pela truncagem de valores extremamente grandes de amplitude cujo valor poderia exceder a capacidade em bits do registo. A supressão de som pode também contribuir com uma boa quota percentual na compressão do som, se por uma fracção de tempo não houver emissão esse tempo não necessita de ser guardado ou transmitido mas sim e só a sua existência temporal. Até este ponto não foi evidenciada a diferença entre ficheiros exclusivamente de voz ou de música, no entanto é na área da compressão que a diferença entre eles é mais notória. Como anteriormente foi referido a emissão de voz está confinada à largura de banda de 200 Hz a 8,5 kHz., enquanto que os instrumentos musicais podem produzir sons em toda a gama audível, é também na compressão da voz que a supressão de som se torna mais importante, devido à falta de continuidade da voz. Amplitude O surgimento de novos métodos de compressão em que amostragem se mantém mas em vez de termos 16 bits podemos reduzir o comprimento do registo a 4 bits, pois vamos apenas guardar a diferença positiva ou negativa de uma amostra para outra conforme se prentende exemplificar na fig. 10. Tempo t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13 Fig. 10 – Outro Processo de digitalização 4. Conclusão Não foi intenção de fazer deste documento um tratado sobre áudio, mas sim criar as condições para o início de um trabalho mais profundo encaminhado, através do estudo de uma ferramenta especifica de tratamento de som, e abrir caminho à compreensão dos procedimentos envolvidos, no tratamento do som e seu enquadramento numa montagem multimédia. Referências http://www-dse.doc.ic.ac.uk/ 23/12/1999 http://www.siemens-hearing.com/ 23/12/1999 http://www.phd.msu.edu/hearing/ 23/12/1999 http://www.digido.com/ 23/12/1999 http://dakx.com/ 23/12/1999 http://www.real.com/player/ 23/12/1999