DO ÁUDIO ANALÓGICO AO DIGITAL E A SUA PROBLEMÁTICA

Propaganda
DO ÁUDIO ANALÓGICO AO DIGITAL E A SUA
PROBLEMÁTICA
Joaquim J.P. Seixo
1
IPG ESTG Qt do Zambito, 6300 Guarda Portugal
Sumário
Neste documento apresentam-se alguns conceitos e notícias do âmbito do tratamento
do som, sua captura, armazenamento, reprodução e sintetização, com vista à inserção
deste artigo como trabalho sobre a matiz multimédia, alguns conceitos sobre outros
elementos da matriz podem ser explicitados a fim de providenciar uma melhor
compreensão.
0. Introdução
A perspectiva de estudo do som e do sistema auditivo está na génese deste artigo, mesmo que
a sua reduzida dimensão para abarcar todos os assuntos que lhe dizem respeito. É portanto
partido dessa base que podemos compreender como o som pode ser guardado, criado ou
reproduzido, pelos modernos sistemas informáticos e as optimizações que tem vindo a sofrer.
1. Os Sons e o ouvido humano
O Som é produzido por vibração de um material, essa vibração é conduzida pelo ar até ao
ouvido humano que a detecta e interpreta. Podemos afirmar que segundo a ciência que estuda
os sons a Acústica, o som é o resultado de uma perturbação mecânica do meio elástico, que ao
deslocar-se provoca uma sensação.
1.1 O Som como movimento periódico.
O som como fenómeno físico é um exemplo de um movimento ondulatório que apresenta
praticamente todas as propriedades deste tipo de movimento: refracção, difracção,
interferência e relações entre frequência, comprimento de onda ? , e velocidade de propagação
? . que varia de condutor para condutor, no ar as ondas sonoras propagam-se à velocidade de
340 m/s.
Para analogia apresenta-se o efeito da queda de um objecto numa superfície de água em
repouso, Fig.1, em que a elevação corresponde a uma zona de pressão e a depressão a uma
zona neutra, à quantidade de zonas de pressão geradas por segundo chama-se frequência ?
Fig. 1 – Exemplo de uma onda.
1.2 Características de um som
As principais características de um som são: altura (Grave ou agudo) e a frequência,
amplitude, (forte ou fraco) . Com estas características é possível descrever completamente um
som, no entanto existem propriedades que podem interferir com a qualidade de um som
nomeadamente: o timbre que se baseia na existência de harmónicos (sons com frequências
múltiplas do portadora base), a ressonância que é uma característica do material que produz o
som (capacidade de aumentar a amplitude de uma vibração sem necessitar de um grande
aumento de energia), a reflexão e reverberação são também propriedades dos materiais que
produzem o som ou são obstáculos à sua propagação. Na Fig. 2 apresentam-se gráficos
exemplificativos das características do som.
Fig. 2 – Características dos sons
1.3 Características do Ouvido Humano
O ouvido não é mais que um transdutor (Um conversor de um tipo de energia as ondas
sonoras para sinais eléctricos inteligíveis para o cérebro), adiante veremos como esta analogia
se aplica aos métodos de recepção e armazenamento dos sons.
A gama de frequências que o nosso ouvido pode detectar vai de 20 Hz a 20 kHz para um
ouvido normal sendo possível a audição de frequências fora do espectro mencionado, a nossa
voz compreende frequências no intervalo de 200 Hz a 8,5 kHz, esta informação vai ser
determinante nos processos de armazenamento e transporte de voz. Na fig. 3 podemos
observar as gamas de frequências produzidas pela voz e a sua depedência das características
do gerador.
Fig. 3 – Gama de emissão da voz humana
1.4 Armazenamento do Som
O som pode ser guardado em dois formatos fundamentais: Digital e Analógico.
No formato digital o som é representado por sequências de 0 e 1 organizados de uma forma
predeterminada a fim de poder ser reproduzida e interpretada, daí que existem vários sistemas
de armazenamento do som. No formato analógico os som são guardados por níveis diferentes
de intensidade da gravação do material de suporte a mantém a analogia apresentada na fig. 1,
normalmente bandas magnéticas ou discos de vinil.
2. Som Digital
Quando se fala de som digital não estamos a referirmo-nos só ao suporte de armazenamento
mas também á sua reprodução e sintetização.
2.1 O Som na Matriz MM
Na génese do som está sempre a sua forma analógica de produção e transmissão em meio
acústico de forma continua, portanto a captura de um som tem sempre de ser na forma
analógica, portanto a sua transferência para o formato digital e o inverso é efectuada por
conversores A/D e D/A (Analógico/Digital).
Podemos assim afirmar que o áudio é uma forma capturada de continuamente fig 4.
Forma
Contínua
Discreta
Capturado
Sintetizado
Modo
Áudio
Fig. 4 – Matriz Multimédia para os sons naturais
Numa perspectiva mais avançada podemos incluir nesta matriz a possibilidade de sintetização
de forma contínua de um som, e o seu reconhecimento por equipamento adequado.
Existem vários tipos de formatos de ficheiros de som, são os mais comuns o ficheiros MIDI
(Musical Instrument Digital Interface) e os ficheiros WAV (do Inglês Onda).
2.1.1 MIDI
São ficheiros constituídos por declarações matemáticas capazes de serem convertidas em sons
ou agrupamentos de sons, que quando enviados para um sintetizador produz sons audíveis
semelhantes aos produzidos por acções mecânicas na natureza. Nestes ficheiros estão
representadas matematicamente todas as características acima descritas para o som.
Por ex. A linha seguinte pode corresponder
Som(? (475),? (5),? (2,2),?(2)) o que pode significar Nota, Altura, Tempo e
Instrumento.
Naturalmente este ficheiro terá como grande vantagem a sua dimensão extremamente reduzida
chegando ficheiros de musicas bastante elaboradas, e para 6 minutos de reprodução ao
tamanho de 50 Kbytes. A grande desvantagem prende-se com a incapacidade de reprodução
de voz.
2.1.2 WAV
Amplitude
São por natureza o suporte dos sons, neste tipo de ficheiros os sons são armazenados em
sequências de 0’s e 1’s que representam instantes de amostragem de um som, ou seja para a
construção destes ficheiros exige-se a conversão de analógico para digital, através de um
conversor A/D, que processa as operações de amostragem, cálculo da frequência de
amostragem, e integração num processo descrito na fig. 5.
Tempo
Amplitude
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13
5
4
3
2
Tempo
1
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13
Fig. 5 – Conversão A/D
Amplitude
Existem regras para a determinação dos intervalos de tempo ti em que devem ser colhidas as
amostras, assim uma onda é representada por colunas que correspondem ao valor da
amplitude da onda nesse preciso instante, t1 tem valor 2, t2 tem valor 4 assim como t3, ... esta
representação exige uma amostragem mínima para que na reprodução se tenha um som
bastante aproximado do original. Na fig. podemos verificar que a onda obtida na reprodução
não é igual à inicial, mas estas aproximar-se-ão se fizermos aumentar a frequência da
amostragem. Fig. 6
5
4
3
2
Tempo
1
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13
Fig. 6 – Conversão D/A
Nas fig. podemos observar as características o que o fabricante Motorola está a incluir nas
suas unidades de conversão. Fica-nos assim a ideia de que uma qualidade CD standard tem
uma codificação de 16 Bits para uma frequência de 33 Khz e 24 bits para a frequência de
44.1 kHz.
2.1.2.1 Especificações do Fabricante Motorola Fig. 7 e fig. 8
TLV320AD543, 3 V SINGLE
CHANNEL CODEC W/HYBRID OP
AMPS & SPEAKER DRIVER
WL1101, VOICE-BAND AUDIO
PROCESSOR
Parameter Name
Parameter Name
TLV320AD54
3
TLC320AD90
Resolution (Bits)
20
SNR (typ) (dB)
90
Architecture
AC97 Codec
Resolution (Bits)
16
Sampling Rate (kHz)
11.025
Bandwidth (kHz)
up to 4.96
Supply Voltage(s) (V)
3.3, 5
Conversion Method
sigma-delta
Bandwidth (Hz)
20 - 20K
Number of Channels
1
Pd (typ) (mW)
235
Pd (typ) (mW)
90
Sampling Rate (max) (kHz) 48
Fig. 7 – Características de conversores
DIGITALIZAÇÃO FREQUÊNCIA/PALAVRA
Fig. 8 – Processos e Frequências
2.1.3 Outros processos
Foram experimentados e existem ainda outros processos de codificação permitindo uma
redução de tamanhos dos ficheiros sem que se possa falar de compressão, é de salientar que a
segurança e a portabilidade são bastante importantes quando se transmite um ficheiro deste
tipo, no entanto não tem grande significado se o ficheiro se mantiver sempre no mesmo
suporte físico
Amplitude
Podemos imaginar que uma onda só tem duas possibilidades de variação ou aumenta de
amplitude ou diminui, se dividirmos o tempo em pequenas porções e em cada ponto
comparando com o anterior verificarmos que a amplitude aumenta escrevemos um 1 se
diminuir escrevemos um 0 conforme fig.9 . Este processo obrigaria a um reduzido número de
falhas a à marcação de um tempo e valor inicial, situação facilmente resolvida no processo
anterior onde existe um comprimento definido para cada registo 8,16, ou 20 bits.
Tempo
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13
Registo (0,1) (1,2) (2,3) (3,4) (4,5)
1
1
0
0
0
1 ...
Fig. 9 – Outro Processo de digitalização
3. Compressão
Compressão é a redução do tamanho de dados com a finalidade de poupar espaço e aumentar
a possibilidade de transmissão desses dados numa rede de computadores, reduzindo o tempo
de transmissão. A Compressão pode começar na remoção de espaço desnecessário, no
seccionamento de zonas escuras (gamas de frequência inaudíveis) ou ainda pela truncagem de
valores extremamente grandes de amplitude cujo valor poderia exceder a capacidade em bits
do registo. A supressão de som pode também contribuir com uma boa quota percentual na
compressão do som, se por uma fracção de tempo não houver emissão esse tempo não
necessita de ser guardado ou transmitido mas sim e só a sua existência temporal.
Até este ponto não foi evidenciada a diferença entre ficheiros exclusivamente de voz ou de
música, no entanto é na área da compressão que a diferença entre eles é mais notória.
Como anteriormente foi referido a emissão de voz está confinada à largura de banda de 200
Hz a 8,5 kHz., enquanto que os instrumentos musicais podem produzir sons em toda a gama
audível, é também na compressão da voz que a supressão de som se torna mais importante,
devido à falta de continuidade da voz.
Amplitude
O surgimento de novos métodos de compressão em que amostragem se mantém mas em vez de
termos 16 bits podemos reduzir o comprimento do registo a 4 bits, pois vamos apenas guardar
a diferença positiva ou negativa de uma amostra para outra conforme se prentende
exemplificar na fig. 10.
Tempo
t1 t2 t3 t4 t5 t6 t7 t8 t9 t10 t11 t12 t13
Fig. 10 – Outro Processo de digitalização
4. Conclusão
Não foi intenção de fazer deste documento um tratado sobre áudio, mas sim criar as condições
para o início de um trabalho mais profundo encaminhado, através do estudo de uma
ferramenta especifica de tratamento de som, e abrir caminho à compreensão dos
procedimentos envolvidos, no tratamento do som e seu enquadramento numa montagem
multimédia.
Referências
http://www-dse.doc.ic.ac.uk/ 23/12/1999
http://www.siemens-hearing.com/ 23/12/1999
http://www.phd.msu.edu/hearing/ 23/12/1999
http://www.digido.com/ 23/12/1999
http://dakx.com/ 23/12/1999
http://www.real.com/player/ 23/12/1999
Download