SM - Sistemas Multimédia INTRODUÇÃO

Propaganda
SM - Sistemas Multimédia
INTRODUÇÃO
4.º / 6.º semestre LEIC
(verão 2016/2017)
Sumário
•
•
•
•
•
•
Multimedia
Conceitos gerais sobre codificação
Sistema Auditivo Humano
Sistema Visual Humano
Medidas de semelhança e de distorção
Técnicas de codificação
•
•
•
•
Texto
Imagem
Vídeo
Áudio
Multimédia: uma definição
• Em https://en.wikipedia.org/wiki/Multimedia:
• Multimedia is content that uses a
combination of different content
forms such as text, audio, images,
animation, video and interactive content
• Multimedia contrasts with media that use
only rudimentary computer displays such
as text-only or traditional forms of printed
or hand-produced material.
Multimédia: uma definição
• Em https://www.priberam.pt/dlpo/multimedia :
•
multimédia | adj. 2 g. 2 núm. | s. 2 g.
mul·ti·mé·di·a (inglês multimedia)
adjectivo de dois géneros e de dois números
1. Que utiliza ou se refere a vários suportes de difusão de informação, nomeadamente
imagem e som.
2. Que utiliza ou combina som e imagem.
substantivo de dois géneros
3. Suporte de difusão de informação que utiliza ou combina som e imagem.
• Nota: no português do Brasil, é mais comum multimídia, com género feminino.
Palavras relacionadas: multimídia, MMS, mídia-mix, HDMI, grupo, podcast
Serviços e Sistemas Multimédia
Broadcasting
Video on demand
Video
CD
TV
The Internet
DVD
Telephony
Mobile computing
Processing/storage
Network computing
Network PC
Communications
Caraterísticas para cada domínio
Broadcasting
Standardization
High resolution
Random acess
Real time
Packet communication
Processing/storage
Communications
High processing speed
Conceitos Gerais
• Codificação eficiente dos símbolos de um
ficheiro conduz à compressão da informação
• As razões de uso da compressão?
• Menor espaço ocupado
• Menor tempo de transmissão
• Codificação sem perda (lossless encoding)
• Os dados descodificados são exatamente iguais aos
originais
• Codificação com perda (lossy encoding)
• Os dados descodificados não são exatamente iguais
aos originais
7
Conceitos Gerais
• Codificação sem perda (lossless encoding)
• Também conhecida como compactação de dados
• Os dados descodificados são exatamente iguais aos
originais
• Codificação com perda (lossy encoding)
• Os dados descodificados não são exatamente iguais aos
originais
• A perda é introduzida, tendo em conta as caraterísticas
de perceção:
• Sistema Visual Humano (SVH)
• Sistema Auditivo Humano (SAH)
8
Conceitos Gerais
• Fatores de avaliação do processo de codificação e
descodificação:
• Medida de compressão
• Existem quatro medidas de utilização comum
•
•
•
•
Tempo de codificação
Tempo de descodificação
Memória utilizada na codificação
Memória utilizada na descodificação
9
Conceitos Gerais
• Medidas de compressão
1)
2)
3)
4)
Razão de compressão ou taxa de compressão
Percentagem removida
Bit por byte
N:1
• Considera-se:
• do, a dimensão do ficheiro original
• dc, a dimensão do ficheiro codificado
10
Conceitos Gerais
11
Conceitos Gerais
12
Sistema Auditivo Humano
[wikipedia.org]
Sistema Auditivo Humano
• Cada ouvido tem cerca de 23500 sensores na cóclea
• Existem cerca de 30000 fibras no nervo auditivo para
ligação ao cérebro
• Aproximadamente 30 Mbit se todas ativadas.
• Na prática a transmissão é à volta de 100 kbit/s
• Gamas audíveis, de frequência:
•
•
•
•
Homem, 20 Hz – 20 kHz
Baleia, 2 Hz – 20 kHz
Golfinho, 20 Hz – 200 kHz
Morcego, 16 Hz – 200 kHz
Sistema Auditivo Humano
• Limiar de audição para um tom puro (sinusóide)
Limiar de audição
Limiar de audição para tom sinusoidal
Aproximação: thi = 3.64 (fi/1000)-0.8 - 6.5 exp(-0.6 (fi/1000-3.3)2) + 10-3 (fi/1000)4
60
threshold of hearing (dB)
50
40
Threshold of hearing
0
Rustle of leaves
10
Very quiet room
20
Average room
40
Conversation
60
Busy street
70
Loud radio
80
Train trough station
90
Riveter
100
Threshold of discomfort
120
Threshold of pain
140
Damage to ear drum
160
30
20
10
0
-10
2
10
3
10
frequency (Hz)
4
10
Sistema Visual Humano
cone
[wikipedia.org]
bastonetes
Axónios de células
do nervo óptico
Sistema Visual Humano
Na retina, existem cerca de:
• 6 milhões de cones, sensíveis à cor,
• 100 milhões de bastonetes que são sensíveis à
luminosidade.
O nervo ótico para ligação ao cérebro tem cerca de 1 milhão de
fibras.
Os neurónios podem ser activados cada milissegundo.
A comunicação entre o olho e o cérebro é feita a 1 Gbit por
segundo, aproximadamente.
Sensibilidade à cor
[J. M. Brisson Lopes]
Luz visível
• Tacto (nervos da pele)
Perceção
• Existem cerca de 5 milhões de sensores na pele
• Poucos Mbit por segundo
• Na ponta dos dedos existem sensores espaçados de 1 mm
• Olfacto (pituitária dentro do nariz)
• Os humanos distinguem cerca de 10000 cheiros diferentes
• Comunicação a alguns kbit por segundo.
• Alcance máximo: humano 1 m; cão 100 m; traça 5 km; elefante 3 km
• Audição (ouvido)
• Cada ouvido tem cerca de 23500 sensores na cóclea
• Existem cerca de 30000 fibras no nervo auditivo para ligação ao cérebro
• Aproximadamente 30 Mbit se todas ativadas
• Na prática a transmissão é à volta de 100 kbit /s.
Homem: 20 Hz – 20 kHz; Baleia: 2 Hz – 20 kHz; Golfinho 20 Hz – 200 kHz;
Morcego: 16 Hz – 200 kHz
• Paladar (língua)
Perceção
• As papilas gustativas são estruturas compostas por células sensoriais
que são capazes de discernir entre quatro sabores primários:
• o amargo
• o ácido
• o salgado
• o doce
• Enviadas algumas dezenas de bit por segundo para o cérebro
• Visão (olhos)
• Na retina, existem cerca de 6 milhões de cones, sensíveis à cor, e 100
milhões de bastonetes que são sensíveis à luminosidade
• O nervo ótico para ligação ao cérebro tem cerca de 1 milhão de fibras.
• Os neurónios podem ser ativados cada milissegundo.
• A comunicação entre o olho e o cérebro é feita a 1 Gbit/s,
aproximadamente
Perceção Humana: Ilusões
Perceção Humana: Ilusões
Perceção Humana: Ilusões
Perceção Humana: Ilusões
Conceitos Gerais
27
Conceitos Gerais
28
Conceitos Gerais
29
Conceitos Gerais
•
Distorção - diferença entre o conteúdo original e o
descodificado
30
31
Conceitos Gerais
•
•
Curvas de distorção, em função da compressão obtida
Comparação de codificadores – imagem natural
32
Conceitos Gerais
•
Imagem gerada a computador (computer graphics)
33
Conceitos Gerais
•
Imagem médica
34
Codificação JPEG e JPEG2000
Conceitos Gerais
•
As técnicas de codificação exploram a existência de
redundância e irrelevância nos dados
•
A redundância consiste em componentes que não são
estritamente necessárias porque não têm informação
própria associada:
•
•
•
•
Por exemplo, na leitura das palavras iniciadas por “h”
Nas palavras “que…”, “qua…”, a seguir ao “q” temos sempre o “u”
A seguir a “ç” temos “ça” ou “ço”
As Línguas (Português, Inglês,…) são muito redundantes
36
Conceitos Gerais
•
As técnicas de codificação exploram a existência de
redundância e irrelevância nos dados
•
A irrelevância refere-se a componentes que podem ser
removidas do sinal multimédia, sem afetar a perceção do
mesmo
•
Por exemplo, num sinal de fala a presença de componentes de
alta frequência é irrelevante para a perceção da mensagem
37
Conceitos Gerais
•
As técnicas de codificação sem perda procuram
representar os dados, minimizando a redundância
•
•
Procura-se obter uma representação eficiente, minimizando
o número de bits, para representar cada símbolo
As técnicas de codificação com perda procuram
eliminar as componentes irrelevantes
•
As componentes fora da perceção do SAH e do SVH são
eliminadas na fase de codificação
38
Técnicas de codificação
1. Codificação sem perda. Teoria da informação,
codificação de fonte e compressão universal de
fonte
2. Codificação de imagem sem e com perda.
3. Codificação de vídeo com perda.
4. Codificação de áudio sem e com perda.
Tópicos principais
Parte 1
Teoria da informação, codificação de fonte e
compressão universal de fonte
Tópicos principais
Compressão Lempel-Ziv
Tópicos principais
Compressão Lempel-Ziv
Tópicos principais
Parte 2
Codificação de imagem
Tópicos principais
Codificação JPEG
Tópicos principais
Lena 256 × 256
H(X) = 7,46 bit/símbolo
Codificador
Compressão
(bpp)
Relação
sinal/ruído
SNR (dB)
Huffman
7,51
infinita
Huffman Adaptativo
7,49
infinita
Aritmético
7,48
infinita
Aritmético ordem 1
6,26
infinita
JPEG
2,07
26,16
JPEG
1,42
22,77
JPEG
0,96
19,92
JPEG
0,85
19,09
JPEG
0,63
17,32
JPEG
0,35
13,68
Tópicos principais
Original
0,85 bpp 19,09 dB
2,07 bpp 26,16 dB
0,63 bpp 17,32 dB
0,96 bpp 19,92 dB
0,35 bpp 13,68 dB
Tópicos principais
Tópicos principais: JPEG - qualidade
Original
22.5 dB
26.2 dB
JPEG
JPEG2000
0.5 bit per pixel
compression ratio of 6.25 %
Tópicos principais: JPEG - qualidade
Original
16.1 dB
23.2 dB
JPEG
JPEG2000
0.3 bit per pixel
compression ratio of 3.75 %
Tópicos principais: imagem
• Formatos PNG, GIF e JPEG
PNG tem suporte a três tipos de cor (truecolor, greyscale e
pallete-based)
GIF suporta apenas pallet-based
JPEG suporta truecolor e greyscale
PNG e JPEG apresentam maior precisão de cor
relativamente ao GIF
Imagens pallete-based vs imagens truecolor
Tópicos principais: imagem
Imagem GIF - 256 cores (8 bits)
GIF
JPEG
Imagem JPEG - truecolor (24 bits)
PNG
Tópicos principais: imagem
JPEG – 30KB
Imagem JPEG
GIF – 58KB
Imagem JPEG
com factor de
ampliação de
800%
PNG – 152KB
Tópicos principais
Parte 3
Codificação de vídeo
Tópicos principais
Tópicos principais
H261
As diferenças entre frames consecutivas são reduzidas
Tópicos principais
H261
Tópicos principais
Parte 4
Codificação de áudio
Tópicos principais
Codificação de áudio MP3
Tópicos principais
Codificação de áudio MP3
Tópicos principais
Código Morse
A
.-
J
.---
S
...
1
.----
Period
.-.-.-
Comma
--..--
B
-...
K
-.-
T
-
2
..---
Hyphen
-....-
Colon
---...
C
-.-.
L
.-..
U
..-
3
...--
Question mark
..--..
D
-..
M
--
V
...-
4
....-
Apostrophe
.----.
E
.
N
-.
W
.--
5
.....
Parenthesis
-.--.-
F
..-.
O
---
X
-..-
6
-....
Quotation mark
.-..-.
G
--.
P
.--.
Y
-.--
7
--...
Fraction bar
-..-.
H
....
Q
--.-
Z
--..
8
---..
Delete prior word
I
..
R
.-.
0
----
9
----.
End of
transmission
........
.-.-.
Código de comprimento variável (símbolos: ., -, pausa entre letras e pausa entre palavras).
Download