5. Representação de Caracteres

Propaganda
Sistemas de Informações
Fundamentos da Computação
5. Representação de Caracteres
Márcio Aurélio Ribeiro Moreira
[email protected]
http://si.uniminas.br/~marcio/
Representação de Dados
O computador usa só 0 e 1, nós utilizamos:
Letras do alfabeto e caracteres para os idiomas
Algarismos decimais para representar números
Como o representar dados no computador?
Números:
É possível converter números decimais para binários?
Caracteres:
É possível representar os caracteres como binários?
Sim, se criássemos uma tabela convertendo caracteres
em números e estes em binários
Márcio Moreira
5. Representação de Caracteres – Slide 2
Fundamentos da Computação
Tabelas de Caracteres
 ASCII:
 American Standard Code for Information Interchange
 Código padrão americano para intercâmbio de informações
 EBCDIC:
 Extended Binary Coded Decimal for Interchange Code
 Código estendido de decimais codificados em binário para
intercâmbio (de informações)
 Tabela de 256 caracteres utilizada em mainframes IBM
 Unicode:
 Universal Character Encoding (codificação universal de caracteres)
 Está se tornando cada vez mais popular
 Formado por: UTF-8, UTF-16 e UTF-32
Márcio Moreira
5. Representação de Caracteres – Slide 3
Fundamentos da Computação
Tabela ASCII
Caracteres de controle
Sinais e Acentos
Maiúsculas
Minúsculas
Algarismos
Márcio Moreira
5. Representação de Caracteres – Slide 4
Fundamentos da Computação
Tabela ASCII Estendida
 A tabela ASCII padrão não tinha letras acentuadas:
 A tabela original usava 7 bits  128 caracteres (usada pelo Unix)
 Estenderam a tabela para 8 bits  256 caracteres (letras acentuadas)
 As línguas orientais requerem mais de 256 caracteres
Márcio Moreira
5. Representação de Caracteres – Slide 5
Fundamentos da Computação
Tabelas Unicode
Unicode:
Os padrões UTF (Unicode Transformation Format,
formato de transformação Unicode) são:
UTF-8:
UTF-16:
UTF-32:
1 byte  256 caracteres (mesmos ASCII)
2 bytes  65536 valores (mais usado)
4 bytes  4 milhões de valores
Padrões de linguagens:
Unicode:
ASCII:
Márcio Moreira
Java e .Net
C, C++ e C#
5. Representação de Caracteres – Slide 6
UTF-32
UTF-16
UTF-8
(ASCII)
Fundamentos da Computação
Download