Sistemas de Informações Fundamentos da Computação 5. Representação de Caracteres Márcio Aurélio Ribeiro Moreira [email protected] http://si.uniminas.br/~marcio/ Representação de Dados O computador usa só 0 e 1, nós utilizamos: Letras do alfabeto e caracteres para os idiomas Algarismos decimais para representar números Como o representar dados no computador? Números: É possível converter números decimais para binários? Caracteres: É possível representar os caracteres como binários? Sim, se criássemos uma tabela convertendo caracteres em números e estes em binários Márcio Moreira 5. Representação de Caracteres – Slide 2 Fundamentos da Computação Tabelas de Caracteres ASCII: American Standard Code for Information Interchange Código padrão americano para intercâmbio de informações EBCDIC: Extended Binary Coded Decimal for Interchange Code Código estendido de decimais codificados em binário para intercâmbio (de informações) Tabela de 256 caracteres utilizada em mainframes IBM Unicode: Universal Character Encoding (codificação universal de caracteres) Está se tornando cada vez mais popular Formado por: UTF-8, UTF-16 e UTF-32 Márcio Moreira 5. Representação de Caracteres – Slide 3 Fundamentos da Computação Tabela ASCII Caracteres de controle Sinais e Acentos Maiúsculas Minúsculas Algarismos Márcio Moreira 5. Representação de Caracteres – Slide 4 Fundamentos da Computação Tabela ASCII Estendida A tabela ASCII padrão não tinha letras acentuadas: A tabela original usava 7 bits 128 caracteres (usada pelo Unix) Estenderam a tabela para 8 bits 256 caracteres (letras acentuadas) As línguas orientais requerem mais de 256 caracteres Márcio Moreira 5. Representação de Caracteres – Slide 5 Fundamentos da Computação Tabelas Unicode Unicode: Os padrões UTF (Unicode Transformation Format, formato de transformação Unicode) são: UTF-8: UTF-16: UTF-32: 1 byte 256 caracteres (mesmos ASCII) 2 bytes 65536 valores (mais usado) 4 bytes 4 milhões de valores Padrões de linguagens: Unicode: ASCII: Márcio Moreira Java e .Net C, C++ e C# 5. Representação de Caracteres – Slide 6 UTF-32 UTF-16 UTF-8 (ASCII) Fundamentos da Computação