Processadores Grupo 3 1020523 – Fátima Ribeiro 1020929 – Hélio Martins 1020496 - Alfredo Rebelo 1020006 – Pedro Andrade Índice Evolução dos Processadores ............................................................................................. 3 Hyper-Threading .............................................................................................................. 6 A arquitectura ‘Multi-Core’ nos processadores AMD ..................................................... 6 Processadores para servidores .......................................................................................... 9 Processadores AMD ..................................................................................................... 9 AMD Opteron™ ....................................................................................................... 9 Breve referência à tecnologia AMD PowerNow!™ ............................................... 11 Processadores Intel ..................................................................................................... 11 O Xeon MP de 64 bits ............................................................................................ 11 Pentium Pro ............................................................................................................ 12 Pentium Xeon ......................................................................................................... 13 Xeon Dual Core ...................................................................................................... 13 2 Evolução dos Processadores Neste capítulo fala-se dos principais processadores que marcaram a história dos mesmos. Os primeiros processadores da história (4004 e 4040) foram desenvolvidos para uma calculadora. O primeiro somente processava números, enquanto que o segundo permitia a inserção e processamento de caracteres através de um chip. Esses processadores tinham as seguintes características: Velocidade relógio: 108 KHz N.º transístores: 2300 Largura do bus: 4 Bits Memória endereçável: 640 Bytes Em Abril de 1972 apareceu 8008. Este era o primeiro microprocessador de 8 bits. Era duas vezes mais poderoso que o 4004 e acumulava funções e registos para texto. Dois anos depois apareceu o 8080, sucessor do 8008 que foi usado no primeiro “Computador pessoal”. Em Março de 1976, a Intel redesenhou o 8080 criando o 8085 com um circuito integrado de mais 4 pinos, funcionamento com uma tensão eléctrica de 5V e foi adicionado internamente um gerador de relógio próprio e controlador do bus interno. Este foi o primeiro processador da Intel a usar 5 Volts no seu funcionamento, simplificando em muito todo o hardware necessário. As principais características do 8085 são: Velocidade relógio: 5 Mhz N.º transístores: 6500 Largura do bus: 8 Bits Memória endereçável: 64 Kbytes Corrente do CPU: 5V Em Junho de 1978 apareceu o 8086 baseado no 8080 e 8085. Foi aqui que surgiu o conceito de pipeline embora ainda um pouco primitivo (as instruções variavam de 1 a 4 bits). Um ano depois apareceu o 8088 que era muito parecido com o anterior. Em Fevereiro de 1982 apareceu o 80286, introduzindo o conceito de memória virtual e multi-tarefa, conseguindo ter vários programas a correr ao mesmo tempo. 3 O 80386DX em Outubro de 1985, foi um salto significativo na evolução dos processadores. Foi o primeiro CPU a 32 bits, com capacidade multi-tarefa. Foi também o primeiro a ter cache L2 externa. Em 1987, 88 e 89 foram lançadas processadores de 25, 25 e 33 MHz respectivamente. As principais características do 80386DX são: Velocidade relógio: 16 Mhz N.º transístores: 275000 Largura do bus: 32 Bits Memória endereçável: 192 Mbytes Em Junho de 1988 apareceu o 80386SX que podemos considerar uma versão de custos mais baixo do 80386SX. Dois anos depois surgiu o 80386SL, o primeiro processador da Intel desenvolvido especialmente para portáteis, tendo baixo consumo de energia. O 80486DX lançado em Abril de 1989 foi o primeiro processador da Intel a ter um co-processador construído parcialmente através de ciências matemáticas, o que dá mais velocidade de processamento ao computador porque inclui acesso a complexas funções matemáticas a partir do processador central. Dois anos depois a Intel lançou o 80486SX que era igual ao anterior, mais barato, inibindo apenas o funcionamento do co-processador. Foram lançados modelos de 25MHz e 33MHz. Depois surgiu o 80486DX2/50 e 80486DX2/66 indicando que a velocidade foi duplicada para 50MHz e 66MHz respectivamente. Em Novembro de 1992 a Intel desenhou o 80486SL com características iguais ao 80486DX mas para portáteis. Com o lançamento do Pentium em Março de 1993, a Intel, quebrou não só a sequência dos processadores de nome X86, como também conseguiu introduzir os seus processadores no mercado dos servidores. Este foi o primeiro x86 super escalar com duplo pipeline, usa técnicas também RISC embora seja ainda um processador de arquitectura CISC. No Pentium, 2 instruções podem ser executadas simultaneamente (em paralelo). Isto faz do Pentium um super escalar de nível 2. No início foram detectadas alguns problemas tais como o aquecimento excessivo, cálculo com número com vírgula flutuante. 66/75/90/100/120/133/150/166 Apareceram e 200MHz modelos com (Pentium MMX). velocidades As de principais características do Pentium são: N.º transístores: 3200000 Largura do bus: 32 Bits Largura do bus ex. 64 Bits 4 Memória endereçável: 4 Gbytes N.º de pinos: 296 Co-processador: Interno Entre 1994 e 1995 foram lançados o AM486DX com versões a velocidades de 70, 100 e 120 MHz e o AM5x86 pela AMD tentando competir com a Intel. Em Novembro de 1995 surgiu o Pentium PRO que conseguia executar até três instruções por ciclo de relógio, tem maior performance nos Sistemas Operativos de 32 bits e que teve muito sucesso a nível de servidores e aplicações workstation. Dois anos depois apareceu o pentium II com nome de código Klamath e usava tecnologia RISC completamente incompatível com CISC, sendo então necessário o tradutor “RISC CISC”. Em Abril de 1998, a Intel com o objectivo de maximizar as suas vendas lançou o Pentium Celerom, que era parecido com o Pentium II mas era de baixo custo e tinha uma cache L2 externa menor ou igual a 128kb. Em Junho de 1998 a Intel lançou Pentium II Xeon desenhado para grandes servidores e estações de trabalho gráfico. O Pentium III com o nome de código Copermine apareceu em 1999 com grande aumento de processamento de elementos multimédia. Em Outubro de 1999 surgiu o Pentium III Xeon promovendo soluções para uma grande variedade de aplicações da Internet e muito bom para correr aplicações pesadas destinadas a servidores com necessidade de grandes performances. No mesmo ano apareceu o Athlon da AMD. A AMD utiliza nomenclatura de velocidade usando PR (Performance Rate) e não seu relógio de funcionamento real. Em Maio de 2001 surgiu o primeiro Pentium 4, usando tecnologia Hyperthreading. O primeiro Pentium 4 tinha a velocidade de 1.3 GHz. Outros Processadores • Cyrix 6x86 Series (1995) • MediaGX (1996) • AMD K6 (1997) • Cyrix 6x86MX (1997) • AMD K6-2 & K6-3 (1998) • Duron (2000 - Current) 5 Hyper-Threading O Hyper Threading foi introduzido pela intel em 2002, para que o multi processamento fosse mais eficaz, mas nem todos os programas utilizam esta tecnologia de um modo eficaz., pois não foram criados para trabalhar com multi-processadores (é o que o Hyper threading tenta fazer). Assim esta tecnologia aumenta o desempenho do processador quando temos vários programas a executar ao mesmo tempo, fazendo com que o tempo de espera de execução seja menor. Esta tecnologia faz com que pareça que existam dois processadores na máquina mas não faz que com que um sistema com um processador com Hyper-Threading seja tão rápido como um sistema com dois processadores reais pois a execução em hyper-threading não executa duas threads em simultâneo mas sim quase, pois utiliza recursos livres deixados pela outra thread que se encontra em execução, fazendo assim com que parece que estamos a executar duas threads ao mesmo tempo. Os Processadores Dual Core da intel fazem realmente com que o processamento seja paralelo, pois neste caso executam duas threads ao mesmo tempo (realmente), não havendo um desfasamento como no caso do hyper-threading, estes processadores com dual core partilham o mesmo controlador de memória tornando-os assim mais lentos quando comparados com os sistemas com dois processadores, embora se aproximem muito dos sistemas com dois processadores. A arquitectura ‘Multi-Core’ nos processadores AMD A tecnologia ‘multi-core’ tem vindo a ser desenvolvida pela AMD desde 1990 encontrando-se neste momento em fase de comercialização. Diz-se ‘multi-core’ porque um único ‘chip’, duma forma muito simplificada, incorpora vários núcleos de processamento. O processador mais básico da gama ‘multi-core’ incorpora apenas dois núcleos, e daí a designação de ‘dual-core’. Os processadores dual core contêm dois núcleos de processamento, e como já foi referido, estes estão residentes num único chip que realizam cálculos em dois fluxos de dados, aumentando assim a eficiência e a velocidade enquanto executam várias aplicações multithread da nova geração. 6 A tecnologia dual-core oferece verdadeira multitarefa, permitindo que os utilizadores alternem entre um programa e outro sem parar para esperar o computador acompanhar, reduzindo as irritantes pausas no processamento. Isto representa um aumento significativo na resposta e no desempenho ao executar várias aplicações simultaneamente. Os processadores AMD dual core superam em até 30% o processador AMD Athlon 64 bits 4000+ single core de mais alta performance em benchmarks multitarefa. Software multimédia exige processamento simultâneo de fluxos de dados, sendo a tecnologia AMD64 dual core ideal para execuções multitarefa. Esta equivale quase como se tivesse-mos dois processadores a trabalhar em paralelo, cada um processando aplicações diferentes. Assim, os utilizadores mais exigentes desfrutam de melhor desempenho quando há várias aplicações em execução. A arquitectura de 64 bits é totalmente compatível com todo software existente, ao mesmo tempo viabilizando uma perfeita transição para as aplicações de 64 bits. Tanto as aplicações de 32 como as de 64 bits podem ser executadas de forma praticamente simultânea e transparente na mesma plataforma. A arquitectura 64 bits proporciona novos recursos e experiências no computador, além de maior performance. A arquitectura 64 bits permite aos utilizadores tirar partido de inovações como criptografia em tempo real, jogos mais realistas, interfaces de voz precisas, efeitos gráficos de qualidade cinematográfica e edição de áudio e vídeo fácil de usar. A tecnologia HyperTransport é também uma tecnologia criada pela AMD elevando a performance geral do sistema com a eliminação de engarrafamentos de fluxo de informação para dispositivos de I/O, o aumentando a largura de banda do sistema e consequente do tempo de espera. Um controlador de memória DDR totalmente integrado ajuda a acelerar o acesso, oferecendo ao processador uma conexão direta com a memória principal. A arquitectura AMD64 possibilitou o planeamento dos processadores dual-core desde o início, o que significa que os processadores dual core foram projectados para a mesma infra-estrutura de 939 pinos que os processadores single-core. Apenas é necessário é uma actualização de BIOS, poupando custos na aquisição de novo hardware. 7 A nível de servidores temos na AMD o AMD Opteron, contemplando as seguintes características: - Todas as já referidas acima e ainda as seguintes: Arquitectura de Conexão Directa Ajuda a reduzir os gargalos das arquitecturas de sistema. A memória liga-se directamente ao CPU, optimizando o seu desempenho O subsistema de I/O liga-se diretamente ao CPU, proporcionando um processamento mais equilibrado Os processadores ligam-se directamente uns aos outros, possibilitando multiprocessamento simétrico mais linear Controlador de memória DRAM DDR integrado Muda a forma como o processador acede à memória principal, resultando numa maior largura de banda, redução do tempo de espera da memória e maior desempenho do processador A largura de banda da memória disponível aumenta na mesma proporção da quantidade de processadores adicionados Controlador de memória DRAM DDR integrado com interface de 128 bits, capaz de suportar até oito (8) DIMMs DDR registados por processador Largura de banda da memória disponível de até 6,4 GB/s (com memória PC3200) por processador Outros recursos do processador AMD Opteron: Caminhos de dados de endereços de 64 bits que incorporam um espaço para endereço virtual de 48 bits e um espaço para endereço físico de 40 bits Protecção de ECC (Error Correcting Code, código de correção de erros) para os dados do cache L1 e dados e tags do cache L2, e DRAM Tecnologia de processo SOI (Silicon on Insulator) de 90nm para obtenção de níveis mais baixos de produção de calor e melhor escalabilidade de frequência Suporte para todas as instruções necessárias para total compatibilidade com a tecnologia SSE2 2 (dois) estágios de pipeline adicionais (em comparação com a arquitectura de sétima geração da AMD) para aumento da performance e escalabilidade da frequência 8 IPC (Instruções por Relógio) mais alto, atingido por meio de importantes recursos adicionais, como TLBs (Translation Look-aside Buffers) maiores, filtros de descarga e algoritmos de previsão de desvio As seguintes características já foram mencionadas anteriormente mas estão aqui mais detalhadas, e também se encontram presentes em toda a gama AMD64. Tecnologia HyperTransport Oferece uma ligação de largura de banda escalável entre processadores, subsistemas de I/O e outros chipsets Suporte para até 3 (três) conexões HyperTransport coerentes, proporcionando uma largura de banda máxima de até 24,0 GB/s por processador Controlador de memória DRAM DDR integrado com interface de 128 bits, capaz de suportar até oito (8) DIMMs DDR registados por processador Largura de banda de até 8,0 GB/s por conexão, suficiente para suportar novas inter conexões, incluindo PCI-X, DDR, InfiniBand e Ethernet 10Gbit Oferece baixo consumo de energia (1,2 volts) para ajudar a reduzir os limites térmicos permitidos Processadores de baixo consumo de energia O processador AMD Opteron HE oferece a melhor performance por Watt do mercado, o que o torna a solução ideal para servidores ou blades de 1U instalados em rack nos ambientes de data center, bem como para projectos de estação de trabalho mais refrigerados e silenciosos. O processador AMD Opteron EE oferece o máximo de largura de banda de I/O disponível actualmente em um controlador de uma única CPU, sendo ideal para controladores embutidos em mercados como NAS e SAN. Processadores para servidores Processadores AMD AMD Opteron™ Os processadores AMD Opteron Dual Core usados em servidores e estações de trabalho utilizam a Arquitectura de Conexão Directa da AMD (Direct Connect), integrando num único chip mais um controlador de memória, permitindo uma conexão 9 directa entre o cpu (neste caso núcleo) e a memória RAM, melhorando a performance e eficiência do sistema. Vantagens O processador AMD Opteron oferece uma arquitectura super escalável que proporciona performance de última geração, bem como um caminho de actualização flexível da computação de 32 bits para a de 64 bits. Com uma única arquitectura projectada para atender às necessidades dos negócios actuais e futuros, o processador AMD Opteron pode ajudar a minimizar as complexidades da integração apresentadas pelos ambientes empresarias de hoje e amanhã. Controlador de memória DDR integrado Aumenta a performance das aplicações reduzindo drasticamente a latência da memória Núcleo AMD64 Possibilita computação simultânea de 32 e 64 bits Elimina o limite dos 4 GB de memória imposto pelos sistemas de 32 bits Tecnologia HyperTransport™ Fornece largura de banda máxima de até 24,0 GB/s por processador, reduzindo os engarrafamentos nos acessos a dispositivos I/O A tecnologia HyperTransport liga as CPUs directamente, proporcionando escalonamento Recurso Benefício A tecnologia AMD64 dual core liga directamente dois núcleos de processador num único chip, proporcionando redução da latência entre os processadores Melhora a eficiência do sistema e a performance para computadores que executam várias aplicações ao mesmo tempo ou para aplicações multithread com uso intensivo de poder de processamento Recursos simultâneos de computação de 32 e 64 bits Permite que os utilizadores executem aplicativos e sistemas operacionais de 32 e/ou 64 bits como desejarem, sem sacrificar o desempenho A Arquitectura de Conexão Directa ajuda a reduzir os desafios e os gargalos das arquitecturas de sistema Fornece desempenho optimizado da memória, processamento balanceado, I/O expansível e multiprocessamento simétrico mais linear Suporte para até 3 (três) conexões HyperTransport coerentes, proporcionando largura de banda máxima de até 19,2 GB/s por processador Oferece substancial largura de banda de I/O para suas necessidades actuais e futuras nas aplicações 10 256 TB de espaço de endereçamento da memória Cria uma significativa vantagem de performance para aplicações nas quais conjuntos de dados muito grandes (ou em grande quantidade) são mantidos na memória Escalonamento de 1 até 8 processadores em data centers inteiros, usando a mesma infraestrutura de hardware e software Possibilita máxima flexibilidade na infra-estrutura de TI O controlador de memória integrado reduz as latências durante o acesso à memória em um sistema servidor com vários processadores Proporciona rápido processamento, aumentando a performance e a produtividade Processadores de baixo consumo HE (55 Watts) e EE (30 Watts) – desempenho sem concessões Maior densidade computacional; TCO mais baixo para data centers com orçamentos restritos Breve referência à tecnologia AMD PowerNow!™ O AMD PowerNow!™ é uma nova tecnologia com Optimized Power Management (OPM)., permitindo uma melhor gestão de energia por parte destes novos processadores. Benefícios Permite alterar a performance em tempo real, ajustando a velocidade do processador assim como o consumo de energia. A optimização do consumo de energia, permite aos servidores e computadores pessoais trabalhar a mais reduzidas temperaturas e consequente menos ruído. Reduz em 75% o consumo de energia (valor obtido num estado idle do CPU). Processadores Intel O Xeon MP de 64 bits O Xeon MP é um processador destinado a servidores multiprocessamento contendo quatro ou mais processadores, baseado na micro arquitectura do Pentium 4. Este novo modelo de Xeon MP tem como nome-código Truland e junto com ele foi lançado um novo chipset, o Intel E8500, apresentando algumas diferenças relativamente ao modelo anterior, o Xeon MP. 11 Outra vantagem no desempenho trazida por este novo modelo e o Xeon MP é a sua escalabilidade. Quando instalamos mais de um processador em uma máquina, o desempenho da máquina não é multiplicado pelo número de processadores presentes, ou seja, uma máquina com dois processadores Xeon não é duas vezes mais rápida do que uma máquina com apenas um. De acordo com a Intel, o desempenho vai aumentar de 1,59x a 1,92x, dependendo do programa usado para medir o desempenho. No caso do uso de quatro processadores, o aumento varia de 2,14x a 3,52x, mais uma vez dependendo do programa usado para medir. No caso do novo Xeon MP de 64 bits, o ganho de desempenho quando instalamos mais de um processador é maior do que o ganho obtido com o Xeon MP da geração anterior, podendo chegar a até 3,96x em um sistema com quatro processadores e 1,99x em um sistema com dois processadores, aproximando-se muito mais da teoria de quadruplicar ou dobrar o desempenho. Pentium Pro O Pentium Pro utiliza o socket 8 e exige uma placa mãe específica. A principal vantagem deste processador sobre o Pentium comum, é que a cache L2 é embutida no processador e utiliza a mesma frequência que este, o que garante um maior desempenho. Mais uma característica marcante do Pentium Pro é sua arquitetura optimizada para executar aplicações exclusivamente 32 bits como o Windows NT. Utilizando o Windows 95, ou sistemas 16 bits como o DOS ou o Windows 3.x, ele apresenta uma performance pouco superior ou até mesmo inferior, em alguns casos, a um Pentium clássico do mesmo relógio, sendo indicado apenas para servidores. Executa 3 instruções contra duas do Pentium comum por ciclo de relógio mas não é compatível com as instruções MMX. Uma desvantagem é que, se houver um defeito na cache L2 leva a que o processador seja deitado fora, visto esta vir embutida no processador. A vantagem deste processador num servidor é que a cache L2 funciona à mesma velocidade do processador, o que faz muita diferença, pois o processamento de dados nessas máquinas é muito repetitivo. Tanto que mesmo com o surgimento do Pentium II, onde a cache L2 apesar de ser de 512 KB funciona apenas a metade da velocidade do 12 processador, muitos ainda preferem continuar usando o Pentium Pro, pois além da cache, ele oferece recursos interessantes para uma máquina servidora como a possibilidade de usar até quatro processadores em paralelo (o Pentium II é limitado a dois processadores), além da maior quantidade de memória suportada, recursos que só foram superados pelo Pentium II Xeon. Pentium Xeon O Xeon usa basicamente a mesma arquitectura do Pentium II, ficando a diferença por conta da cache L2, que no Xeon funciona à mesma velocidade do processador sendo vendido em versões com 512, 1024 e 2048 KB de cache e velocidades de 400 e 450 Mhz. O Xeon foi especialmente concebido para equipar servidores e por isso a cache mais rápida e em maior quantidade faz uma grande diferença, não fazendo porém muito sentido a sua compra para uso doméstico, justamente devido ao seu elevado preço. Outro recurso importante do Xeon é a possibilidade de se usar até 8 processadores numa placa compatível, o que cria um sistema multiprocessamento de alto desempenho a um custo relativamente baixo. Xeon Dual Core O primeiro processador Xeon de dois núcleos (dual-core) para servidores tem 50% a mais de poder de processamento, mas com um custo 40% maior que a versão de um só núcleo. A Intel apresentou os primeiros chips Xeon dual-core para servidores com dois e quatro processadores. O Xeon dual-core 2.8GHz utiliza 2 MB de memória cache, Nível 2, por núcleo e é bastante similar ao Pentium D, voltado a desktops, do ponto de vista da arquitectura. O novo chip para servidores, possui uma função de gestão de energia, que inactiva partes do processador quando não estão em uso, além de vir com a tecnologia hyperthreading, o que permite que cada um dos dois processadores físicos sejam vistos como quatro lógicos. 13 Anexo Características do chipset Intel E8500 Velocidades de relógio de 2,83 GHz a 3,66 GHz. Tecnologia EM64T, permitindo o endereçamento de até 1 TB de memória RAM (barramento de endereços de 40 bits). Por conta das limitações dos módulos de memória encontrados atualmente no mercado, na prática o limite de acesso é de 64 GB de memória DDR2-400. Com o lançamento das memórias FB-DIMM, no entanto, este limite deverá aumentar. Barramento externo de 667 MHz. Memória cache L2 de 1 MB. Memória cache L3 de até 8 MB (a quantidade exacta depende do modelo). Esta memória está localizada no ‘corpo’ do processador, porém não no seu núcleo ("die") mas numa pastilha ao lado, sendo acedida à velocidade de relógio externo do processador (1.066 MHz). Bit xD (Execute Disable), permitindo o bloqueio de execução de vírus DBS (Demand Based Switching), um recurso em cima da tecnologia SpeedStep. Este recurso permite que os processadores da máquina diminuam a sua velocidade de relógio dependendo da carga de uso do processador, economizando energia. Por exemplo, supondo que o servidor é um servidor web e que o tráfego durante a madrugada cai muito, o servidor automaticamente reduz o relógio dos processadores. A economia de energia pode parecer pouca, se se pensar num data center com centenas de servidores, esta economia passa a ser um número considerável. RAS (Reliability, Accessibility and Support): Os processadores Xeon e Xeon MP permitem técnicas de "memory sparing" e espelhamento de memória ("memory mirroring"), técnicas também conhecidas como "RAID de memória". Com a primeira tecnologia, se o processador encontrar um módulo de memória queimado, automaticamente desactiva esse módulo. Esta tecnologia vai ainda mais longe, podendo-se desligar somente um dos chips do módulo caso exista apenas um chip queimado. Já o “espelhamento” permite que o conteúdo de uma bloco de memória seja copiado para outro em tempo real e caso um módulo de memória se queime, o módulo de backup continua activado e não há qualquer perda de dados. O Xeon MP, ao contrário do Xeon "simples", permite que os módulos de memória sejam trocados com o servidor ligado ("hot swap"). No Xeon é necessário desligar o servidor para efetuar esta troca. Protocolo de Encaminhamento de Tarefas (Enhanced Defer Bus Protocol): Permite a um processador encaminhar tarefas para outro processador do sistema, recurso não existente nos processadores Xeon. Tecnologia de Virtualização: Este processador e o novo chipset Intel E8500 suportam a tecnologia de virtualização da Intel, também conhecida como Vanderpool. Esta tecnologia permite dividir (particionar) a máquina em várias máquinas Tecnologia Pellston: Esta tecnologia desactiva partes da memória cache que estejam com muitos erros de ECC, por dois motivos. Primeiro, velocidade. A cada erro de ECC perde-se tempo corrigindo o dado que foi lido com erro. Segundo, se uma parte da memória está com erro de ECC, muito provavelmente isto significa que ela não está muito boa e pode-se queimar a qualquer momento. 14 Tecnologia Foxton: Tecnologia de overclock dinâmico, caso o processador precise durante um pico de processamento. É a primeira vez que vemos um fabricante de processadores fazer oficialmente uso deste tipo de recurso! 15