Evolução das CPUs: Dual e Quad Core Cesar Sposito Mário J. Filho Rodrigo Ferrassa ... os computadores sequenciais estão se aproximando do limite físico fundamental em sua energia potencial computacional. Tal limite é a velocidade da luz... Angel L. DeCegama EACH EACH Introdução – Limite: Pentium IV Desafio: Aumento frequência de clock. Corrida por clock (Intel X AMD). Athlon Thunderbird X Pentium III. Intel: Movimento arriscado. Investimento em um processador com um longo pipeline. Pentium IV. EACH Pentium IV: longo pipeline Pipeline é uma técnica de hardware que permite que a CPU realize a busca de uma ou mais instruções além da próxima a ser executada. Pentium III: 10 estágios. Pentium IV: 20 estágios a 31 estágios. Dobrar o número de estágios no processador é como dobrar o número de funcionários de uma empresa. EACH Longo pipeline: Consequencias Com mais estágios, o processador seria capaz de atingir freqüências mais altas. Adicionar mais estágios tornou o processador menos eficiente, pois as instruções precisavam do dobro do número de ciclos do processador para serem processadas. Possuir o dobro de estágios significa também possuir aproximadamente o dobro de transistores e consumir o dobro da eletricidade. EACH Mais consumo – Maior aquecimento Maior consumo gera maiores desperdícios. Maior desperdicio gera maiores aquecimentos. A dissipação térmica (W/cm^2) de um Pentium 4, é próximo do núcleo de um reator nuclear. Se a produção de processadores continuasse da mesma forma, num futuro não muito distante, teríamos um processador com dissipação térmica próxima a da superfície solar. EACH Aquecimento Fonte: http://blogs.intel.com EACH A barreira dos 3.4 GHZ Desde 1983 até 2002, as taxas de frequência de clock aumentaram de 5 MHz para 3 GHz. Aumento do clock 600 X em 19 anos. Na época, a Intel previa alcançar 5.2 GHz no final de 2004 e planos para 10 GHz no final de 2005. Porém, nada disso aconteceu. Os 3.4 GHz se tornaram uma barreira difícil de transpor. Fim da Lei de Moore? Hyper Treading: Inicio do processamento paralelo Hyper Treading: simula em um único processador físico dois processadores lógicos. Pode melhorar desempenho de até 30% Utiliza as partes ociosas dos recursos para simular dois núcleos. EACH EACH Evolução Elevando, por exemplo, em 20% a freqüência do processador, aumentamos apenas em 13% o seu desempenho e como efeito colateral, também passa a consumir 73% mais energia. Recíproca verdadeira. EACH Estratégia Reduzindo a freqüência em 20%, perdemos apenas 13% de desempenho e reduzimos em 49% o consumo de energia. Se reduzíssemos em 20% o clock e colocássemos dentro da mesma pastilha dois processadores? EACH Estratégia: Multiplos Núcleos Teríamos um processador de dois núcleos com 73% mais desempenho e consumindo praticamente a mesma coisa (~2% mais energia). Processadores multicore podem simultaneamente executar múltiplas tarefas computacionais. EACH Single-Core X Dual-Core Fonte: http://blogs.intel.com EACH Nova Arquitetura “Caminhou bastante, porém para o lado e não para a frente” (National Instruments). NetBurst Core Pentium D Quad Core Core 2 Duo Pentium IV Pentium III EACH Arquitetura Core Somando-se a estratégia de lançar processadores de múltiplos núcleos, a nova arquitetura interna do processador também foi importante. Maior eficiência de execução de instruções por ciclo de CPU. Maior desempenho e menor consumo. A arquitetura Core consegue desempenho superior aos da microarquitetura Netburst (anterior) com o clock muito inferior. EACH Arquitetura Core Derivada do Pentium III – Pentium M. Pipeline de 14 estágios. Cache de memória L2 é compartilhado. Pré-buscas são compartilhadas, se o controlador de cache carregar um bloco de dados para ser usado pelo primeiro núcleo, o segundo núcleo também pode usar o dado já carregado. Aprimoramento da unidade de pré-busca do processador (“Melhor Chute”). EACH Arquitetura Core Quanto menor o número de instruções a serem executadas, mais rápido o computador realizará a execução da tarefa além de consumir menos. O decodificador de instruções do Pentium IV pode decodificar três instruções por pulso de clock, já o do Core 2 Duo (Arquitetura Core) 4. EACH Arquitetura Core Novo conceito: Fusão de instruções load eax, [mem1] cmp eax, [mem2] jne target load eax, [mem1] cmp eax, [mem2] + jne target Graças ao conceito de fusão de instruções o decodificador de instruções da arquitetura Core consegue fundir 2 instruçoes enviar 5 por pulso de clock. EACH Arquitetura Core E mais! Unidade de ponto flutuante (FPU) e uma unidade lógica e aritmética (ALU) extras. Caminho de dados real de 128 bits. Desambiguação de memória. Chaveamento Elétrico Avançado. Etc. EACH Quad Core EACH Quad Core - É uma das versões de processadores da Intel mais recente apresentada com núcleos Kentsfield(65nm) e Yorkfield(45nm). - O clock pode alcançar até 3.33Ghz. Em overclocking, com cooler de ar, até 4.0Ghz, e na água até 5Ghz. - Exemplos: Core 2 Quad, Core 2 Extreme: quad-core, Quad-Core Xeon. EACH Quad Core - Multi-Chip: Duas pastilhas de silício (1 núcleo em cada) encapsuladas junto: Comunicação externa . - Monolítica: Uma pastilha de silício integra 2 núcleos encapsulados: Comunicação interna. - Monolítica Multi-Chip: Duas pastilhas de silício (2 núcleos em cada) encapsuladas: Comunicação interna e externa. EACH Quad Core EACH Quad Core – Jogos EACH Quad Core – Jogos EACH Quad Core - Exemplos EACH Aquecimento: Netburst X Core Pentium D Pentium Extreme Edition EACH Aquecimento: Netburst X Core Core 2 Duo Core 2 Extreme Core 2 Quad EACH Arquitetura Core – Processadores Dual/Quad/Six Core Xeon EACH Arquitetura Core – Núcleos EACH AMD: Athlon 64 X2 • Primeiro processador com dois núcleos da AMD. • Deriva do Athlon 64. EACH AMD: Athlon 64 X2 EACH AMD: Athlon 64 X2 EACH AMD: Phenom X3/X4 • Três ou Quatro núcleos independentes. • Os núcleos se comunicam internamente dentro da pastilha. • Controlador de memória integrado. • Tecnologia HT. EACH AMD: Phenom X3/X4 EACH Considerações Finais Por 10 anos os aumentos de desempenho vieram à custa do uso cada vez mais ineficiente do uso de energia. A partir de 2001, a taxa de crescimento de desempenho pareceu ter reduzido. Se essa diminuição será ou não temporária ainda é uma questão obscura. Arquitetos estão usando técnicas cada vez mais complexas para tentar explorar mais paralelismo a nível de instrução. J L Hennessy e D A Patterson EACH Considerações Finais Com essa estratégia em mente, os fabricantes de processadores tem o desafio de continuar entregando a melhor relação desempenho/Watts. A Intel propõem melhorar sempre, em um ano a microarquitetura, no ano seguinte a miniaturização, e assim por diante. EACH Considerações Finais Fonte: http://blogs.intel.com EACH Considerações Finais 2007 a Intel lança os primeiros processadores para servidores fabricados com a tecnologia de 45nm. 2008 foi o ano do Nehalem, que foi o nome código da nova microarquitetura, que permitirá um outro passo importante, para manter viva a Lei de Moore. EACH Considerações Finais Processadores Futuros (Roadmaps) Arquitetura Processador Nehalem Westmere Sandy Bridge Haswell Core i7 - Clock Núcleos Processo Intel 2,6 - 3,2 Ghz 4 por padrão 45nm 6 por padrão 32nm 4–8 32nm 8 por padrão 22nm Cache 1 a 8mb 1 a 12mb 8 a 24mb - TDP Previsão 130W – 150W Novembro-08 2009/2010 2010/2011 2012 AMD Barcelona Opteron Shanguai Opteron/Phenom Istambu Phenom Magny-Cours São Paulo - - 4 4 6 12 6 65nm 45nm 45nm 45nm 45nm 2mb 6mb 6mb 12mb 6mb - 2008 2008/2009 2009 2010 2010 EACH Bibliografia J L Hennessy e D A Patterson HENSON Valerie Bookshelf: Ultimate Computation The Kernel Hacker's Physical Limits of INTEL - http://www.intel.com/portugues/ products/ processor/index.htm BLOGS INTEL - http://blogs.intel.com FAPESP - http://www.agencia.fapesp.br NATIONAL INSTRUMENTS http://digital.ni.com/worldwide/brazil EACH Bibliografia CLUBE DO HARDWARE http://www.clubedohardware.com.br/ PC FÓRUM - http://www.pcforum.com.br/ FÓRUM PC - http://forumpcs.ig.com.br/home Vasconcelos, Laércio – Introdução aos processadores dual core e quad core