Evolução das CPUs: Dual e Quad Core

Propaganda
Evolução das CPUs:
Dual e Quad Core
Cesar Sposito
Mário J. Filho
Rodrigo Ferrassa
... os computadores sequenciais estão se
aproximando do limite físico fundamental em
sua energia potencial computacional. Tal
limite é a velocidade da luz...
Angel L. DeCegama
EACH
EACH
Introdução – Limite: Pentium IV

Desafio: Aumento frequência de clock.

Corrida por clock (Intel X AMD).

Athlon Thunderbird X Pentium III.

Intel: Movimento arriscado.


Investimento em um processador com um
longo pipeline.
Pentium IV.
EACH
Pentium IV: longo pipeline

Pipeline é uma técnica de hardware que
permite que a CPU realize a busca de uma
ou mais instruções além da próxima a ser
executada.

Pentium III: 10 estágios.

Pentium IV: 20 estágios a 31 estágios.

Dobrar o número de estágios no
processador é como dobrar o número de
funcionários de uma empresa.
EACH
Longo pipeline: Consequencias



Com mais estágios, o processador seria
capaz de atingir freqüências mais altas.
Adicionar
mais
estágios
tornou
o
processador menos eficiente, pois as
instruções precisavam do dobro do número
de ciclos do processador para serem
processadas.
Possuir o dobro de estágios significa
também possuir aproximadamente o dobro
de transistores e consumir o dobro da
eletricidade.
EACH
Mais consumo – Maior aquecimento




Maior consumo gera maiores desperdícios.
Maior desperdicio gera maiores
aquecimentos.
A dissipação térmica (W/cm^2) de um
Pentium 4, é próximo do núcleo de um
reator nuclear.
Se
a
produção
de
processadores
continuasse da mesma forma, num futuro
não
muito
distante,
teríamos
um
processador
com
dissipação
térmica
próxima a da superfície solar.
EACH
Aquecimento
Fonte: http://blogs.intel.com
EACH
A barreira dos 3.4 GHZ





Desde 1983 até 2002, as taxas de
frequência de clock aumentaram de 5 MHz
para 3 GHz.
Aumento do clock 600 X em 19 anos.
Na época, a Intel previa alcançar 5.2 GHz no
final de 2004 e planos para 10 GHz no final
de 2005.
Porém, nada disso aconteceu. Os 3.4 GHz
se tornaram uma barreira difícil de transpor.
Fim da Lei de Moore?
Hyper Treading: Inicio do
processamento paralelo



Hyper Treading: simula em um único
processador físico dois processadores
lógicos.
Pode melhorar desempenho de até 30%
Utiliza as partes ociosas dos recursos para
simular dois núcleos.
EACH
EACH
Evolução


Elevando, por exemplo, em 20% a
freqüência do processador, aumentamos
apenas em 13% o seu desempenho e como
efeito colateral, também passa a consumir
73% mais energia.
Recíproca verdadeira.
EACH
Estratégia


Reduzindo a freqüência em 20%, perdemos
apenas 13% de desempenho e reduzimos
em 49% o consumo de energia.
Se reduzíssemos em 20% o clock e
colocássemos dentro da mesma pastilha
dois processadores?
EACH
Estratégia: Multiplos Núcleos


Teríamos um processador de dois núcleos
com 73% mais desempenho e consumindo
praticamente a mesma coisa (~2% mais
energia).
Processadores
multicore
podem
simultaneamente executar múltiplas tarefas
computacionais.
EACH
Single-Core X Dual-Core
Fonte: http://blogs.intel.com
EACH
Nova Arquitetura

“Caminhou bastante, porém para o lado e
não para a frente” (National Instruments).
NetBurst
Core
Pentium D
Quad Core
Core 2 Duo
Pentium IV
Pentium III
EACH
Arquitetura Core




Somando-se a estratégia de lançar
processadores de múltiplos núcleos, a nova
arquitetura interna do processador também
foi importante.
Maior eficiência de execução de instruções
por ciclo de CPU.
Maior desempenho e menor consumo.
A arquitetura Core consegue desempenho
superior aos da microarquitetura Netburst
(anterior) com o clock muito inferior.
EACH
Arquitetura Core

Derivada do Pentium III – Pentium M.

Pipeline de 14 estágios.

Cache de memória L2 é compartilhado.


Pré-buscas são compartilhadas, se o
controlador de cache carregar um bloco de
dados para ser usado pelo primeiro núcleo,
o segundo núcleo também pode usar o dado
já carregado.
Aprimoramento da unidade de pré-busca do
processador (“Melhor Chute”).
EACH
Arquitetura Core


Quanto menor o número de instruções a
serem
executadas,
mais
rápido
o
computador realizará a execução da tarefa
além de consumir menos.
O decodificador de instruções do Pentium IV
pode decodificar três instruções por pulso de
clock, já o do Core 2 Duo (Arquitetura Core)
4.
EACH
Arquitetura Core

Novo conceito: Fusão de instruções
load eax, [mem1]
cmp eax, [mem2]
jne target
load eax, [mem1]
cmp eax, [mem2] + jne target

Graças ao conceito de fusão de instruções o
decodificador de instruções da arquitetura
Core consegue fundir 2 instruçoes enviar 5
por pulso de clock.
EACH
Arquitetura Core


E mais!
Unidade de ponto flutuante (FPU) e uma
unidade lógica e aritmética (ALU) extras.

Caminho de dados real de 128 bits.

Desambiguação de memória.

Chaveamento Elétrico Avançado.

Etc.
EACH
Quad Core
EACH
Quad Core
- É uma das versões de processadores da
Intel mais recente apresentada com
núcleos Kentsfield(65nm) e
Yorkfield(45nm).
- O clock pode alcançar até 3.33Ghz. Em
overclocking, com cooler de ar, até
4.0Ghz, e na água até 5Ghz.
- Exemplos: Core 2 Quad, Core 2
Extreme: quad-core, Quad-Core Xeon.
EACH
Quad Core
- Multi-Chip: Duas pastilhas de silício (1 núcleo em cada)
encapsuladas junto: Comunicação externa .
- Monolítica: Uma pastilha de silício integra 2 núcleos
encapsulados: Comunicação interna.
- Monolítica Multi-Chip: Duas pastilhas de silício (2 núcleos
em cada) encapsuladas: Comunicação interna e externa.
EACH
Quad Core
EACH
Quad Core – Jogos
EACH
Quad Core – Jogos
EACH
Quad Core - Exemplos
EACH
Aquecimento: Netburst X Core
Pentium D
Pentium Extreme Edition
EACH
Aquecimento: Netburst X Core
Core 2 Duo
Core 2 Extreme
Core 2 Quad
EACH
Arquitetura Core – Processadores
Dual/Quad/Six Core Xeon
EACH
Arquitetura Core – Núcleos
EACH
AMD: Athlon 64 X2
• Primeiro processador com dois núcleos da AMD.
• Deriva do Athlon 64.
EACH
AMD: Athlon 64 X2
EACH
AMD: Athlon 64 X2
EACH
AMD: Phenom X3/X4
• Três ou Quatro núcleos independentes.
• Os núcleos se comunicam internamente
dentro da pastilha.
• Controlador de memória integrado.
• Tecnologia HT.
EACH
AMD: Phenom X3/X4
EACH
Considerações Finais



Por 10 anos os aumentos de desempenho
vieram à custa do uso cada vez mais
ineficiente do uso de energia.
A partir de 2001, a taxa de crescimento de
desempenho pareceu ter reduzido. Se essa
diminuição será ou não temporária ainda é
uma questão obscura.
Arquitetos estão usando técnicas cada vez
mais complexas para tentar explorar mais
paralelismo a nível de instrução.
J L Hennessy e D A Patterson
EACH
Considerações Finais


Com essa estratégia em mente, os
fabricantes de processadores tem o desafio
de continuar entregando a melhor relação
desempenho/Watts.
A Intel propõem melhorar sempre, em um
ano a microarquitetura, no ano seguinte a
miniaturização, e assim por diante.
EACH
Considerações Finais
Fonte: http://blogs.intel.com
EACH
Considerações Finais


2007
a
Intel
lança
os
primeiros
processadores para servidores fabricados
com a tecnologia de 45nm.
2008 foi o ano do Nehalem, que foi o nome
código da nova microarquitetura, que
permitirá um outro passo importante, para
manter viva a Lei de Moore.
EACH
Considerações Finais
Processadores Futuros (Roadmaps)
Arquitetura Processador
Nehalem
Westmere
Sandy Bridge
Haswell
Core i7
-
Clock
Núcleos
Processo
Intel
2,6 - 3,2 Ghz 4 por padrão
45nm
6 por padrão
32nm
4–8
32nm
8 por padrão
22nm
Cache
1 a 8mb
1 a 12mb
8 a 24mb
-
TDP
Previsão
130W – 150W Novembro-08
2009/2010
2010/2011
2012
AMD
Barcelona
Opteron
Shanguai
Opteron/Phenom
Istambu
Phenom
Magny-Cours
São Paulo
-
-
4
4
6
12
6
65nm
45nm
45nm
45nm
45nm
2mb
6mb
6mb
12mb
6mb
-
2008
2008/2009
2009
2010
2010
EACH
Bibliografia



J L Hennessy e D A Patterson
HENSON Valerie Bookshelf: Ultimate
Computation
The Kernel Hacker's
Physical Limits of
INTEL - http://www.intel.com/portugues/
products/ processor/index.htm

BLOGS INTEL - http://blogs.intel.com

FAPESP - http://www.agencia.fapesp.br

NATIONAL INSTRUMENTS http://digital.ni.com/worldwide/brazil
EACH
Bibliografia

CLUBE DO HARDWARE http://www.clubedohardware.com.br/

PC FÓRUM - http://www.pcforum.com.br/

FÓRUM PC - http://forumpcs.ig.com.br/home

Vasconcelos, Laércio – Introdução aos
processadores dual core e quad core
Download