Processadores - Ademir Justino

Propaganda
Processadores
Os processadores (ou CPUs, de Central Processing
Unit) são chips responsáveis pela execução de cálculos,
decisões lógicas e instruções que resultam em todas as
tarefas que um computador pode fazer.
Fabricantes dos processadores: Intel e AMD
O Pentium 4 foi lançado no ano 2000, trazendo uma
arquitetura capaz de atingir freqüências de clock
elevadas e no uso de um cache L1 muito rápido e um
barramento de dados capaz de realizar 4 transferências
por ciclo para mantê-lo alimentado com o volume
necessário de dados e instruções.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Pentium
O Pentium 4 acabou se revelando um beco sem saída.
Devido à enorme dissipação térmica dos processadores,
a Intel não foi capaz de lançar versões com clock acima
de 3.8 GHz (a versão de 4.0 GHz, que acabou sendo
cancelada no último momento), e operando a
freqüências baixas o Pentium 4 perdia facilmente para os
processadores AMD.
Só em 2006 a Intel conseguiu dar a volta por cima,
com o lançamento do Core 2 Duo.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Pentium
A Intel batizou a nova arquitetura do Pentium 4 de
NetBurst. A arquitetura NetBurst é composta por 4
pontos principais: Hyper Pipelined Technology, Rapid
Execution Engine, Execution Trace Cache e o uso do
bus quad-pumped.
Hyper Pipelined Technology
O pipeline é um recurso que divide o processador em
vários estágios, que trabalham simultaneamente,
dividindo o trabalho de processar as instruções.
O primeiro processador Intel a utilizar esse recurso foi o
486, que possuía 5 estágios.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Pentium
O Pentium 4 utiliza um total de 20 estágios de pipeline,
daí o nome "Hyper Pipelined".
Execution trace cache
O bloco do cache L1 destinado a instruções foi
substituído por um tipo de cache ultra-rápido que, em
vez de instruções, armazena diretamente uOPs, que são
as instruções já decodificadas, prontas para serem
processadas. Isto garante que o cache tenha apenas um
ciclo de latência, o que faz com que o processador não
perca praticamente tempo algum ao utilizar dados
armazenados no trace cache.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
AMD
AMD chegou a ameaçar usar o nome "Athlon 4", mas
depois mudou de idéia e resolveu apelar para a marca
"Athlon XP".
Lançadas 7 versões do Athlon XP baseado no core
Palomino, todas utilizando bus de 133 MHz: 1500+ (1.33
GHz), 1600+ (1.4 GHz), 1700+ (1.46 GHz), 1800+ (1.53
GHz), 1900+ (1.6 GHz), 2000+ (1.66 GHz) e 2100+ (1.73
Ghz).
A partir do Athlon XP, a AMD passou a utilizar um novo
encapsulamento, composto de resinas plásticas,
gradualmente substituindo o antigo encapsulamento de
cerâmica, usado desde os primeiros chips. Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
Processadores de 32 bits ou 64 bits?
Quando nos referimos a processadores de 16 bits, 32
bits ou 64 bits estamos falando dos bits internos do
chip. Isso representa a quantidade de dados e instruções
que o processador consegue trabalhar por vez.
Por exemplo, com 16 bits um processador pode
manipular um número de valor até 65.535. Se certo
número tem valor 100.000, ele terá que fazer a operação
em duas partes. No entanto, se um chip trabalha a 32
bits, ele pode manipular números de valor até
4.294.967.296 em uma única operação.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
Para calcular esse limite, basta fazer 2 elevado à
quantidade de bits internos do processador.
Exemplo:
2 ^ 32 ou 64
A influência do sistema operacional
Ao se colocar um sistema operacional de 32 bits para
rodar em um computador com processador de 64 bits, o
primeiro não se adaptará automaticamente e continuará
mantendo sua forma de trabalho. Com isso, é necessário
o desenvolvimento de sistemas operacionais capazes de
rodar a 64 bits.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
A Microsoft disponibilizou a versão "Windows XP
Professional x64", compatível com os processadores
AMD Athlon 64, AMD Opteron, Intel Xeon (com
instruções EM64T) e Intel Pentium 4 (com instruções
EM64T).
A principal diferença entre essa e as versões de 32 bits
(além da compatibilidade com instruções de 64 bits) é o
suporte de até 128 GB de memória RAM e 16 TB de
memória virtual.
É possível utilizar um sistema operacional de 32 bits com
um processador de 64 bits e migrar o primeiro para uma
versão adequada futuramente?
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
O processador Intel Itanium é apelidado por alguns de
"puro sangue", já que só executa aplicações de 64 bits.
Assim, uma versão de 32 bits de um sistema operacional
não roda nele.
Por outro lado, processadores Athlon 64 são capazes
de trabalhar tanto com aplicações de 32 bits quanto de
64 bits, o que o torna interessante para quem pretende
usar um SO de 32 bits inicialmente e uma versão de 64
bits no futuro.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
AMD64 e EM64T
O que significa as siglas AMD64 e EM64T:
AMD64: originalmente chamado de x86-64, AMD64 (ou
AMD64 ISA - Instruction Set Architecture) é o nome da
tecnologia de 64 bits desenvolvida pela AMD.
EM64T: sigla para Extended Memory 64-bit Technology,
o EM64T é tido como a interpretação do AMD64 feita
pela Intel. Devido a isso, recebeu de alguns a
denominação iADMD64 (o "i" faz referência à primeira
letra do nome da Intel).
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
A imagem a seguir ilustra a comunicação entre o processador, a
memória e o conjunto de dispositivos de entrada e saída.
Processador
Memória
Dispositivo
de Entrada
e Saída
dados
controle
endereçamento
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
Análise
O barramento de endereços, basicamente, indica de
onde os dados a serem processados devem ser
retirados ou para onde devem ser enviados.
A comunicação por esse barramento é unidirecional.
Como o nome deixa claro, é pelo barramento de dados
que os dados transitam. Por sua vez, o barramento de
controle faz a sincronização das referidas atividades,
habilitando ou desabilitando o fluxo de dados.
Segue exemplo:
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
Imagine que o processador necessita de um dado
presente na memória. Pelo barramento de endereços,
ele obtém a localização desse dado dentro da memória.
Como precisa apenas acessar o dado, o processador
indica pelo barramento de controle que esta é uma
operação de leitura na memória. O dado é então
localizado e inserido no barramento de dados, por onde
o processador, finalmente, o lê.
Clock interno e clock externo
O clock serve justamente para a sincronização de
sinais.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
A medição do clock é feita em hertz (Hz), a unidade
padrão de medidas de freqüência, que indica o número
de oscilações ou ciclos que ocorre dentro de uma
determinada medida de tempo, no caso, segundos.
Assim, se um processador trabalha à 800 Hz, por
exemplo, significa que é capaz de lidar com 800
operações de ciclos de clock por segundo.
Para fins práticos, a palavra kilohertz (KHz) é utilizada
para indicar 1000 Hz, assim como o termo megahertz
(MHz) é usado para indicar 1000 KHz (ou 1 milhão de
hertz). De igual forma, gigahertz (GHz) é a
denominação usada quando se tem 1000 MHz, e assim
Prof.: Ademir Justino
por diante.
Site: www.ademirjustino.com.br
Processadores Atuais
O processadores também contam com o que
chamamos de clock externo ou Front Side Bus (FSB)
ou, ainda, barramento frontal.
O FSB existe porque, devido a limitações físicas, os
processadores não podem se comunicar com a
memória (mais precisamente, como a ponte norte - ou
northbridge - do chipset, que contém o controlador da
memória) usando a mesma velocidade do clock interno.
Assim, quando essa comunicação é feita, o clock
externo, de freqüência mais baixa, é que é usado.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
Para obter o clock interno, o processador usa uma
multiplicação do clock externo.
Análise
Suponha que um determinado processador tenha clock
externo de 100 MHz. Como o seu fabricante indica que
esse chip trabalha à 1,6 GHz (ou seja, tem clock interno
de 1,6 GHz), seu clock externo é multiplicado por 16:
100 x 16 = 1600 MHz ou 1,6 GHz.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
Memória cache
Os processadores passam por aperfeiçoamentos
constantes, o que os tornam cada vez mais rápidos e
eficientes. No entanto, o mesmo não se pode dizer das
tecnologias de memória RAM. Embora estas também
passem por constantes melhorias, não conseguem
acompanhar os processadores em termos de
velocidade. Assim sendo, de nada adianta ter um
processador rápido se este tem o seu desempenho
comprometido por causa da "lentidão" da memória..
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
Uma solução para esse problema seria equipar os
computadores com um tipo de memória muito mais
rápida, a SRAM (Static RAM). Estas se diferenciam das
memórias convencionais DRAM (Dynamic RAM) por
serem muito rápidas, por outro lado, são muito mais
caras e não contam com o mesmo nível de
miniaturização, sendo, portanto, inviáveis. Apesar disso,
a idéia não foi totalmente descartada, pois foi adaptada
para o que conhecemos como memória cache.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
A memória cache consiste em uma pequena quantidade
de memória SRAM embutida no processador. Quando
este precisa ler dados na memória RAM, um circuito
especial chamado "controlador de cache" transfere
blocos de dados muito utilizados da RAM para a
memória cache.
Assim, no próximo acesso do processador, este
consultará a memória cache, que é bem mais
rápida, permitindo o processamento de dados de
maneira mais eficiente.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Processadores Atuais
Cache L1 (Level 1 - Nível 1) e cache L2 (Level 2 - Nível
2). Este último é ligeiramente maior em termos de
capacidade e passou a ser utilizado quando o cache L1
se mostrou insuficiente.
Antigamente, um tipo distinguia do outro pelo fato da
memória cache L1 estar localizada no núcleo do
processador, enquanto que a cache L2 ficava localizada
na placa-mãe. Atualmente, ambos os tipos ficam
localizados dentro do chip do processador, sendo que,
em muitos casos, a cache L1 é dividida em duas partes:
"L1 para dados" e "L1 para instruções".
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Layout
CPU
L1 Cache 32 KB
150Mhz
Cache L2
512KB
Fig. 01
Fig. 02
Na figura 01 apresenta a Cache L2 separada
do processador. Já a figura 02 apresenta as
duas cache trabalhando no mesmo núcleo.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Dual core e Multi-core
Processadores desse tipo contam com dois ou mais
núcleos distintos no mesmo circuito integrado, como se
houvesse dois processadores dentro de um.
Em um chip de único núcleo, o usuário pode ter a
impressão de que vários processos são executados
simultaneamente, já que a máquina está quase sempre
executando mais de uma aplicação ao mesmo tempo.
É importante ressaltar que ter processadores com dois
ou mais núcleos não implica, necessariamente, em
computadores que são proporcionalmente mais rápidos.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Dual core e Multi-core
Uma série de fatores influenciam nesse quesito, como as velocidades
limitadas das memórias e dos dispositivos de entrada e saída, e as
formas como os programas são desenvolvidos.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Core 2 Quad da série Q9000
Os 4 núcleos são compostos por nada menos que 731 milhões de
transistores, que, mesmo com a técnica de produção de 45
nanômetros, ocupam uma área de 263 mm². Para ter uma ideia, isso
corresponde a mais de 10 vezes o tamanho de um Atom 230, que
possui apenas 25.9 mm².
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Para acomodar os 4 núcleos, a Intel fez várias mudanças na
arquitetura dos caches. Em vez de um grande cache L2 compartilhado,
optaram por utilizar uma arquitetura similar à utilizada pela AMD no
Phenom, com um pequeno cache L2 (de 256 KB) para cada núcleo e
generosos 8 MB de cache L3. Dentro da arquitetura, o cache L3
assume a posição que no Core 2 Duo era executada pelo cache L2,
servindo como um reservatório comum de dados.
Outra mudança dramática é a inclusão de um controlador de
memória integrado, assim como temos nos processadores AMD. O
controlador de memória integrado reduz substancialmente o tempo de
latência da memória, resultando em um ganho de desempenho
considerável. Um dos grandes motivos o Athlon X2 ter se mantido
competitivo em relação ao Core 2 Duo.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Em vez de utilizar um controlador single-channel, ou dual-channel, a
Intel optou por utilizar um controlador triple-channel na versão inicial
do Core i7, com memórias DDR3. Isso significa uma banda total de até
32 GB/s. Para ter uma ideia, isso é 40 vezes mais do que tínhamos há
10 anos, quando utilizávamos módulos de memória SDR PC-100 em
conjunto com o Pentium III.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Os três canais operam de forma independente, de forma que o
processador pode iniciar uma nova leitura em um dos módulos
enquanto ainda espera os dados referentes a uma leitura anterior,
realizada em outro módulo. Isso contribui para reduzir o tempo de
latência do acesso à memória, que é, proporcionalmente, muito mais
alto nos módulos DDR3.
Naturalmente, para tirar o melhor benefício do triple-channel, é
necessário usar os módulos em trios. Ao usar um único módulo,
apenas um dos canais será ativado e, ao usar quatro, o último módulo
compartilhará o mesmo canal com o primeiro.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
O Core i7 introduziu o soquete LGA-1366, com quase o dobro de
contatos que o LGA-775 do Core 2 Duo. Até mesmo o formato do
processador mudou, passando a ser retangular, assim como no antigo
Pentium Pro:
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Desde o lançamento dos primeiros
processadores tanto a Intel ou quanto a
AMD tem criado uma série de soquetes e
slots para seus processadores.
Desde do início, um soquete de
processador era compatível apenas com
um tipo de processador.
Veja na tabela a listas dos sockets
atuais...
Socket 4
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Socket F
Socket 940
Amd Opteron
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Socket F
http://www.hardware.com.br/tutoriais/athlon64-x2-sempron/pagina12.html
Material para identificação do processador
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Dissipação dos Processadores
Os primeiros processadores dissipavam muito pouco calor, por isso o
próprio encapsulamento cerâmico era suficiente para dissipar o calor e
manter o chip em uma temperatura aceitável.
As primeiras CPUs x86 a utilizarem dissipadores foram os 486 DX-33,
que atingiram a marca dos 4.5 watts. Os coolers da época nada mais
eram do que uma base de alumínio com menos de 1 cm de altura com
uma ventoinha de baixa rotação, bem diferentes dos atuais.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Dissipação dos Processadores
Hoje em dia, não é difícil ultrapassar a marca dos 200 watts ao fazer
overclock em um Core 2 Quad ou em um Core i7.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Dissipação dos Processadores
Tanto a base quanto os heat-pipes são
prateados devido à aplicação de uma
cobertura de níquel, que além da função
estética, serve para prevenir a oxidação do
cobre. Este pesa 1045 gramas e o formato de
torre permite o uso de dois dissipadores de
120 mm, onde o primeiro empurra o ar em
direção ao dissipador e o segundo o puxa,
criando uma espécie de túnel de vento.
Todos os coolers eram feitos de alumínio, mas
com o lançamento do Pentium III e do Athlon
(que ultrapassavam a marca dos 50 watts em
overclock) muitos fabricantes passaram a
produzir coolers de cobre.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Dissipação dos Processadores
Encontramos também o uso de kits de fixação,
que permitem que o mesmo modelo seja
compatível simultaneamente com diversos
soquetes, incluindo placas AM2/AM3, LGA775
e até mesmo LGA1366.
Os kits consistem em
braçadeiras removíveis, que
são presas à base do cooler e
podem ser substituídas
conforme necessário:
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Dissipação dos Processadores
Mais uma tendência crescente é o uso de
heat-pipes para interligar dissipadores sobre
diferentes componentes da placa-mãe,
permitindo que eles sejam resfriados de forma
conjunta.
Nesta foto o heat-pipe é utilizado
para ligar o dissipador da ponte
norte do chipset e o dissipador
instalado sobre os reguladores de
tensão da placa. Dessa forma, o
fluxo de ar gerado pelo cooler do
processador acaba resfriando de
forma conjunta os dois
componentes.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Dissipação dos Processadores
Finalmente, temos os water-coolers, que utilizam água ou outro
líquido refrigerante. O líquido é bombeado dentro do sistema,
passando pelo water block (o módulo que fica sobre o processador) e
em seguida pelo radiador, onde é resfriado.
Prof.: Ademir Justino
Site: www.ademirjustino.com.br
Referências:
Livro: Hardware (Gabriel Torres)
Sites: www.infowester.com.br
Www.hardware.com.br
Download