Processadores Os processadores (ou CPUs, de Central Processing Unit) são chips responsáveis pela execução de cálculos, decisões lógicas e instruções que resultam em todas as tarefas que um computador pode fazer. Fabricantes dos processadores: Intel e AMD O Pentium 4 foi lançado no ano 2000, trazendo uma arquitetura capaz de atingir freqüências de clock elevadas e no uso de um cache L1 muito rápido e um barramento de dados capaz de realizar 4 transferências por ciclo para mantê-lo alimentado com o volume necessário de dados e instruções. Prof.: Ademir Justino Site: www.ademirjustino.com.br Pentium O Pentium 4 acabou se revelando um beco sem saída. Devido à enorme dissipação térmica dos processadores, a Intel não foi capaz de lançar versões com clock acima de 3.8 GHz (a versão de 4.0 GHz, que acabou sendo cancelada no último momento), e operando a freqüências baixas o Pentium 4 perdia facilmente para os processadores AMD. Só em 2006 a Intel conseguiu dar a volta por cima, com o lançamento do Core 2 Duo. Prof.: Ademir Justino Site: www.ademirjustino.com.br Pentium A Intel batizou a nova arquitetura do Pentium 4 de NetBurst. A arquitetura NetBurst é composta por 4 pontos principais: Hyper Pipelined Technology, Rapid Execution Engine, Execution Trace Cache e o uso do bus quad-pumped. Hyper Pipelined Technology O pipeline é um recurso que divide o processador em vários estágios, que trabalham simultaneamente, dividindo o trabalho de processar as instruções. O primeiro processador Intel a utilizar esse recurso foi o 486, que possuía 5 estágios. Prof.: Ademir Justino Site: www.ademirjustino.com.br Pentium O Pentium 4 utiliza um total de 20 estágios de pipeline, daí o nome "Hyper Pipelined". Execution trace cache O bloco do cache L1 destinado a instruções foi substituído por um tipo de cache ultra-rápido que, em vez de instruções, armazena diretamente uOPs, que são as instruções já decodificadas, prontas para serem processadas. Isto garante que o cache tenha apenas um ciclo de latência, o que faz com que o processador não perca praticamente tempo algum ao utilizar dados armazenados no trace cache. Prof.: Ademir Justino Site: www.ademirjustino.com.br AMD AMD chegou a ameaçar usar o nome "Athlon 4", mas depois mudou de idéia e resolveu apelar para a marca "Athlon XP". Lançadas 7 versões do Athlon XP baseado no core Palomino, todas utilizando bus de 133 MHz: 1500+ (1.33 GHz), 1600+ (1.4 GHz), 1700+ (1.46 GHz), 1800+ (1.53 GHz), 1900+ (1.6 GHz), 2000+ (1.66 GHz) e 2100+ (1.73 Ghz). A partir do Athlon XP, a AMD passou a utilizar um novo encapsulamento, composto de resinas plásticas, gradualmente substituindo o antigo encapsulamento de cerâmica, usado desde os primeiros chips. Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais Processadores de 32 bits ou 64 bits? Quando nos referimos a processadores de 16 bits, 32 bits ou 64 bits estamos falando dos bits internos do chip. Isso representa a quantidade de dados e instruções que o processador consegue trabalhar por vez. Por exemplo, com 16 bits um processador pode manipular um número de valor até 65.535. Se certo número tem valor 100.000, ele terá que fazer a operação em duas partes. No entanto, se um chip trabalha a 32 bits, ele pode manipular números de valor até 4.294.967.296 em uma única operação. Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais Para calcular esse limite, basta fazer 2 elevado à quantidade de bits internos do processador. Exemplo: 2 ^ 32 ou 64 A influência do sistema operacional Ao se colocar um sistema operacional de 32 bits para rodar em um computador com processador de 64 bits, o primeiro não se adaptará automaticamente e continuará mantendo sua forma de trabalho. Com isso, é necessário o desenvolvimento de sistemas operacionais capazes de rodar a 64 bits. Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais A Microsoft disponibilizou a versão "Windows XP Professional x64", compatível com os processadores AMD Athlon 64, AMD Opteron, Intel Xeon (com instruções EM64T) e Intel Pentium 4 (com instruções EM64T). A principal diferença entre essa e as versões de 32 bits (além da compatibilidade com instruções de 64 bits) é o suporte de até 128 GB de memória RAM e 16 TB de memória virtual. É possível utilizar um sistema operacional de 32 bits com um processador de 64 bits e migrar o primeiro para uma versão adequada futuramente? Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais O processador Intel Itanium é apelidado por alguns de "puro sangue", já que só executa aplicações de 64 bits. Assim, uma versão de 32 bits de um sistema operacional não roda nele. Por outro lado, processadores Athlon 64 são capazes de trabalhar tanto com aplicações de 32 bits quanto de 64 bits, o que o torna interessante para quem pretende usar um SO de 32 bits inicialmente e uma versão de 64 bits no futuro. Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais AMD64 e EM64T O que significa as siglas AMD64 e EM64T: AMD64: originalmente chamado de x86-64, AMD64 (ou AMD64 ISA - Instruction Set Architecture) é o nome da tecnologia de 64 bits desenvolvida pela AMD. EM64T: sigla para Extended Memory 64-bit Technology, o EM64T é tido como a interpretação do AMD64 feita pela Intel. Devido a isso, recebeu de alguns a denominação iADMD64 (o "i" faz referência à primeira letra do nome da Intel). Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais A imagem a seguir ilustra a comunicação entre o processador, a memória e o conjunto de dispositivos de entrada e saída. Processador Memória Dispositivo de Entrada e Saída dados controle endereçamento Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais Análise O barramento de endereços, basicamente, indica de onde os dados a serem processados devem ser retirados ou para onde devem ser enviados. A comunicação por esse barramento é unidirecional. Como o nome deixa claro, é pelo barramento de dados que os dados transitam. Por sua vez, o barramento de controle faz a sincronização das referidas atividades, habilitando ou desabilitando o fluxo de dados. Segue exemplo: Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais Imagine que o processador necessita de um dado presente na memória. Pelo barramento de endereços, ele obtém a localização desse dado dentro da memória. Como precisa apenas acessar o dado, o processador indica pelo barramento de controle que esta é uma operação de leitura na memória. O dado é então localizado e inserido no barramento de dados, por onde o processador, finalmente, o lê. Clock interno e clock externo O clock serve justamente para a sincronização de sinais. Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais A medição do clock é feita em hertz (Hz), a unidade padrão de medidas de freqüência, que indica o número de oscilações ou ciclos que ocorre dentro de uma determinada medida de tempo, no caso, segundos. Assim, se um processador trabalha à 800 Hz, por exemplo, significa que é capaz de lidar com 800 operações de ciclos de clock por segundo. Para fins práticos, a palavra kilohertz (KHz) é utilizada para indicar 1000 Hz, assim como o termo megahertz (MHz) é usado para indicar 1000 KHz (ou 1 milhão de hertz). De igual forma, gigahertz (GHz) é a denominação usada quando se tem 1000 MHz, e assim Prof.: Ademir Justino por diante. Site: www.ademirjustino.com.br Processadores Atuais O processadores também contam com o que chamamos de clock externo ou Front Side Bus (FSB) ou, ainda, barramento frontal. O FSB existe porque, devido a limitações físicas, os processadores não podem se comunicar com a memória (mais precisamente, como a ponte norte - ou northbridge - do chipset, que contém o controlador da memória) usando a mesma velocidade do clock interno. Assim, quando essa comunicação é feita, o clock externo, de freqüência mais baixa, é que é usado. Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais Para obter o clock interno, o processador usa uma multiplicação do clock externo. Análise Suponha que um determinado processador tenha clock externo de 100 MHz. Como o seu fabricante indica que esse chip trabalha à 1,6 GHz (ou seja, tem clock interno de 1,6 GHz), seu clock externo é multiplicado por 16: 100 x 16 = 1600 MHz ou 1,6 GHz. Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais Memória cache Os processadores passam por aperfeiçoamentos constantes, o que os tornam cada vez mais rápidos e eficientes. No entanto, o mesmo não se pode dizer das tecnologias de memória RAM. Embora estas também passem por constantes melhorias, não conseguem acompanhar os processadores em termos de velocidade. Assim sendo, de nada adianta ter um processador rápido se este tem o seu desempenho comprometido por causa da "lentidão" da memória.. Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais Uma solução para esse problema seria equipar os computadores com um tipo de memória muito mais rápida, a SRAM (Static RAM). Estas se diferenciam das memórias convencionais DRAM (Dynamic RAM) por serem muito rápidas, por outro lado, são muito mais caras e não contam com o mesmo nível de miniaturização, sendo, portanto, inviáveis. Apesar disso, a idéia não foi totalmente descartada, pois foi adaptada para o que conhecemos como memória cache. Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais A memória cache consiste em uma pequena quantidade de memória SRAM embutida no processador. Quando este precisa ler dados na memória RAM, um circuito especial chamado "controlador de cache" transfere blocos de dados muito utilizados da RAM para a memória cache. Assim, no próximo acesso do processador, este consultará a memória cache, que é bem mais rápida, permitindo o processamento de dados de maneira mais eficiente. Prof.: Ademir Justino Site: www.ademirjustino.com.br Processadores Atuais Cache L1 (Level 1 - Nível 1) e cache L2 (Level 2 - Nível 2). Este último é ligeiramente maior em termos de capacidade e passou a ser utilizado quando o cache L1 se mostrou insuficiente. Antigamente, um tipo distinguia do outro pelo fato da memória cache L1 estar localizada no núcleo do processador, enquanto que a cache L2 ficava localizada na placa-mãe. Atualmente, ambos os tipos ficam localizados dentro do chip do processador, sendo que, em muitos casos, a cache L1 é dividida em duas partes: "L1 para dados" e "L1 para instruções". Prof.: Ademir Justino Site: www.ademirjustino.com.br Layout CPU L1 Cache 32 KB 150Mhz Cache L2 512KB Fig. 01 Fig. 02 Na figura 01 apresenta a Cache L2 separada do processador. Já a figura 02 apresenta as duas cache trabalhando no mesmo núcleo. Prof.: Ademir Justino Site: www.ademirjustino.com.br Dual core e Multi-core Processadores desse tipo contam com dois ou mais núcleos distintos no mesmo circuito integrado, como se houvesse dois processadores dentro de um. Em um chip de único núcleo, o usuário pode ter a impressão de que vários processos são executados simultaneamente, já que a máquina está quase sempre executando mais de uma aplicação ao mesmo tempo. É importante ressaltar que ter processadores com dois ou mais núcleos não implica, necessariamente, em computadores que são proporcionalmente mais rápidos. Prof.: Ademir Justino Site: www.ademirjustino.com.br Dual core e Multi-core Uma série de fatores influenciam nesse quesito, como as velocidades limitadas das memórias e dos dispositivos de entrada e saída, e as formas como os programas são desenvolvidos. Prof.: Ademir Justino Site: www.ademirjustino.com.br Core 2 Quad da série Q9000 Os 4 núcleos são compostos por nada menos que 731 milhões de transistores, que, mesmo com a técnica de produção de 45 nanômetros, ocupam uma área de 263 mm². Para ter uma ideia, isso corresponde a mais de 10 vezes o tamanho de um Atom 230, que possui apenas 25.9 mm². Prof.: Ademir Justino Site: www.ademirjustino.com.br Para acomodar os 4 núcleos, a Intel fez várias mudanças na arquitetura dos caches. Em vez de um grande cache L2 compartilhado, optaram por utilizar uma arquitetura similar à utilizada pela AMD no Phenom, com um pequeno cache L2 (de 256 KB) para cada núcleo e generosos 8 MB de cache L3. Dentro da arquitetura, o cache L3 assume a posição que no Core 2 Duo era executada pelo cache L2, servindo como um reservatório comum de dados. Outra mudança dramática é a inclusão de um controlador de memória integrado, assim como temos nos processadores AMD. O controlador de memória integrado reduz substancialmente o tempo de latência da memória, resultando em um ganho de desempenho considerável. Um dos grandes motivos o Athlon X2 ter se mantido competitivo em relação ao Core 2 Duo. Prof.: Ademir Justino Site: www.ademirjustino.com.br Em vez de utilizar um controlador single-channel, ou dual-channel, a Intel optou por utilizar um controlador triple-channel na versão inicial do Core i7, com memórias DDR3. Isso significa uma banda total de até 32 GB/s. Para ter uma ideia, isso é 40 vezes mais do que tínhamos há 10 anos, quando utilizávamos módulos de memória SDR PC-100 em conjunto com o Pentium III. Prof.: Ademir Justino Site: www.ademirjustino.com.br Os três canais operam de forma independente, de forma que o processador pode iniciar uma nova leitura em um dos módulos enquanto ainda espera os dados referentes a uma leitura anterior, realizada em outro módulo. Isso contribui para reduzir o tempo de latência do acesso à memória, que é, proporcionalmente, muito mais alto nos módulos DDR3. Naturalmente, para tirar o melhor benefício do triple-channel, é necessário usar os módulos em trios. Ao usar um único módulo, apenas um dos canais será ativado e, ao usar quatro, o último módulo compartilhará o mesmo canal com o primeiro. Prof.: Ademir Justino Site: www.ademirjustino.com.br O Core i7 introduziu o soquete LGA-1366, com quase o dobro de contatos que o LGA-775 do Core 2 Duo. Até mesmo o formato do processador mudou, passando a ser retangular, assim como no antigo Pentium Pro: Prof.: Ademir Justino Site: www.ademirjustino.com.br Desde o lançamento dos primeiros processadores tanto a Intel ou quanto a AMD tem criado uma série de soquetes e slots para seus processadores. Desde do início, um soquete de processador era compatível apenas com um tipo de processador. Veja na tabela a listas dos sockets atuais... Socket 4 Prof.: Ademir Justino Site: www.ademirjustino.com.br Socket F Socket 940 Amd Opteron Prof.: Ademir Justino Site: www.ademirjustino.com.br Socket F http://www.hardware.com.br/tutoriais/athlon64-x2-sempron/pagina12.html Material para identificação do processador Prof.: Ademir Justino Site: www.ademirjustino.com.br Dissipação dos Processadores Os primeiros processadores dissipavam muito pouco calor, por isso o próprio encapsulamento cerâmico era suficiente para dissipar o calor e manter o chip em uma temperatura aceitável. As primeiras CPUs x86 a utilizarem dissipadores foram os 486 DX-33, que atingiram a marca dos 4.5 watts. Os coolers da época nada mais eram do que uma base de alumínio com menos de 1 cm de altura com uma ventoinha de baixa rotação, bem diferentes dos atuais. Prof.: Ademir Justino Site: www.ademirjustino.com.br Dissipação dos Processadores Hoje em dia, não é difícil ultrapassar a marca dos 200 watts ao fazer overclock em um Core 2 Quad ou em um Core i7. Prof.: Ademir Justino Site: www.ademirjustino.com.br Dissipação dos Processadores Tanto a base quanto os heat-pipes são prateados devido à aplicação de uma cobertura de níquel, que além da função estética, serve para prevenir a oxidação do cobre. Este pesa 1045 gramas e o formato de torre permite o uso de dois dissipadores de 120 mm, onde o primeiro empurra o ar em direção ao dissipador e o segundo o puxa, criando uma espécie de túnel de vento. Todos os coolers eram feitos de alumínio, mas com o lançamento do Pentium III e do Athlon (que ultrapassavam a marca dos 50 watts em overclock) muitos fabricantes passaram a produzir coolers de cobre. Prof.: Ademir Justino Site: www.ademirjustino.com.br Dissipação dos Processadores Encontramos também o uso de kits de fixação, que permitem que o mesmo modelo seja compatível simultaneamente com diversos soquetes, incluindo placas AM2/AM3, LGA775 e até mesmo LGA1366. Os kits consistem em braçadeiras removíveis, que são presas à base do cooler e podem ser substituídas conforme necessário: Prof.: Ademir Justino Site: www.ademirjustino.com.br Dissipação dos Processadores Mais uma tendência crescente é o uso de heat-pipes para interligar dissipadores sobre diferentes componentes da placa-mãe, permitindo que eles sejam resfriados de forma conjunta. Nesta foto o heat-pipe é utilizado para ligar o dissipador da ponte norte do chipset e o dissipador instalado sobre os reguladores de tensão da placa. Dessa forma, o fluxo de ar gerado pelo cooler do processador acaba resfriando de forma conjunta os dois componentes. Prof.: Ademir Justino Site: www.ademirjustino.com.br Dissipação dos Processadores Finalmente, temos os water-coolers, que utilizam água ou outro líquido refrigerante. O líquido é bombeado dentro do sistema, passando pelo water block (o módulo que fica sobre o processador) e em seguida pelo radiador, onde é resfriado. Prof.: Ademir Justino Site: www.ademirjustino.com.br Referências: Livro: Hardware (Gabriel Torres) Sites: www.infowester.com.br Www.hardware.com.br