Pré-visualização parcial do texto
Baixe Curso de Hardware - iPED e outras Notas de estudo em PDF para Redes de Computadores, somente na Docsity!
VI. VII. VIII. Curso de Hardware Carga Horária: 20 horas. Tópicos do curso Introdução ao Curso de Hardware Características Básicas Acesso à Memória Memória RAM Discos Rígidos Setor de Boot AGP (Acelerated Graphics Port) Vídeo primário e secundário Outros perifércos, escolhendo a melhor configuração Iniciando a montagem XI. XII. Xi. XIV. Xv. XVI. XVII. XVIII. XIX. XX. Encaixando os módulos de memória Velocidade do processador Tipos de Jumpers Encaixando cabos flat e plugs de energia Encaixando placas ISA, PCI e AGP Instalação e configuração do Windows Configurando o hardware Instalando placas de som Instalando scanners Atualização drivers Introdução ao Curso de Hardware Bem-vindo ao Curso de Hardware, esse curso foi elaborado por Carlos E. Morimoto. responsável pelo site Guia do Hardware, que indicamos para futuros estudos. Conhecendo os Componentes Como tudo funciona? Para um leigo, um computador pode parecer uma máquina misteriosa, uma “caixa preta” onde de alguma forma mística são guardadas e processadas informações. Porém, de misterioso os computadores não têm nada. Tudo funciona de maneira ordenada, e até certo ponto simples. O objetivo deste capítulo inicial é dar uma visão geral sobre os componentes que formam um micro computador, e como tudo funciona. Mais para a frente, você conhecerá mais a fundo cada componente, aprenderá a montar e configurar micros padrão PC e a solucionar problemas de funcionamento, estando pronto para resolver seus próprios problemas, ajudar amigos, ou mesmo trabalhar na área de manutenção. Sistema Binário Existem duas maneiras de representar uma informação: analógicamente ou digitalmente. Uma música de um grupo qualquer, é gravada numa fita K-7 de forma analógica, codificada na forma de uma grande onda, que pode assumir um número ilimitado de fregiiências. Um som grave seria representado por um ponto mais baixo da onda, enquanto um ponto mais alto representaria um som agudo. O problema com esta representação, é que qualquer interferência causa distorções no som. Se os computadores trabalhassem com dados analógicos, certamente seriam muito passíveis de erros, pois qualquer interferência, por mínima que fosse, causaria alterações nos dados processados e consequentemente nos resultados. O sistema digital por sua vez, permite armazenar qualquer informação na forma de uma segiiência de valores positivos e negativos, ou seja, na forma de uns e zeros. O número 181 por exemplo, pode ser representado digitalmente como 10110101. Qualquer dado, seja um texto, uma imagem, um programa, ou qualquer outra coisa será processado e armazenado na forma de uma grande segiiência de uns e zeros. É justamente o uso do sistema binário que torna os computadores confiáveis, pois a possibilidade de um valor | ser alterado para um valor 0, o oposto, é muito pequena. Lidando com apenas dois valores diferentes, a velocidade de processamento também torna-se maior, devido à simplicidade dos cálculos. Cada valor binário é chamado de “bit”, contração de “binary digit” ou “dígito binário”. Um conjunto de 8 bits forma um byte e um conjunto de 1024 bytes forma um Kilobyte (ou Kbyte). O número 1024 foi escolhido pois é a potência de 2 mais próxima de 1000. Um conjunto de 1024 Kbytes forma um Megabyte (1048576 bytes) e um conjunto de 1024 Megabytes forma um Gigabyte (1073741824 bytes). Os próximos múltiplos são o Terabyte (1024 Gigabytes) e o Petabyte (1024 Terabytes) Também usamos os termos Kbit, Megabit e Gigabit, para representar conjuntos de 1024 bits. Como um byte corresponde a 8 bits, um Megabyte corresponde a 8 Megabits e assim por diante. Tedid: Desc 1 Bit= 1ou0 1 Byte= [Um conjunto de 8 bits 1 Kbyte = 1024 bytes ou 8192 bits 1 Megabyte = nat Kbytes, 1.048.576 bytes ou 8.388.608 1 GigaByte = 1073 Megabytes, 1.073.741.824 bytes 1 TeraByte = 1099 Gigabytes, 1.099.511.627.776 bytes Funcionamento Básico A arquitetura básica de qualquer computador completo, seja um PC, um Machintosh ou um computador de grande porte, é formada por apenas 5 componentes básicos: processador, memória RAM, disco rígido, dispositivos de entrada e saída e softwares. O processador e o cérebro do sistema, encarregado de processar todas as informações. Porém, apesar de toda sua sofisticação, o processador não pode fazer nada sozinho. Para termos um computador funcional, precisamos de mais alguns componentes de apoio: memória, unidades de disco, dispositivos de entrada e saída e finalmente os programas a serem executados. A memória principal, ou memória RAM, é usada pelo processador para armazenar os dados que estão sendo processados, funcionando como uma espécie de mesa de trabalho. A quantidade de memória RAM disponível, determina quais atividades o processador poderá executar. Um engenheiro não pode desenhar a planta de um edifício sobre uma carteira de escola. Caso a quantidade de memória RAM disponível sgja insuficiente, o computador não será capaz de rodar aplicativos mais complexos. O IBM PC original, lançado em 1981 por exemplo, possuía apenas 64 Kbytes de memória, e por isso era capaz de executar apenas programas 4 alto nível) como o Visual Basic ou Delphi, tomaria bem menos tempo, e ainda por cima teria uma interface gráfica muito mais bonita e amigável, já que muitas das funções usadas no programa já estariam prontas. Nos primórdios da informática, nas décadas de 50, 60 e 70, vários fabricantes diferentes disputavam o mercado. Cada um desenvolvia seus próprios computadores, que eram incompatíveis entre sí, tanto a nível de hardware, quanto a nível de software. Apesar de executarem as mesmas operações básicas, praticamente tudo era diferente: os componentes de um não serviam em outro, os programas eram incompatíveis, e até mesmo as linguagens de programação eram diferentes. Porém, com a popularização dos microcomputadores era inevitável uma padronização. No início da década de 80, tínhamos basicamente apenas duas arquiteturas, ou “famílias” de computadores pessoais diferentes: O PC, desenvolvido pela IBM, e o Macintosh, desenvolvido pela Apple. Como era mais barato, o PC tornou-se mais popular, ficando o uso dos Macintoshs restrito a nichos onde suas características peculiares o tornam mais atraente, como a edição de imagens ou sons € editoração eletrônica. Como os micros PC possuem uma arquitetura aberta, ou seja, a possibilidade de vários fabricantes diferentes desenvolverem seus próprios componentes e padrões, temos uma lista enorme de componentes compatíveis entre sí. Podemos escolher entre várias marcas e modelos os componentes que melhor atendam nossas necessidades e montar nossa própria configuração. Também é possível melhorar posteriormente o micro montado, através de upgrades, trocando alguns componentes para melhorar seu desempenho. Mesmo micros de grife: IBM, Compact, Dell, etc. também são micros montados, já que quase todos os seus componentes são comprados de outros fabricantes. Temos por exemplo, um processador da Intel, um disco rígido da Quantum, uma placa mãe da Asus, memórias da Kingstone, CD-ROM e drive de disquetes da Mitsumi, um monitor da LG, e por aí vai :-). Componentes Agora que você já entendeu o que se passa dentro do gabinete de um PC, que tal se estudássemos a função dos seus principais componentes? Vamos dar sequência, utilizando componentes mais antigos, pois hoje em dia muitas peças são "acopladas" na placa mãe e suas funções foram incorporadas. Por isso, preferimos utilizar imagens e explicar com componentes antigos, para que você entenda os principios do hardware e a função de cada componente. Você já deve estar familiarizado com a função do processador. Atualmente encontramos no mercado vários processadores diferentes. Em ordem de evolução, podemos citar: o 486, o Pentium, o Pentium MMX, o K6, o K6-2, K6-3, o Pentium II e o Celeron, o Pentium III, Duron, Athlon e Pentium 4.Mais adiante você conhecerá melhor cada um deles. Definimos o processador como o cérebro do micro. Pois bem, todo o cérebro precisa de um corpo, que é justamente a placa mãe. Ela traz todos os componentes que permitem ao processador comunicar-se com os demais periféricos, como discos rígidos, placas de vídeo, etc. Outra função da placa mãe é acomodar e alimentar eletricamente o processador. Cada processador precisa de uma placa mãe desenvolvida especialmente para ele, pois, devido à diferenças na sua arquitetura, os processadores possuem “necessidades” diferentes. Cada processador possui um número diferente de contatos, ou terminais, opera usando uma voltagem diferente e precisa de um conjunto de circuitos de apoio desenvolvidos especialmente para ele. O próprio encaixe do processador muda de família para família. O Pentium II por exemplo utiliza o “Slot 1” que é parecido com o encaixe de um cartucho de video-game, enquanto o K6 e o Pentium comum, utilizam outro encaixe Processador Pentium 4 diferente, chamado de “Soquete 7”. Apesar das diferenças, normalmente as placas mãe são desenvolvidas para serem compatíveis com mais de um processador. Uma placa mãe soquete 7 mais moderna por exemplo, quase sempre suportará desde um Pentium de 75 MHz até um K6-3 de 500 MHz, passando por processadores Pentium MMX, K6 e Cyrix 6x86. Uma placa Slot 1 moderna por sua vez, suporta processadores Pentium II, Celeron e Pentium II. Ao longo deste livro você aprenderá a descobrir quais processadores podem ser usados em cada modelo de placa mãe e como configurar a placa para cada processador a ser usado. Mas a importância da placa mãe não para por aí. Ela determina quais componentes poderão ser usados no micro (e consequentemente as possibilidades de upgrade) e influencia diretamente na performance geral do equipamento. Com certeza, você não gostaria de gastar 200 ou 300 dólares numa placa de vídeo de última geração, só para descobrir logo depois que não poderá instalá-la pois a placa mãe do seu micro não possui um slot AGP. Para poder trabalhar, o processador precisa também de memória RAM, que é vendida na forma de pequenas placas, chamadas de módulos de memória, que são encaixadas na placa mãe. Você ouvirá muito o termo “pente de memória” uma espécie de apelido, que surgiu por que os contatos metálicos dos módulos lembram um pouco os dentes de um pente. Placa Mãe Módulo de memória de 168 vias Veja abaixo modelos mais recentes: Diferentes tipos de RAM. A partir do alto: DIP, SIPP, SIMM 30 pin, SIMM 72 pin, DIMM (168-pin), DDR DIMM (184-pin) Para o que o micro seja capaz de guardar programas e arquivos, precisamos também de um disco rígido, chamado também de HD (Hard Disk) ou Winchester, que é acomodado no gabinete e ligado à placa mãe através de um cabo. Outro componente essencial é o gabinete, uma caixa de metal que acomoda e protege os frágeis componentes internos do micro. O gabinete traz também a fonte de alimentação, responsável por converter a corrente alternada da tomada (AC) para corrente contínua (DC) usada pela maioria dos componentes eletrônicos. A fonte também serve para atenuar pequenas variações de tensão, protegendo o equipamento. : Características Básicas Existem no mercado diversos processadores, cada um com recursos e preços diferentes. Determinar qual processador é a melhor opção de compra em cada caso, é uma tarefa difícil, pois um processador que é adequado a uma determinada aplicação, pode ser muito ruim em outra. Quando vamos comprar um processador, a primeira coisa que perguntamos é qual sua frequência de operação, ou sua velocidade, medida em Megahertz (MHz) ou milhões de ciclos por segundo. Acontece, que nem sempre um processador com uma velocidade de operação mais alta é mais rápido do que outro que opera a uma frequência um pouco mais baixa: a frequência de operação de um processador indica apenas quantas operações são executadas por segundo, o que ele é capaz de fazer em cada operação já é outra história. Imagine um processador 486 de 100 MHz, ao lado de um Pentium também de 100 MHz. Apesar da frequência de operação ser a mesma, o 486 perderia feio em desempenho. Na prática, o Pentium seria pelo menos 2 vezes mais rápido. Isto acontece devido à diferenças na arquitetura dos processadores e também no coprocessador aritmético e cache. :. Coprocessador aritmético Todos os processadores da família x86, usada em micros PC, são basicamente processadores de números inteiros. Muitos aplicativos porém, precisam utilizar números fracionários, assim como funções matemáticas complexas, como Seno, Coseno, Tangente, etc., para realizar suas tarefas. Este é o caso dos programas de CAD, planilhas, jogos com gráficos tridimensionais e de processamento de imagens em geral. É possível emular via software estas funções matemáticas complexas, através da combinação de várias instruções simples, porém com uma baixa performance. A função do coprocessador aritmético é justamente auxiliar o processador principal no cálculo destas funções complexas. (Questão 3 — 1º questionário). Como o coprocessador possui instruções específicas para executar este tipo de cálculo, ele é em média de 30 a 50 vezes mais rápido do que o processador principal executando o mesmo tipo de cálculo via emulação, sendo um componente essencial atualmente. Até o 386, o coprocessador era apenas um acessório que podia ser comprado à parte e instalado no soquete apropriado da placa mãe, sendo que cada modelo de processador possuía um modelo equivalente de coprocessador: O problema nesta estratégia é que como poucos usuários equipavam seus micros com coprocessadores aritméticos, a produção destes chips era baixa, e consequentemente os preços eram altíssimos, chegando ao ponto de em alguns casos o coprocessador custar mais caro que o processador principal. Com o aumento do número de aplicativos que necessitavam do coprocessador, sua incorporação ao processador principal apartir do 486 foi um passo natural. Com isso resolveu-se também o problema do custo de produção dos coprocessadores, barateando o conjunto. :. Memória Cache Enquanto os processadores tornaram-se mais de 10.000 mais rápidos desde o 8088 (o processador usado no XT) a memória RAM, sua principal ferramenta de trabalho, pouco evoluiu em performance. Quando foram lançados os processadores 386, percebeu-se que as memórias não eram mais capazes de acompanhar o processador em velocidade, fazendo com que muitas vezes ele tivesse que ficar “esperando” os dados serem liberados pela memória RAM para poder concluir suas tarefas, perdendo muito em desempenho. Se na época do 386 a velocidade das memórias já era um fator limitante, imagine o quanto este problema não atrapalharia o desempenho dos processadores que temos atualmente. Para solucionar este problema, começou a ser usada a memória cache, um tipo ultra-rápido de memória, que serve para armazenar os dados mais frequentemente usados pelo processador, evitando na maioria das vezes que ele tenha que recorrer à comparativamente lenta memória RAM. Sem ela, o desempenho do sistema ficará limitado à velocidade da memória podendo cair em mais de 95%. Usamos dois tipos de cache, chamados de cache primário, ou cache L1 (level 1), e cache secundário, ou cache L2 (level 2). O cache primário é embutido no próprio processador, e é rápido o bastante para acompanhá-lo em velocidade. Sempre que um novo processador é desenvolvido, é preciso desenvolver também um tipo mais rápido de memória cache para acompanhá-lo. Como este tipo de memória é extremamente caro (chega a ser algumas milhares de vezes mais cara que a memória RAM convencional) usamos apenas uma pequena quantidade dela. O 486 traz apenas 8 KB, o Pentium traz 16 KB, enquanto o Pentium III traz 32 KB, Para complementar, usamos também um tipo um pouco mais lento de memória cache na forma do cache secundário. Por ser muito mais barato, podemos usar uma quantidade muito maior. No micros antigos o cache L2 fazia parte da placa mãe, mas em praticamente todos os processadores atuais, incluindo o Athlon, Pentium II, III, Celeron, Duron, Pentium 4, etc. o cache L2 também é embutido dentro do processador. Sempre que o processador precisar ler dados, os procurará primeiro no cache L1. Caso o dado seja encontrado, o processador não perderá tempo, já que o cache primário funciona na mesma fregiência que ele. Caso o dado não esteja no cache L1, então o próximo a ser indagado será o cache L2. Encontrando o dado no cache secundário, o processador já perderá algum tempo, mas não tanto quanto perderia caso precisasse acessar a memória RAM. Por outro lado, caso o dado não esteja em nenhum dos dois caches, não restará outra saída senão perder vários ciclos de processamento esperando o dado ser fornecido pela lenta memória RAM. Para exemplificar, imagine que você estivesse escrevendo um texto e derrepente precisasse de uma informação que você havia anotado em um papel. Se o papel estivesse sobre sua mesa, você poderia lê-lo sem perder tempo. Se estivesse dentro de uma gaveta da sua mesa, já seria necessário algum tempo para encontrá-lo enquanto se ele estivesse perdido em algum lugar de um enorme fichário do outro lado da sala, seria preciso um tempo enorme. :. Diferenças na arquitetura Diferenças na arquitetura interna, ou seja, no projeto do processador e na quantidade de transístores que o formam, também determinam em quais operações um processador será mais rápido. Basicamente, um processador desempenha dois tipos de operações diferentes: as operações envolvendo números inteiros e operações de ponto flutuante (que envolvem números fracionários e operações aritméticas mais complexas). As operações envolvendo números inteiros são feitas pelo núcleo principal do processador, enquanto as envolvendo números fracionários são feitas pelo coprocessador aritmético. Programas de escritório e Internet, como o Word, Excel, Power Point, Internet Explorer, Netscape e o próprio Windows, utilizam quase que exclusivamente o processamento de números inteiros. Por outro lado, programas que manipulam gráficos, como o Auto CAD, Corel Draw!, Photoshop, 3D Studio, e principalmente jogos que utilizam gráficos tridimensionais, como o Quake utilizam predominantemente cálculos de ponto flutuante. Alguns modelos de processadores saem-se melhor em inteiros (como os processadores K6, K6-2 e K6-3 da AMD e 6x86 da Cyrix) , enquanto outros são melhores em cálculo de ponto flutuante (como o Pentium II e o Celeron). Ao decidir em qual processador vai investir seu dinheiro, a aplicação à qual o micro se destina deve ser levada em consideração. Que tal conhecer agora um a um os processadores usados em micros PC? : 8088 O 8088 foi lançado em 79 e é uma espécie de irmão menor do 8086, que havia sido lançado pela Intel a uma ano antes. Internamente os dois processadores são idênticos, a diferença era que o 8088 usava periféricos (placas mãe, memórias, HDs, etc.) de 8 bits, enquanto o 8086 usava periféricos de 16 bits, que apesar de mais avançados eram muito mais caros na época. A fim de baratear o projeto do primeiro PC a IBM optou por usar o 8088. Na época, o 8088 era considerado um processador bastante avançado: era composto por 29.000 transistores (o Pentium 4 tem 41 milhões), acessava 1 megabyte de memória (um simples 386 já acessa 4 GB) e operava a 4.77 MHz. Lembre-se que estamos falando de um processador com mais de 21 anos, de lá pra ca as coisas evoluíram um pouco :-) Falando em evolução, só para matar sua curiosidade, o PC original da IBM, lançado em Agosto de 81 possuía apenas 64 Kbytes de memória RAM, um monitor MDA mono de 12 polegadas, usava uma unidade de disquetes de 5 1/4 de apenas 160 KB, e vinha sem disco rígido. O sistema operacional usado era o MS-DOS 1.0. Dois anos depois, foi lançado o PC XT, que apesar de continuar usando o 8088 de 4,77 MHz, vinha com 256 KB de RAM, um disco rígido de 10 MB, monitor CGA e o MS-DOS 2.0. Mesmo com o surgimento dos micros 286, o XT ainda continuou sendo bastante vendido, pois era mais barato. Fabricantes de clones (micros compatíveis com os da IBM) criaram projetos de micros XTs mais avançados, equipados com processadores 8088 de 8 MHz, discos rígidos maiores e até 640 KB de memória RAM. :. 286 O 286 foi o sucessor do 8088 nos micros PC. Sem dúvida ele trouxe vários avanços sobre o 8088, era capaz de acessar mais memória (16 MB), já trazia suporte a multitarefa, memória virtual e proteção de memória. Porém, junto com os avanços veio um grande defeito. Para acessar os novos recursos era preciso que o processador entrasse em modo protegido. O problema é que uma vez em modo protegido o 286 deixa de ser compatível com os programas de modo real, onde ele se comporta exatamente como um 8088. Para acessar o disco rígido, gravar dados na memória, mostrar dados no monitor, etc. os aplicativos precisavam do DOS, e o DOS é ate hoje um programa de modo real. Uma vez em modo protegido o 286 deixava de ser compatível como DOS e não havia nenhuma instrução que o fizesse voltar ao modo real, apenas resetando o micro. Veja o problema: para criar um simples jogo que utilizasse o modo protegido do 286, o programador precisaria incluir no jogo todas as rotinas de acesso ao disco rígido, memória, etc. já que não poderia utilizar o DOS. Ou seja, para desenvolver um simples jogo seria preciso construir praticamente um novo sistema operacional, algo completamente inviável. Por isso, apesar dos avanços, os micros baseados no 286 acabavam sendo usados apenas para rodar aplicativos de modo real, que também podiam ser rodados em um XT, aproveitando apenas a maior velocidade do 286. Falando em velocidade, a primeira versão do 286 funcionava a apenas 6 MHz, sendo lançada logo depois uma nova versão de 8 MHz, que foi usada no PC AT. Posteriormente foram desenvolvidas versões de até 20 MHz. : 386 O 386 é o que podemos chamar de o primeiro processador contemporâneo, pois apesar de extremamente lento, o 386 já incorpora todas as instruções do conjunto x86, usado pelos programas atuais. (4º Questionário — questão 9). Isto significa que tendo 10 instruções por ciclo de clock (uma em cada processador). Foi incluída também, uma unidade de controle, com a função de comandar o funcionamento dos dois processadores e dividir as tarefas entre eles. Como o Pentium é na verdade um conjunto de dois processadores de 32 bits trabalhando em paralelo, é possível acessar a memória usando palavras binárias de 64 bits, o dobro do 486, que a acessava a 32 bits. Este recurso permite que sejam lidos 8 bytes por ciclo, ao invés de apenas 4, dobrando a velocidade de acesso e diminuindo bastante o antigo problema de lentidão das memórias. Justamente devido ao acesso à memória a 64 bits do Pentium, é necessário utilizar pentes de memória de 72 vias em pares. Já que cada pente permite acesso aos dados usando palavras de 32 bits, acessando ambos os pentes ao mesmo tempo chegamos aos 64 necessários. Mesmo podendo acessar a memória a 64 bits e sendo composto internamente por dois processadores de 32 bits, o Pentium continua sendo um processador de 32 bits. Estes novos recursos servem apenas para melhorar o desempenho do processador. :. AMD 5x86 Este processador foi lançado pela AMD pouco depois do lançamento do Pentium. Apesar do nome, o 5x86 da AMD é na verdade um processador 486 que trabalha a 133 MHz, com a placa mãe funcionando a 33 MHz e usando multiplicador de 4x, servia apenas como um upgrade de baixo custo. :. Cyrix Cx5x86 Além de desenvolver projetos de processadores 486, que foram fabricados pela Texas Instruments, a Cyrix lançou um processador que mistura recursos do 486 e do Pentium, oferecendo um desempenho bastante superior a um 486 padrão. Como o 5x86 da AMD, Cx5x86 é totalmente compatível com as placas mãe para 486, bastando configurar a placa com multiplicador de 3x e bus de 33 MHz para instalar a versão de 100 MHz e 3x 40 MHz para utilizar a versão de 120 MHz. :. AMD K5 Na época do 386 e 486, a AMD era uma parceira da Intel. A Intel fornecia os projetos de processadores e a AMD também os produzia, vendendo-os com o seu nome. Um 486 da AMD é idêntico a um 486 da Intel, mudando apenas o fabricante. Em troca a AMD pagava royalties à Intel. Porém, apartir do Pentium a Intel desfez este acordo, restando à AMD desenvolver seus próprios projetos de processadores. A primeira tentativa na carreira solo foi o AMD K5, um projeto superior ao Pentium em alguns quesitos. O problema do K5 foi seu lançamento atrasado. Quando a AMD finalmente conseguiu lançar no mercado o K5 Pr 133, a Intel já vendia o Pentium 200, tornando a concorrência quase impossível. :. Pentium MMX Você já parou para pensar em como foi possível um avanço tão rápido no ramo dos processadores, como vimos nas últimas décadas? A chave de tudo isto é a miniaturização. Qualquer processador, desde uma simples calculadora até um Athlon ou Pentium 4 é composto por transístores. Cada transistor funciona como uma minúscula chave, que pode estar ligada, permitindo a passagem de corrente, ou desligada. Um transistor sozinho não serve para muita coisa, mas juntando alguns milhares ou milhões obtemos um processador. Os primeiros transístores fabricados comercialmente, no início da década de 50, tinham mais ou menos o tamanho da cabeça de um fósforo. Isso explica por que os computadores da época eram tão grandes. Os transistores usados no 8088, o processador do XT já mediam apenas 3 mícron (um mícron equivale à um milésimo de um milímetro). Melhor ainda, naquela época, final da década de 70 já era possível integrar vários transistores no mesmo encapsulamento, permitindo que o 8088 tivesse 29 mil deles. Com o passar do tempo, os transístores foram encolhendo. O 486 já usa transistores medindo 1 micron e possui quase 1 milhão deles. Apartir do Pentium os transistores foram encolhendo ainda mais, 0.8 mícron na versão de 60 MHz, 0.6 mícron apartir do Pentium 100 e 0.4 micron apartir do Pentium 150. Quanto menor for cada transistor, mais transistores o processador poderá conter e, ao mesmo tempo, o processador poderá operar a fregiências mais altas, consumindo menos eletricidade. Com transistores de 0.4 micron o Pentium chegou a apenas 200 MHz. Os processadores atuais já utilizam transístores de 0.18 mícron, o que permite Athlons de 1.2 GHz e Pentiums 4 de até 1.5 GHz. Em breve teremos transístores de 0.13, 0.10 e 0.07 mícron e processadores cada vez mais rápidos. O Pentium MMX é mais avançado e mais rápido que o Pentium antigo por dois fatores. O primeiro é o fato de possuir mais cache LI embutido no processador: o Pentium antigo possui apenas 16 KB, enquanto o MMX possui o dobro, 32 KB. Em segundo lugar, o MMX foi o primeiro processador a trazer as famosas instruções MMX, encontradas em todos os processadores atuais, mas novidade na época. Apenas como curiosidade, o MMX era composto por 4.300.000 transistores de 0.35 mícron e foi lançado em 97. O conjunto MMX é composto por 57 novas instruções que visam melhorar o desempenho do processador em aplicações multimídia e processamento de imagens. Nestas aplicações, algumas rotinas podem ser executadas até 400% mais rápido com o uso 11 das instruções MMX. O ganho de performance porém não é automático: é necessário que o software utilizado faça uso das novas instruções, caso contrário não haverá nenhum ganho de performance. Seria mais ou menos como se você morasse em uma casa qualquer e de repente se mudasse para uma casa idêntica à antiga, apenas com uma porta a mais na cozinha, escondida atrás da cortina, que o conduzisse a alguns cômodos novos. Se ninguém lhe contasse sobre a existência da tal porta, talvez você nunca percebesse a diferença e continuasse usando apenas os cômodos antigos. Um programa antigo, simplesmente ignorará as instruções MMX, não apresentando ganho algum de performance. Para tirar proveito das novas instruções, é preciso que o programador altere o código do programa, alterando suas rotinas para que as instruções MMX sejam utilizadas no lugar das instruções x86 padrão. O ganho de performance real depende da habilidade do programador em detectar como e onde o MMX pode ser usado para tornar a execução do programa mais rápida. O Pentium MMX pode ser encontrado em versões de 166, 200 e 233 MHz. Em todas as versões a placa mãe funciona a 66 MHz (como no Pentium comum). Graças a isto, é possível instalar o MMX na maioria das placas soquete 7 antigas, para Pentium, desde que a placa mãe suporte a voltagem de 2.9 volts usada pelo MMX. Basta configurar o barramento para 66 MHz e o multiplicador como 2.5x ou 3x para os MMX de 166 e 200 MHz. O MMX de 233 MHz deve ser configurado com multiplicador de 1.5x, que será entendido pelo processador como 3.5x. As instruções MMX são apenas software e não requerem nenhum tipo de suporte por parte da placa mãe. Justamente por isso, todas as placas mãe para MMX suportam também o Pentium clássico, bastando configurar corretamente os jumpers que determinam a voltagem. :. AMD K6 O projeto do K6 foi baseado no 6x86 da Nex-Gen, uma pequena compania que acabou sendo adquirida pela AMD na época que ela vendia o K5. O projeto do 6x86 passou por várias melhorias, nascendo assim o K6. O K6 foi o primeiro processador da AMD a conseguir conquistar uma fatia considerável do mercado. Em termos de arquitetura é um projeto bastante interessante, um processador se sexta geração semelhante ao Pentium Pro da Intel, mas equipado com 64 KB de cache LI e utilizando o cache L2 da placa mãe. O ponto fraco do K6 era o coprocessador aritmético, que possui uma arquitetura muito mais simples do que os modelos utilizados pela Intel no Pentium MMX e no Pentium II, sendo por isso bem mais lento. Apesar deste defeito não atrapalhar o desempenho do K6 em aplicativos de escritório, faz com que seu desempenho em aplicativos gráficos, como processamento de imagens ou vídeos ou em jogos com gráficos tridimensionais (como o Quake II, popular na época) fique bastante prejudicado. Nestes aplicativos, o K6 chega a ser 20% mais lento que um Pentium MMX do mesmo clock. :. AMD K6-2 À exemplo da Intel, que incorporou as instruções MMX às instruções x86 padrão, a AMD incorporou novas 27 instruções aos seus processadores K6-2. Estas instruções são chamadas de “3D-Now!” e tem o objetivo de agilizar o processamento de imagens tridimensionais, funcionando em conjunto com uma placa aceleradora 3D. Como acontece com o MMX, é necessário que o software usado faça uso do 3D-Now!. Felizmente, esta tecnologia que continua sendo suportada pelos processadores Athlon e Duron, sucessores do K6-2, fizeram bastante sucesso, obtendo suporte por parte da maioria dos jogos do mercado. Mesmo os títulos sem otimização acabam sendo beneficiados indiretamente através do DirectX ou dos drivers de vídeo. Além das novas instruções, os processadores K6-2 trabalham com barramento de 100 MHz e existem versões a partir de 300 MHz. Os K6-2 também são compatíveis com as instruções MMX. Apesar do K6-2 utilizar placas mãe que funcionam a 100 MHz, ele pode ser utilizado em uma placa mãe mais antiga, que suporte apenas bus de 66 MHz. Neste caso, um K6-2 de 300 MHz, seria usado com bus de 66 MHz e multiplicador de 4,5x. Claro que assim perde-se um pouco em performance. Também é necessário que a placa mãe suporte a voltagem de 2.2v usada pelo K6-2. : K6-3 13 Por utilizar um novo tipo de encapsulamento, o Pentium Pro utiliza um novo tipo de encaixe, batizado de soquete 8. O soquete 8 é bem maior do que o soquete 7 utilizado pelo Pentium clássico e similares, possuindo também uma pinagem diferenciada que impede que o processador sçja encaixado ao contrário. Como no Pentium Pro o cache L2 é integrado ao processador, as placas mãe para ele não possuem cache algum. :. Processadores, parte 2 Vamos à segunda parte do tópico de processadores, cobrindo os processadores mais atuais: :. Pentium II A Intel desenvolveu o Pentium II usando como base o projeto do Pentium Pro. Foram feitas algumas melhorias de um lado, e retirados alguns recursos (como o suporte a 4 processadores) de outro, deixando o processador mais adequado ao mercado doméstico. Na verdade, o Pentium II, assim como o Pentium III também suportam multiprocessamento, mas são permitidos apenas dois processadores. Para habilitar este recurso é preciso apenas comprar uma placa mãe para dois processadores, estas são relativamente caras e difíceis de encontrar. É preciso usar dois processadores idênticos e usar um sistema operacional com suporte a multiprocessamento, como Windows NT, Windows 2000 ou Linux. O Windows 98 não serve neste caso pois ele reconhecerá apenas o primeiro processador, deixando o segundo desativado. A mudança mais visível no Pentium II é o novo formato do processador. Ao invés de um pequeno encapsulamento de cerâmica, temos uma placa de circuito, que traz o processador e o cache L2 integrado. Protegendo esta placa, temos uma capa plástica, formando um cartucho muito parecido com um cartucho de video-game. O Pentium II utiliza também um novo encaixe, batizado pela Intel de Slot 1 e exige uma placa mãe específica. Pentium II Além do cache L1, de 32 KB, o Pentium II traz integrados ao processador, nada menos que 512 KB de cache L2, o dobro da quantidade encontrada na versão mais simples do Pentium Pro. No Pentium II porém, o cache L2 trabalha a apenas metade do clock do processador. Em um Pentium II de 266 MHz por exemplo, o cache L2 trabalha a 133 MHz. Você nunca encontrará à venda uma placa mãe para Pentium II com cache, já que o cache L2 vem integrado ao próprio processador. Uma última consideração a respeito dos processadores Pentium II é sobre a velocidade de barramento, ou seja, a velocidade da placa mãe utilizada pelo processador. As versões do Pentium II de até 333 MHz funcionam usando barramento de 66 MHz, (questão 1 — primeiro questionário). enquanto que nas versões a partir de 350 MHz a placa mãe funciona a 100 MHz, o que acelera a troca de dados entre o processador e as memórias, tornando-o mais rápido. Vale lembrar são necessárias também memórias PC-100, as quais explicarei com mais detalhes no tópico sobre memórias. :. Pentium II Xeon O Xeon usa basicamente a mesma arquitetura do Pentium II, ficando a diferença por conta do cache L2, que no Xeon funciona na mesma velocidade do processador (como acontece no Celeron e no Pentium Pro). O Pentium II Xeon foi vendido em versões com 512, 1024 e 2048 KB de cache e em fregiiências de 400, 450 e 500 MHz. O Xeon foi especialmente concebido para equipar servidores, substituindo o Pentium Pro, pois como nestes ambientes o processamento é muito repetitivo, o cache mais rápido e em maior quantidade faz uma grande diferença, não fazendo porém muito sentido sua compra para uso doméstico devido ao seu alto preço. Outro recurso importante do Xcon é a possibilidade de se usar até 4 processadores na mesma placa mãe, sem necessidade de nenhum hardware adicional e até 8 caso a placa mãe possua um circuito especial chamado cluster. Naturalmente, é preciso uma placa mãe especial para usar mais de um processador. 14 Posteriormente foi lançado também o Pentium III Xeon, com as mesmas opções de cache, e em fregiiências de até 550 MHz. Porém, a Intel teve dificuldades em lançar versões mais rápidas deste processador, que acabou saindo de linha, sendo substituído pelo Pentium III Xeon e mais recentemente pelo Xeon, bascado no Pentium 4. :. Celeron Depois que lançou o Pentium II, no início de 98, a Intel abandonou a fabricação do Pentium MMX, passando a vender apenas processadores Pentium II que eram muito mais caros. Como prova a história, a estratégia não deu muito certo, pois no por ser mais caro, o Pentium II perdeu boa parte do mercado de PCs de baixo custo para o K6-2 e o Cyrix 6x86, que apesar de terem um desempenho ligeiramente inferior, eram bem mais baratos. Tentando consertar a besteira, a Intel resolveu lançar uma versão de baixo custo do Pentium II, batizada de Celeron, do Latin “Celerus” que significa velocidade. O Celeron original, nada mais era do que um Pentium II desprovido do Cache L2 integrado e do invólucro plástico, responsáveis por boa parte dos custos de produção do Pentium II, ou seja, vinha “pelado”. Celeron de 300 MHz As primeiras versões do Celeron, que incluem todos os de 266 MHz e alguns dos de 300 MHz, não traziam cache L2 algum e, por isso, apresentavam um desempenho muito fraco na maioria dos aplicativos, apesar de ainda conservarem um desempenho razoável em jogos e aplicativos que utilizam muito o coprocessador aritmético. O cache L2 é um componente vital para os processadores atuais, pois apesar da potência dos processadores ter aumentado quase 10 mil vezes nas últimas duas décadas, a memória RAM pouco evoluiu em velocidade. Pouco adianta um processador veloz, se ao todo instante ele tem que parar o que está fazendo para esperar dados provenientes da memória RAM. É justamente aí que entra o cache secundário, reunindo os dados mais importantes da memória para que o processador não precise ficar esperando. Retirando o cache L2, a performance do equipamento cai em quase 40%, só não caindo mais por que ainda conservamos o cache L1. Justamente por isso, além de perder feio para o seu irmão mais velho, o Celeron sem cache perdia até mesmo para processadores menos avançados, como o MMX, o K6 e o 6x86MX. De fato, um Celeron sem cache de 266 MHz perde até mesmo para um 233 MMX em muitas aplicações. Devido ao seu baixo desempenho, o Celeron sem cache não conseguiu uma boa aceitação no mercado, sendo inclusive muito criticado pela imprensa especializada. Numa nova tentativa de consertar a besteira cometida, a Intel resolveu equipar as novas versões do Celeron com 128 KB de cache L2, que ao contrário do cache encontrado no Pentium II, funciona na mesma frequência do processador. Todos os Celerons à venda atualmente possuem cache, isto inclui todas as versões apartir do Celeron de 333 MHz e a maioria dos de 300 MHz. Para não haver confusão, a versão de 300 MHz com cache é chamada de 3004. Enquanto no Pentium II o cache é formado por chips separados, soldados na placa de circuito do processador, no Celeron o cache L2 faz parte do próprio núcleo do processador. Estes 128 KB de cache fazem uma diferença incrível na performance do processador. Enquanto um Celeron antigo é quase 40% mais lento que um Pentium II do mesmo clock, o Celeron com cache é menos de 6% mais lento, chegando a empatar em algumas aplicações. Isto acontece pois apesar Celeron possuir uma quantidade 4 vezes menor de cache, nele o cache L2 funciona duas vezes mais rápido, compensando em grande parte a diferença. Claro que isso também depende do aplicativo que estiver sendo executado. Alguns programas, como o Word por exemplo, necessitam de uma grande quantidade de cache. Neste caso, mesmo sendo mais lento, o cache do Pentium II acaba sendo muito mais eficiente por ser maior. Em compensação, aplicativos que manipulam imagens em geral necessitam de um cache L2 mais rápido, pois os dados a serem manipulados são menos repetitivos. Neste caso, o cache do Celeron acaba sendo tão ou até mesmo mais eficiente do que o cache encontrado no Pentium II. Outro ponto a favor do Celeron é seu coprocessador aritmético, que, sendo idêntico ao do Pentium II, é muito mais rápido que o do MMX ou do Kó6, o que lhe garante um ótimo desempenho em aplicações gráficas. Porém, comparado com o Pentium III, o Celeron já fica bem atrás, já que o Pentium III está disponível em versões com clock bem maior. Claro que em termos de processador de baixo custo o Celeron continua sendo uma ótimo opção. O Celeron com cache está existe em versões de 300 a 766 MHz. :. Soquete 370 x Slot 1 16 Basicamente, as instruções SSE diferem das instruções 3D-now! dos processadores AMD devido à forma como são executadas. A vantagem, é que o Pentium III é capaz de processar simultaneamente instruções normais e instruções SSE, o que resulta em um ganho ainda maior de performance. Enquanto no 3D-Now! o programa tem a todo momento que escolher entre utilizar uma das instruções padrão, ou uma das instruções 3D-Now!, no Pentium III é possível usar os dois tipos de instruções simultaneamente, mantendo as três unidades de execução do coprocessador aritmético cheias durante mais tempo. :. As versões: Katmai x Coppermine; 100 x 133 MHz As primeiras versões do Pentium III, de 450, 500, 550 e 600 MHz, foram construídas usando a mesma técnica de fabricação do Pentium II, ou seja, utilizando o mesmo encaixe Slot 1, a mesma voltagem de 2.0v, os mesmos 512 KB de cache L2 à metade da fregiência do processador e o mesmo cache L1 de 32 KB e barramento de 100 MHz. Em essência, não temos nada mais do que um Pentium II com instruções SSE. Isto significa que, em aplicativos que não foram otimizados para as novas instruções, o desempenho apresentado por estas versões será rigorosamente o mesmo apresentado por um Pentium II do mesmo clock. A arquitetura (ou core) utilizada nestes processadores recebe o nome código de Katmai. As próximas versões do Pentium II foram as 533B e 600B. Assim como as anteriores, estas versões continuam utilizando o core Katmai, a diferença é que enquanto as versões anteriores utilizavam placas mãe com barramento de 100 MHz, as novas versões utilizam placas mãe com barramento de 133 MHz. A versão 533A opera a 4x 133 MHz enquanto a 600A opera a 4,5x 133 MHz. O barramento de 133 MHz vale apenas para a placa mãe e memória RAM; todos os demais componentes do micro, como placas de vídeo, HDs etc. continuam operando à mesma frequência que a 66 ou 100 MHz. Por exemplo, o barramento PCI, que é utilizado pelos discos rígidos, placas SCSI e algumas placas de vídeo, som e modems, opera sempre a 33 MHz, independentemente da fregiência da placa mãe ser 66 MHz, 100 MHz ou 133 MHz. Na verdade, apenas temos a fregiiência da placa mãe dividida por respectivamente 2, 3 e 4, resultando sempre nos 33 MHz padrão. O barramento AGP que é utilizado por placas de vídeo AGP opera sempre a 66 MHz, temos então a frequência da placa mãe dividida por 1, 1.5 ou 2. Como apenas a memória RAM trabalha mais rápido, o ganho de performance utilizando barramento de 133 MHz é bem pequeno, geralmente ficando abaixo de 3%. Em compensação, você precisará comprar uma placa mãe capaz de operar a 133 MHz e também módulos de memória PC-133, capazes de acompanhá-la. Todas as versões seguintes do Pentium III, o que inclui as verões de 650, 667, 700, 733, 750, 800, 850 e 900 MHz; 500E, 550E, 600E, 533EB, 600EB, 800EB além, claro, da versão de 1 GHz, utilizam uma arquitetura mais avançada, chamada de Coppermine. Esta nova arquitetura traz vários avanços sobre a Katmai, utilizada nos processadores anteriores. Para começar, temos transistores bem menores, medindo apenas 0.18 mícron (contra 0.25 do core Katmai). Transístores menores geram menos calor, o que permite lançar processadores mais rápidos. Enquanto utilizando o core Katmai, o limite foi o Pentium III de 600 MHz, utilizando o core Coppermine já temos processadores de até 1 GHz. Transístores menores também ocupam menos espaço, o que permite incluir mais componentes no núcleo do processador; chegamos então ao segundo avanço. Enquanto no Pentium II e no Pentium III core Katmai o cache L2 é soldado na placa de circuito acoplada ao processador, sendo composto por dois chips separados, operando à metade da fregiiência do processador, no core Coppermine ele foi movido para dentro do núcleo do processador, como no Celeron. Isto permite que o cache L2 opere na mesma fregiência do processador, ao invés de apenas metade, melhorando bastante o desempenho. O único porém, é que, no core Coppermine, o cache L2 possui apenas 256 KB, metade do encontrado nas versões anteriores do Pentium III. Mas, lembre-se que com míseros 128 KB de cache L2 full-speed o Celeron consegue bater um Pentium Il e muitas aplicações. Os processadores baseados no core Coppermine tem o dobro de cache L2 que o Celeron, fazendo com que seu desempenho literalmente pulverize as versões anteriores do Pentium III equipadas com cache mais lento. 1. FC-PGA? Em seu curso de desenvolvimento, o Pentium III acabou seguindo o mesmo caminho do Celeron, tendo seu cache L2 incorporado ao núcleo do processador. A fim de cortar custos, a Intel resolveu lançar versões do Pentium III Coppermine no mesmo formato PPGA (que usa o soquete 370) do Celeron. Por um lado isto é bom, pois permite uma diminuição de até 15 dólares no custo final de cada processador, já que não é usada mais a placa de circuito, mas por outro é ruim, pois nos obriga a comprar um adaptador para poder encaixar um destes processadores em uma placa mãe Slot 1. No caso do Pentium III Coppermine, o novo encaixe é chamado de FC-PGA. Existem algumas placas mãe, que possuem ambos os encaixes, permitindo encaixar qualquer um dos dois tipos de processador sem necessidade de adaptador. Naturalmente, apenas um dos encaixes poderá ser usado de cada vez. :. Entendendo as variações do Pentium III Como vimos até aqui, existem várias variações do Pentium III, quanto à voltagem, quanto à arquitetura, quanto à fregiiência de barramento e quanto ao encaixe. À primeira vista, tudo parece muito confuso, mas depois de uma olhada mais demorada, você verá que é relativamente simples. 17 Na tabela a seguir estão marcados os recursos de cada versão do Pentium III. Logo a seguir virão mais algumas explicações. Versões de 667 e 733 MHz, versões 533EB, 600EB, 800EB e versão de 1 GHz Versões de | Versões Versões de 650, , Sm Gn o Versões o / 450, 500, 550 e) 533B e SODE e 550E 700, 750 e 800 MHz 600 MHz 600B e versão 600E Katmai | Katmai | Coppermine | Coppermine | Coppermine Apenas | Apenas FC- | Versões Slot1l e FC- Apenas Slot 1 Slot 1 PGA PGA Versões Slot 1 e FC-PGA Sim Não Sim Sim Não Não, todas as Não, todas as ' versões usam | Não, todas as versões n versões usam bus! Sim | us de 100 | usam bus de 100 MHz Sim de 100 MHz MHz 512 KB 512 KB 256 KB 256 KB 256 KB half-speed half-speed | full-speed full-speed full-speed Não Não Sim Sim Sim A sigla “E” diferencia os processadores com core Coppermine dos com Core Katmai no caso de versões do mesmo clock, como no caso das versões de 500, 550 e 600 MHz. No caso, os processadores com o “E” são os com core Coppermine. A sigla “B” (“B” de bus, ou barramento) indica processadores com bus de 133 MHz, enquanto a combinação “EB” indica processadores que ao mesmo tempo utilizam o core Coppermine e utilizam bus de 133 MHz, como no caso da versão EB de 800 MHz. Veja que em geral estas siglas são utilizadas para diferenciar processadores do mesmo clock, não sendo usadas no caso dos processadores de 667 e 733 MHz por exemplo, já que todos utilizam bus de 133 e core Coppermine. :. AMD Athlon Com o lançamento do Athlon, ou K7, como alguns preferem chamar, a AMD mostrou que tem força para competir não apenas no mercado de processadores de baixo custo, como na época do K6-2, mas disputar também no ramo de chips de auto desempenho. O Athlon é um projeto completamente remodelo, está para o K6-2, seu antecessor, assim como os Pentiums II e III estão para o Pentium antigo. Do ponto de vista do desempenho, a principal vantagem do Athlon sobre seu antecessor é o coprocessador aritmético, que foi bastante aperfeiçoado. Para se ter uma idéia, enquanto o coprocessador aritmético do K6-2 é capaz de processar apenas uma instrução por ciclo, o coprocessador do Athlon processa até 3 instruções. Claro que na prática o desempenho não chega a triplicar, pois existem vários outros fatores, como a latência, número de estágios de pipeline, etc., mas serve para ilustrar o avanço. Mesmo comparado com o Pentium III, o Athlon leva vantagem neste quesito, pois o Pentium III é capaz de processar apenas 2 instruções por ciclo. Isso explica o bom desempenho do Athlon em alguns aplicativos, como por exemplo o 3D Studio. Porém, como compensação, o Pentium III tem as instruções SSE, que são bem mais poderosas que as instruções 3D-Now! do Athlon. Isto assegura que nos aplicativos otimizados o Pentium III possa superar o Athlon em desempenho, como acontece por exemplo no jogo Quake 3. Na média os dois processadores ficam mais ou menos no mesmo nível, cada um levando vantagem em algumas áreas. A vantagem do Athlon é o fato de ser mais barato que um Pentium III da mesma frequência e estar disponível em clocks maiores. Observação Importante: Hoje em dia temos processadores muito mais modernos, que trabalham com dois núcleos, os modelos mais comuns e conhecidos dessa linha se chamam Core 2 Duo (com núcleo duplo), mas existe também um modelo Core 2 Quad (com núcleo quádruplo) e os modelos Core 2 Extreme ("high end"). Os primeiros processadores Core 2 tinham os nomes de código "Conroe" (para micros desktop) e "Meron" (para portáteis), mas depois foram lançados o "Allendale" (um Conroe com menos memória cache) e o "Kentsfield" (um Conroe "duplicado", para formar o núcleo quádruplo). Apesar do "Woodcrest", processador para servidores e estações de trabalho, ser bascado na mesma arquitetura do Core 2, ele foi batizado com a marca Xeon, que já era usada pela Intel para este segmento. Versões Assim como o Pentium III existe em duas arquiteturas diferentes, Katmai e Coppermine como vimos anteriormente, o Athlon também pode ser encontrado em duas versões. 19 Lembre-se que para usar o Duron, assim como os Athlons mais novos, você precisará de uma placa Soquete A, as placas Slot A usadas pelos Athlons antigos não servem. :. Pentium 4 Depois de vários atrasos, finalmente o Pentium 4, conhecido anteriormente como Willamette chega ao mercado. As duas versões iniciais operam a respectivamente 1.4 e 1.5 GHz, estando anunciadas versões de até 2 GHz até o final de 2001. O preço também não fica muito atrás. Outro ponto interessante sobre o Pentium 4 é que inicialmente, o único chipset disponível, o 1850 da própria Intel suporta apenas memórias Rambus, o que obriga qualquer um interessado em adquirir um Pentium 4 a adquirir também módulos de memória Rambus (veja mais detalhes no tópico sobre memória RAM). A boa notícia é que finalmente as memórias Rambus estão começando a chegar ao mercado com preços digamos aceitáveis. Nos EUA um módulo RIMM de 64 MB custa em média 99 dólares, contra 45 dólares em média por um módulo de 64 MB de memória PC-133. Ainda custa pelo menos o dobro, mas já é bem menos do que custava a alguns meses atrás. Lembrando que como veremos adiante, os módulos RIMM devem ser usados em pares no Pentium 4. A Via já divulgou planos de produzir um chipset que permita utilizar memórias DDR SDRAM em conjunto com o Pentium 4. Como as memórias DDR são mais baratas que as memórias Rambus, as novas placas mãe permitiriam baratear os micros equipados com o Pentium 4. :. A Arquitetura O primeiro alerta a se fazer sobre o Pentium 4 é que o aumento da fregiiência de operação não significa um ganho automático de potência. Um Pentium 4 de 1.5 GHz não é 50% mais rápido que um Pentium 3 de 1 GHz. Um dado é o número de ciclos por segundo que o processador pode executar, outro é o que ele consegue processar em cada ciclo. Um 486 de 100 MHz por exemplo é muito mais lento que um Pentium de 75 MHz, apesar de operar a uma fregiiência mais alta. Para entender os pontos fortes e fracos do Pentium 4, onde ele é mais rápido e onde ele é mais lento, por que não começar analisando a arquitetura interna do processador? A Intel batizou a nova arquitetura do Pentium 4 de “NetBurst”. O Nome não tem nada a ver com o desempenho em redes ou na Internet, mas tenta ilustrar os novos recursos do processador, assim como dar um ar de superioridade. A arquitetura NetBurst é composta por 4 componentes: Hyper Pipelined Technology, Rapid Execution Engine, Execution Trace Cache e Bus de 400MHz. Vamos aos detalhes de cada uma das 4 tecnologias: :. Hyper Pipelined Technology Esta é a característica mais marcante do Pentium 4. O Pipeline é um recurso que divide o processador em vários estágios, que trabalham simultaneamente, dividido o trabalho de processar as instruções. E como uma linha de produção com vários operários, onde cada um monta uma peça, até termos no final o produto completo. Apartir do 486, todos os processadores utilizam este recurso. O Pentium III possui 10 estágios, o Athlon possui 11 estágios, enquanto o Pentium 4 possui nada menos que 20 estágios, daí o nome “Hyper Pipelined”. O uso de Pipeline permite que o processador possa processar várias instruções ao mesmo tempo, sendo que cada estágio cuida de uma fração do processamento. Quanto mais estágios, menor será o processamento executado em cada um. No caso do Pentium 4 cada estágio do Pipeline processa apenas metade do processado por um estágio do Pentium III, fazendo com que teoricamente o resultado final seja o mesmo, já que em compensação existem o dobro de estágios. O uso de mais estágios permite que o processador opere a fregiências bem mais altas, já que cada estágio executa menos processamento. O grade problema neste caso é que os processadores atuais executam várias instruções simultaneamente, enquanto os programas são uma segiência de instruções. O Pentium 4 processa três instruções por ciclo, o Pentium antigo (Pentium 1) processa duas, e assim por diante. Caso as instruções seguintes não dependam do resultado da primeira, como uma seguência de somas de vários números, por exemplo, então o processador não terá nenhum problema para resolvê-las rapidamente. Caso porém tenhamos uma tomada de decisão, onde o processador precisa primeiro resolver uma instrução para saber qual caminho deve tomar, como por exemplo “Se A > 3 então B=C+5 senão B=C-S”, entra em cena o recurso de execução especulativa, onde enquanto é resolvida a primeira instrução, o processador escolhe um dos caminhos possíveis para ir “adiantando o serviço” enquanto não sabe qual deverá seguir. Se ao saber o resultado da primeira instrução ver que tomou o caminho certo, simplesmente continuará apartir dali. Caso por outro lado o processador tenha adivinhado errado, então terá que jogar fora todo o trabalho já feito e tomar o outro caminho, perdendo muito tempo. O Pentium 4 perde nesse quesito, pois ele demora o dobro do tempo para processar a primeira instrução, já que ela é processada em 20 estágios, contra 10 do Pentium III. Isto significa que a cada tomada de decisão errada, serão perdidos pelo menos 20 ciclos de processamento, um eternidade, considerando que em média, 14% das instruções processadas são de tomada de decisão. Se 20 por acaso o processador errasse 50% das previsões, então os 7% de erros de previsão resultariam numa diminuição de 30% do desempenho do processador em comparação com o antigo Pentium TI. Isto significa que a princípio o Pentium 4 é mais lento que um Pentium III do mesmo clock, podendo em compensação operar a frequências mais altas. Todas as demais alterações feitas pela Intel, explicadas a seguir servem como paliativos para tentar diminuir a perda de desempenho trazida pelo maior número de estágios de Pipeline. Foi justamente devido a isto que a Intel optou por lançar diretamente os modelos de 1.4 e 1.5 GHz, pulando as versões de 1.1 e 1.2 GHz, que seriam o caminho mais óbvio já que o Pentium III ficou estacionado na versão de 1 GHz. Caso fosse lançado, um Pentium 4 de 1.1 GHz perderia para um Pentium III de 1 GHz em praticamente todas as aplicações. Além da perda de desempenho, outro efeito colateral de se usar mais estágios de Pipeline é o fato de tornar o processador maior e mais complexo, fatalmente bem mais caro de se produzir. O Pentium 4 mede 217 milímetros quadrados, quase o dobro do Athlon, que mede 120 mr, Isto significa que o Pentium 4 é proporcionalmente mais caro de se produzir, o que se reflete nos preços ao consumidor. :. Execution trace Cache O uso do cache LI no Pentium 4 é no mínimo inovador. O Pentium 3 por exemplo tem 32 KB de cache LI, dividido em 2 blocos de 16 KB cada, para instruções e dados. O Athlon tem 128 KB de cache LI, também dividido em dois blocos. O Pentium 4 por sua vez tem apenas 8 KB de cache para dados e só. Só? Sim, só isso. Porém, ele traz duas inovações que compensam esta aparente deficiência. A primeira é que graças ao tamanho reduzido, o pequeno cache de dados tem um tempo de latência menor, ou seja é mais rápido que o cache L1 encontrado no Pentium III e no Athlon. Do ponto de vista dos projetistas da Intel, esta foi a melhor relação em termos de desempenho. O cache de instruções por sua vez foi substituído pelo Execution trace Cache, que ao invés de armazenar instruções, armazena diretamente uOPs, que são as instruções já decodificadas, prontas para serem processadas. Isto garante que o cache tenha apenas um ciclo de latência, ou seja o processador não perde tempo algum ao utilizar um dados armazenado no trace cache, ao contrário do que acontecia no Pentium III, onde perdia-se pelo menos dois ciclos em cada leitura. Se você está em dúvida sobre o que é um “uOP”, e como eles são produzidos e processados, aqui vai uma explicação resumida: Apesar dos processadores para micros PC continuarem usando o conjunto x86 de instruções, que é composto por 184 instruções, internamente eles são capazes de processar apenas instruções simples de soma e atribuição. Existe então um circuito decodificador, que converte as instruções complexas usadas pelos programas nas instruções simples entendidas pelo processador. Uma instrução complexa pode ser quebrada em várias instruções simples. No Pentium 4, cada instrução simples é chamada de “uOP”. No Athlon cada conjunto de duas instruções ganha o nome de “macro-ops”. :. Bus de 400 MHz Visando concorrer com o bus EV6 do Athlon, que opera de 100 a 133 MHz, com duas transferências por ciclo, o que resulta na prática em fregiiências de respectivamente 200 e 266 MHz, o Pentium 4 conta com um bus operando a 100 MHz, mas com 4 transferências por ciclo, o que equivale a um barramento de 400 MHz. O barramento controla a velocidade de comunicação entre o processador e o chipset. Um barramento mais rápido, não significa um ganho automático de performance, porém, um barramento insuficiente, causará perda de desempenho, fazendo com que o processador não consiga comunicar-se com os demais componentes à velocidade máxima. :. Rapid Execution Engine Todo processador atual é dividido em dois componentes básicos, as unidades de execução de inteiros e as unidades de ponto flutuante. A parte que processa as instruções envolvendo números inteiros é responsável pela maior parte das instruções, e pelo desempenho do processador nos aplicativos do dia a dia enquanto as unidades de ponto flutuante, que compõe o que chamamos de coprocessador aritmético é responsável pelo processamento das instruções envolvendo valores complexos, usadas por jogos e aplicativos gráficos. A “Rapid Execution Engine” do Pentium 4 consiste num reforço nas unidades de inteiros do processador. O Pentium 4 possui um total de 5 unidades de processamento de inteiros, duas ALUs, que processam as instruções mais simples, duas GLUs, encarregadas de ler e gravar dados e uma terceira ALU, encarregada de decodificar e processar as instruções complexas, que embora em menor quantidade, são as que tomam mais tempo do processador. Este conjunto de 5 unidades de execução de inteiros é semelhando ao do Pentium III, porém, como diferencial, no Pentium 4 tanto as duas ALUs encarregadas das instruções simples, quanto as duas GLUs encarregadas das leituras e gravações são duas vezes mais potentes. Na teoria parece maravilhoso, mas existe um pequeno detalhe que elimina boa parte do ganho que seria de se esperar deste esquema. Apesar das duas ALUs de instruções simples terem ficado mais rápidas, visando justamente compensar a perda de desempenho trazida pelos 20 estágios de Pipeline do Pentium 4, a ALU de instruções complexas não teve a mesma evolução. Isto significa que ao passar a usar 20 estágios de Pipeline, esta terceira ALU tornou-se mais lenta que a mesma no Pentium III.