|
Manutenção e hardware de computadores. Textos escritos por Robson Faria para você que é técnico estudante ou profissional. Aborda sempre assuntos interessantes e que tiram aquelas dúvidas que todos têm.
|
|
Volte sempre para conferir as novidades adicionadas ao site.
|
|
Pentium 4.
Leia esta matéria e fique por dentro do Pentium 4.
O mais novo processador da Intel, o Pentium 4, lançado em 20 de novembro de 2000 com surpreendentes freqüências de 1.4 e 1.5 GHz, e que hoje já chegam a incríveis 3 GHz, possui muitas inovações, mas como todos os processadores também possui seus pontos fracos.
Um dos pontos fortes dessa CPU é o excepcional barramento frontal que trabalha em QDR. Isso mesmo, QDR, o dobro do padrão DDR. Com uma freqüência de 100 MHz, a taxa efetiva de transmissão de dados fica em 400 MHz e com 133 MHz, a taxa efetiva vai para 532 MHz. Nada mal. Há algum tempo atrás os processadores é que trabalhavam nessa freqüência.
Outra grande inovação dos P4 é o Trace Cache, como é chamado o cache L1 de instruções nesse processador. Os I-caches comuns armazenam as instruções inteiras. Quando elas vão ser executadas elas passam primeiro pelo decodificador de instruções, são transformadas em uOPs, e depois seguem para as unidades de execução. No I-cache do P4 as instruções já são armazenadas como uOPs, o que diminui a Pipeline e torna o processamento mais rápido.
O Pentium 4 realmente veio cheio de novidades. Outra inovação foi o cache L1 de dados, com seus pequenos 8 KB. O do Athlon possui 64. Isso é justificado porque esse cache tem latência de 2 ciclos, ao contrário de 3 nos Athlon. Diminuir a latência em 33% com o cache L1 trabalhando na mesma freqüência do processador e com as freqüências nos patamares atuais sem dúvida foi um grande feito da Intel. Isso torna o cache muito mais rápido. No entanto isso é um paradoxo, porque um cache tão pequeno exige requisições constantes ao L2, que possui latência bem maior. Esse cache L1 do P4 também possui uma associatividade bem grande, o dobro dos Athlon, mas isso também não compensa muito, porque o cache dos Athlon tem a associatividade menor, mas é maior, sempre vai haver mais dados disponíveis para o processador, mesmo com uma taxa de acertos menor. Isso realmente dá dor de cabeça. Só testes e mais testes para verificar o que compensa mais.
O cache L2 também foi melhorado. Nos Pentium III ele operava na mesma freqüência dos núcleos de processamento, porém os dados trafegavam uma vez a cada dois ciclos. Era o padrão DDR ao contrário. Isto era compensado por dutos de 256 bits. No P4 a largura dos dutos foi mantida, mas as transferências ocorrem normalmente em todos os ciclos. Isso oferece uma vazão máxima impressionante. O cache possui latência de 7 ciclos, contra 11 dos Athlon, mas a associatividade é menor, o que não compensa. “Para variar um pouco”, apesar da vazão máxima imensa, o Athlon fica na frente, porque é necessário o constante acesso a RAM.
Uma técnica interessante e eficaz para conseguir altas freqüências foi empregada no Pentium 4. Esta técnica consiste em aumentar a linha de processamento da CPU, chamada de pipeline. No P4 a pepiline tem 20 ciclos, ou seja, o resultado de uma instrução demora 20 ciclos para ficar pronto e disponível. Isso é quase o dobro dos Athlon, e sem a decodificação graças ao trace cache. Você deve estar sem entender e se perguntando: Como é que aumentando o tempo necessário para se executar uma instrução, pode-se deixar as freqüências maiores e os processadores mais rápidos? Realmente, a princípio não tem lógica, mas não é difícil de entender. As instruções principais, que estão nos programas, são divididas em várias instruções menores chamadas uOPs. Quanto mais as instruções forem divididas e as uOPs ficarem menores, melhor, porque isso diminui o tempo necessário para executar cada uma (uOP), o que diminui também o tempo de cada ciclo, permitindo altas freqüências. O resultado da primeira instrução demora 20 ciclos para ficar pronto, mas os resultados das instruções seguintes vêm imediatamente atrás, com o intervalo de um ciclo, que está menor por causa da divisão das instruções. Isso torna o processamento mais rápido. Não é necessário esperar que uma instrução se processe para começar outra. Quando uma passa do primeiro estágio, a outra já pode chegar no mesmo. É como uma linha de montagem. Entendeu a jogada?
Bem, se não ficou muito claro, funciona assim: Quanto maior for a linha de processamento, menor é o tempo de cada estágio, que é o tempo entre o resultado de uma instrução e outra.
Outra coisa interessante dos P4 é que algumas unidades como a de instruções x86 trabalham em DDR, ou seja, trabalham no dobro da freqüência do processador, outro feito notável da Intel.
Bom, como nada é perfeito, o P4 tem alguns pontos fracos. Talvez o maior deles seja a sua fraca unidade de ponto flutuante, que segundo especialistas, deixa muito a desejar. Para aplicações com PF que exigem muita precisão não é recomendável aos programadores usá-la. O recomendado é usar as outras unidades que também fazem esse trabalho.
Para terminar, o soquete utilizado pelo Pentium 4 é o 478. A primeira geração utilizava o 423 e não era compatível com multiprocessamento.
Robson Faria.
|