Este artigo descreve o estudo abrangente em determinar as
causas de alguns Erros de paridade de memória NMI no Windows com a ajuda de um
testador SIMM de alta tecnologia. Os resultados não são conclusivos, sendo que
a pesquisa nestes erros está em andamento.
Tanto o IBM OS/2.2.x quanto o Windows parecem ter problemas
que aparentam associados à memória de sistema em algumas circunstâncias. Pode
ser algo frustrante ter um sistema capaz de executar DOS, Windows 3.1 ou
OS/2.1.x e, de repente, descobrir que ele não pode executar o Windows devido a
este problema. A primeira questão a ser resolvida é a de que nem todos os erros
NMI ocorrem devido à memória. Placas de terceiros no sistema podem causar este
problema e pode haver a falha dos componentes interligados diretamente na
placa-mãe do sistema.
Quando a memória está com defeito, isso ocorre
geralmente pelos seguintes motivos:
- A memória não está funcionando na taxa de acesso
especificada, conforme solicitado pela placa do sistema. Se a especificação de
sistema solicitar uma taxa de acesso de 80 ns, o Windows certamente falhará se
a memória estiver acessando em uma taxa mais baixa, como 90 ns. Embora os chips
possam ser marcados como 80 ns, alguns falham em atingir esta taxa de acesso
durante o teste. Na maioria das vezes, os chips de memória são executados em
uma velocidade menor quando alcançam a temperatura operacional. Isto produz um
efeito chamado "descompasso de velocidade". Os sintomas são um sistema que
executa o Windows quando ativado pela primeira vez. No entanto, depois de 15
minutos ou mais, o sistema começa a apresentar erros de memória. Um testador
SIMM de alta qualidade pode acionar os chips por meio de vários ciclos de
tensão e de calor, para que isto possa ser observado com muita facilidade.
- A memória atende às especificações do sistema, mas as
velocidades são diferentes entre módulos SIMM individuais. A taxa de acesso
média pode ser de 70 ns em um módulo SIMM, enquanto a seguinte está executando
a 60 ns. Localizamos SIMMs carimbados na fábrica com a taxa de acesso média de
70 ns sendo executados na velocidade de 50 ns. Embora os SIMMs estejam
funcionando obviamente bem na especificação de acesso solicitada pelo sistema,
a diferença de 10 ns ou mais entre eles pode, na maioria das vezes, causar
problemas em alguns sistemas. Uma observação interessante é que, é possível
movê-los para uma placa do sistema diferente que usa um BIOS e um chipset
diferentes, sendo que a BIOS não pode ter nenhum problema de memória. Isto
ocorre porque cada BIOS e chipset regulam os "estados de espera de atualização"
usados para o tempo e esta diferença, em geral, permite que a variação na
velocidade seja aceitável. Se a BIOS do sistema permitir que você ajuste os
"estados de espera" da atualização da memória, isto geralmente permitirá que o
sistema seja executado com os chips de memória SIMM ou DRAM executados em
diferentes taxas de acesso. Os efeitos adversos do aumento no número de estados
de espera é um sistema mais lento.
- Os chips individuais no módulo SIMM são executados em
diferentes taxas de acesso. Isto solicita a determinação de um dispositivo de
teste de memória sensível. Ele deve ser capaz de medir a taxa de acesso de cada
bit individual (chip) no módulo. Descobriu-se que uma diferença de 10 ns ou
mais entre os bits causa problemas. Isto, mais uma vez, pode ser regulado de
alguma maneira pela BIOS e pelo chipset da placa do sistema se a BIOS permitir
que você amplie os estados de espera de atualização do acesso à memória.
- Um dos chips de memória está sendo afetado pelo "vazamento
de célula". Isto acaba se tornando um erro de paridade verdadeiro e é também
conhecido como um "erro simples". Isto ocorre quando a alteração no estado de
uma célula individual (zero ou um) vaza eletricamente em uma célula vizinha,
alterando seu estado. Quando a memória é lida novamente, ela não corresponderá
mais ao valor de soma de verificação do bit de paridade e um NMI é emitido,
indicando que ocorreu um erro de paridade. Este SIMM da memória deve ser
substituído. Se o problema persistir com a substituição dos chips, é bem
provável que haja algum problema de tensão ou aquecimento no soquete ou
circuito que está danificando os chips.
- Deve-se suspeitar também da memória cache. Observamos casos
em que as taxas de acesso da memória cache estavam muito baixas e causaram
enormes problemas. Na maioria dos computadores 486 Intel, uma taxa entre 15 ns
e 25 ns é normal. É provável que haja problemas se ela for menor que 25 ns. O
fabricante do sistema pode fornecer as especificações e os locais destes chips.
Em geral, é necessário em primeiro lugar, limpar cuidadosamente
o sistema, removendo a poeira. Isto inclui as áreas que permitem a ventilação
para evitar que o calor não aumente excessivamente. Os contatos de todas as
placas e SIMMs devem ser limpos. É possível a borracha de um lápis para fazer
isto, assim garantindo que haja bons contatos. Certifique-se de que todas as
placas estejam firmemente encaixadas em seus slots ou soquetes. Pode ser
necessário substituir os cabeamentos mais antigos, que podem estar desgastados
devido ao tempo de uso ou às altas temperaturas. Os sistemas de alimentação
também podem causar vários problemas. Por isso, verifique as voltagens de
saída. Os monitores também podem causar comportamentos estranhos no sistema. É
altamente recomendável que os computadores sejam colocados em algum tipo de
cabo de força de Supressão de Surto, já que, após a ocorrência de interrupção
no fornecimento de energia, a energia pode voltar com um surto de tensão e
danificar permanentemente os componentes elétricos sensíveis do
sistema.
Se você adicionar mais memória física ao sistema, é possível
que a BIOS reconheça a quantidade total de RAM física instalada no servidor,
mas o Windows reconhecerá apenas uma parte da RAM. Se o servidor tiver um
recurso de memória redundante ou um recurso de espelhamento de memória
habilitado, o complemento total da memória pode não estar visível para o
Windows. A memória redundante fornece ao sistema um banco de memória failover
quando um banco de memória falhar. O espelhamento de memória divide os bancos
de memória em um conjunto espelhado. Os dois recursos estão habilitados ou
desabilitados na BIOS e não podem ser acessados pelo Windows. Para modificar as
configurações para estes recursos, pode ser necessário consultar o manual de
usuário do sistema ou o site do OEM. Como alternativa, pode ser necessário
contatar o fornecedor do hardware.
Por exemplo, se você estiver
executando um sistema que possui 4 GB de RAM instalados e adicionar 4 GB de
RAM, o Windows poderá reconhecer apenas 4 GB de memória física ou possivelmente
6 GB do total de 8 GB. O recurso de memória redundante ou o recurso de
espelhamento de memória pode ser habilitado nos novos bancos de memória sem seu
conhecimento. Estes sintomas são semelhantes aos sintomas que ocorrem quando
você não adiciona a opção
/PAE ao arquivo Boot.ini.