Windows system >> Windowsの知識 >  >> コンピュータソフトウェアのチュートリアル >> サーバー技術 >> サーバーについて >> メモリ障害が原因でサーバーが異常に動作する

メモリ障害が原因でサーバーが異常に動作する

  

症状]
LAN内の1台のサーバーにIntelPentium®プロセッサが搭載されている。これは正常に動作するが、最近ブルースクリーンが表示されることがよくあります。クラッシュが発生し、管理作業を正常に実行できませんでした。クラッシュしたときにサーバをシャットダウンし、SDRAMを元の12 8 MBから512 MBにアップグレードし、システムのCMOS設定に最適なパラメータ設定をロードすることを選択しました(つまり「LOAD BIO SDEFAULTS」を選択します)。 ")、メモリの各ユニットを検出しています。セットアップを完了し、サーバーを再起動した後、メモリチェックは正常ですが、セットアップは再セットアップする必要があることを画面に表示し、指定された「F2」ボタンをクリックしてからクラッシュします。


診断プロセス

操作を追加した後に問題が発生したため、新しく追加したデバイス自体に物理的な障害があるかどうかを確認してください。またはデバイスの設定に誤りがあります。そのため、障害原因を絞り込むという考えに従って、サーバー内の既存のメモリモジュールを元の状態に戻し、フロッピーディスクドライブ、ハードディスク、オプティカルドライブなどのデバイスを一度に1つずつ取り外してチェックしました。その結果、システムのさまざまなハードウェアデバイスに障害がないことがわかりました。そのため、ハードウェア障害は除外されます。角度を変更して再度確認する必要があるようです。

システムが起動後にSETUPの再起動を促すので、この現象に従って分析します。システムのSETUP設定、特にメモリの各ユニットを検出する設定に関連している可能性があります。確認の方向を決定した後、私はサーバーの電源を切りました。それからバッテリーを引き抜いてバッテリーピンをショート放電させてください、しかしチェックした後でそれでも問題を解決することができません。マザーボードを見つけてCMOSジャンパー設定をクリアし、ピンラインを1から2に2から3に変更してから、しばらくして元の位置に戻った。その結果、システムは通常に戻り、他のプロンプトは表示されません。メモリはまだアップグレードされており、CMOS SETUP設定は調整されています、特に、メモリ検出はすべてのMBを検出するように設定され、システムは完全に復元されます。

失敗の根本的な原因は、取り付けられているメモリ設定のサーバーによる検証が、メモリ自体のサポート方法と一致しないことです。ネットワーク管理はネットワークの接続状態を心配するだけでなく、ネットワークで使用されるすべてのデバイスにもっと注意を払うようです。

除外

1メモリ検証方法。

この失敗の原因は、サーバーメモリのデフォルト設定がECC(チェックサムあり)であり、メモリの各ユニットがシステムCMOSで検出されるように設定されているが、アップグレードに使用される通常のメモリがそうではないためです。この操作はサポートされているため、上記の障害が発生します。このような問題をトラブルシューティングするための鍵は、CMOS設定をクリアし、関連するパラメータ設定を調整することです。

実際には、メモリの一般的な検証方法は3つあります。以下にその概要をまとめます。

ビットの概念から、メモリのパリティ(Parity)の場合、ビットはメモリ内の最小単位であり、 "ビット"とも呼ばれ、それぞれ1と0で表される2つの状態を持ちます。 。連続した8ビットを1バイトと呼ぶことを規定しています。非パリティメモリの各バイトは、そのビットの1つが間違った値を格納している場合、8ビットしかありません。それに格納されている対応するデータが変更され、アプリケーションエラーが発生します。パリティメモリは、エラー検出のために各バイト(8ビット)に1ビットを追加します。例えば、1バイトに「10011110」というバイトが格納され、その値の各ビット、すなわち1 + 0 + 0 + 1 + 1 + 1 + 1 + 0−5が加算され、結果が奇数の場合、パリティビットは1と定義される。 CPUが格納されたデータを読み込むと、最初の8ビットに格納されているデータを再度追加します。計算結果はチェックディジットと一致します。 CPUが2つが異なることを検出すると、反応します。これで、マザーボードは両方のメモリブロックをパリティ付きまたはパリティなしで使用できますが、2つを混在させることはできません。

とECC(Error Chechng and CorreCting)メモリは、元のデータビットにビットを追加することによっても実装されています。たとえば、8ビットデータでは、ドライパリティテストに1ビット、ECCに5ビットが必要で、残りの5ビットは誤ったデータを再構築するために使用されます。データのビット数が2倍になればパリティも2倍になり、ECCを1ビット増やすだけでよく、データが64ビットであればECCと使用ビット数は同じ(どちらも8)である。パリティがエラーしか検出できない場所では、ECCはほとんどのエラーを訂正できます。正常に動作していれば、データに欠陥があるとはみなされず、メモリのエラー訂正後に初めてコンピュータの操作指示を続けることができます。

SPD(Serial Presence Detecl)、8ピンSOICパッケージ(3mm x 4mm)、256バイトEEPROM(電気的消去可能プログラマブルROM EEPROM) )チップ。ほとんどのモデルは24LC01Bで、位置は一般にメモリモジュールの前面の右側にあり、速度、容量、電圧、メモリの行と列のアドレス帯域幅などのパラメータが記録されています。起動すると、PCのBIOSが自動的にSPDに記録されている情報を読み取りますが、SPDがない場合はクラッシュまたは致命的なエラーが発生する可能性があります。これはPC100メモリの重要な指標です。製造コストを削減するために、個々のハードウェア製造業者は表面のPC100規格に準拠しなければならないので、彼らはPCB上の空のSPDをはんだ付けします。

2 CMOSに最適なパラメータをロードする方法。

また、このフォルトには最適なパラメータ設定がロードされています。 CMOS SETUPに最適なパラメータをロードするには、通常2つの設定があります。1つはシステム全体を最適化することができますがシステムサポートを必要とするため安定性を保証できないSETUP最適化パラメータです。最も安定性の高いパラメータが一般的に推奨されます。システムに障害が発生した場合は、最適な安定性パラメーターをロードして問題を解決してから回復することをお勧めします。トラブルシューティングで使用される放電操作の目的は、CMOS設定のクリアを容易にすることです。

Copyright © Windowsの知識 All Rights Reserved