3つの主要なサーバハードウェア障害

  

今日、X86サーバプラットフォームのCPUについて話すとき、多くの人が以前のXeon 5400から主流に至るまで、IntelとAMDの2チップ大手から多くの製品を持っているかもしれません。強力な5600、Xeon 7500、およびAMDの強力な12コアx86プロセッサ「Magny-Cours」(Manicourt)など。同時に、データの損失を防止するECC、ChipKill、ホットスワップ対応テクノロジ、およびRAIDハードディスクを搭載したコンポーネントを組み合わせて作成することで、堅牢なX86サーバーを構築することができます。

しかし、X86サーバーとデスクトップの間には多くの類似点があるため、展開前から中期的な保守管理、さらには管理後まで、多くの類似点があります。したがって、X86サーバーは成熟した安定したアーキテクチャーを持っていますが、必然的に「攻撃する」ように見えます。 3つの主要コンポーネントの障害を共有して全員と共有することで、全員が将来のビジネスプラットフォームに登場することを効果的に防ぐことができます。

Server Core - CPU

ハザードレベル:★★

フォルト再生:テストをしたことのある友人は、Intel Xeonサーバーをベースにしていることを知っています。最も直接的な疑いは、CPUがマザーボードとの接触が不良だが、マルチサーバーマザーボードの別のCPUソケットに交換されたことです。

解決策:この状態では、CPUの電圧が異常で、元のCPUのVRM(Voltage Regulator Module)が故障しており、マザーボード上のDC回路変換を実行できません。 CPUには安定した動作電圧が供給されるので、CPUのみを交換することができる。

この障害は比較的致命的なものであり、CPUの損傷は直接サーバー全体の利用不能につながると考えていますが、CPU自体のセキュリティは非常に高く、故障率は非常に低くなっています。したがって、日常の保守作業では、CPUの損傷によるサービスの中断は比較的まれであり、害の程度は高すぎません多方向サーバーであれば、CPUの損傷によるサーバーのクラッシュを心配する必要はありません。

サーバプラットフォームの他の2つのコアはメモリとハードディスクですが、メモリ、サーバメモリ、通常のデスクトップメモリ​​の選択には、まだいくつか違いがあります。サーバメモリを注意深く観察したことのあるユーザは、通常のメモリの片面8パーティクル設計と比較して、サーバメモリの片側には通常9個のチップがあることに気付くでしょう。

サーバー読み取りパフォーマンス - メモリ

ハザードレベル:★★☆

フォルト再生:以前は2 2 GBのRAMが搭載されていたサーバー、上に独自の機能を備えていますサービスが多すぎると、サーバーはデータの処理を速くしたり遅くしたりするため、同じモデルのメモリモジュールを2つ追加してサーバーをアップグレードします。マザーボードにこれらのメモリをすべて挿入した後、システムは6GBしか検出せず、残りの2GBのメモリは不思議なことに消えますが、新しいメモリはまだ正常に検出できません。

解決策:この状況は、サーバー製品の公式Webサイトでは、サーバーのメモリスロットが1〜4、2〜5、3〜6、7〜10、8〜11のペアになっているためです。 9〜12、新しいメモリが2、3スロットに挿入され、ペアリングを形成することはできません、当然1つだけのメモリを検出することができ、メモリは5スロットに挿入され、8GBのメモリが正常に検出されます。

サーバーメモリの利点は、パフォーマンスに反映されるだけでなく、フォールトトレランスにも多大な努力を払うことであることがわかりますこの目的は、プラットフォーム全体の安定性の高い環境を提供することです。 Technology、Register、Chipkillは、メモリの安定性を向上させることで、さまざまなメモリモジュールとスロット間の統合を可能にします。

サーバーのストレージ端末として、ハードディスクの安定した運用は企業データのセキュリティに関係しており、サーバーのハードディスクはデータの中心的な倉庫であり、すべてのソフトウェアとデータはここに保存されます。非常に高い要件があります。

さらに、サーバーは通常24時間×7時間の無停止操作を必要とし、そのハードディスクも24時間稼働する必要があります。したがって、サーバーのハードドライブには、安定性と信頼性に対する高い要件があります。サーバ市場で使用されているハードディスクには、SATAハードディスク、SCSIハードディスク、SASハードディスクの3種類があり、中でもSATAハードディスクはローエンドサーバに使用されるのに対し、SCSIハードディスクおよびSASハードディスクはミディアムおよびハイエンドサーバをターゲットにしています。

Server Storage Core - ハードディスク

ハザードレベル:★★☆

フォルトプレイバック:各サーバーは警告なしにクラッシュして再起動します。データセンターのIT運用保守担当者によるテストの後、ハードディスクの作業時間が長すぎ、物理的な不良セクタが発生していることがわかりました。ハードディスク内のデータがエクスポートされるため、データ転送中にI /Oエラーが頻繁に発生し、データ転送速度が非常に遅くなったり失われたりする原因となります。たくさんの重要なデータ。

解決方法:ほとんどの場合、ヘッドまたはディスクのエラーです。ハードディスクの大皿に傷が付いていても面積が大きくない場合、専門会社は磁気ヘッドを交換してデータの95%以上を復元することでデータを復元できますが、この状況は比較的幸運です。

しかし、予防は不可能であると言われていますが、時間内に障害が発見されれば、物理的な損傷がなくなる前に解決され、深刻な損傷を受けるとデータは永久に失われます。次の手順を実行することをお勧めします。

ハードディスクの選択には、次のようなプロフェッショナルなサーバーハードディスクが必要です。平均故障間隔は160,000時間以上、年間故障率は0.55%未満、耐震性は300G /サーバーRAIDアレイテクノロジの適用に加えて、2ms以上の耐衝撃性など、少なくとも3台のハードドライブで構成されているRAID 5、データ情報をハードディスクに書き込んでいる間に検証情報も書き込む1台のハードディスクが故障した場合、故障したハードディスクのデータを他の2台のハードディスクからアルゴリズムに従って取得することができ、セキュリティが大幅に向上します。

上記の3つのコンポーネントの欠点は、ほんの簡単な紹介ですが、実際には、サーバーの障害はこれらの点に限定されず、電源、管理モジュール、ネットワークカードにも同様の問題があります。経験を蓄積し、失敗の発生率を最小限に抑え、安定した柔軟なITアプリケーション環境を提供します。
zh-CN"],null,[1],zh-TW"]]]

Copyright © Windowsの知識 All Rights Reserved