Windows system >> Windowsの知識 >  >> コンピュータソフトウェアのチュートリアル >> サーバー技術 >> サーバーについて >> サーバの可用性の問題に関する簡単な分析

サーバの可用性の問題に関する簡単な分析

  

ハードウェアアーキテクチャの情報化構築に欠かせないサーバとして常に懸念されてきたのと同時に、サーバの交換が世界の主要テクノロジの開発を目の当たりにしています。 16ビット処理、またはそれ以降の32ビットプロセッサ、現在同時にサポートされている32ビット、64ビットプロセッサ、および今後の純粋な64ビットプロセッサ時代。ただし、サーバーは絶えず変化していますが、1点永遠のテーマはサーバーの可用性です。サーバーが最も基本的な可用性を保証することさえできないならば、それは時代の大きな段階に入ることができないでしょう。

サーバーの可用性はどの程度ですか?それは何を含みますか?なぜあなたはそれをとても心配していますか?以下で一つずつ答えていきます。

サーバーの使いやすさは、サーバーが高い信頼性、高い安定性、容易な管理とメンテナンスを持ち、時々クラッシュして誤動作しないこと、そしてダウンタイムの現象を最小限に抑えることを要求することです。通常のPCがクラッシュして再起動すると、サーバー上の文書情報や少量のデータが失われる可能性があります。大きな経済的損失を引き起こさないでしょう。しかし、サーバーがクラッシュしても、その結果は想像できないでしょう。多くの重要なデータ、データ、情報、およびレコードがサーバーに保存されているため、特に多くのネットワークサービスがサーバー上で実行されていると、サーバーに障害が発生すると大量のデータが失われます。検証、メールサービス等は無効となり、請求が必要なネットワークであると正確な請求データを提供することができず、安全な運用ができないだけでなく、ネットワーク全体が麻痺し、損失を見積もることが困難になります。管理と保守は簡単です。専門家以外のユーザーが最も簡単な管理を使用してネットワーク内のすべてのデバイスを保守するのは非常に楽しいです。したがって、要約すると、高い信頼性、高い安定性、および容易な管理と保守は、サーバーの可用性の具体的な表れです。

では、サーバーのハードウェアアーキテクチャの設計における可用性をどのように保証しますか。重要なのは、ハードウェアの冗長性とハードウェアのオンライン診断を実行することです。ハードウェアの一般的な冗長性には、ディスクの冗長性、電源の冗長性、ファンの冗長性、および一部のRAMの冗長性、PCIアダプタの冗長性、ネットワークカードの冗長性が含まれます。テクノロジ、メモリ保護テクノロジ、メモリチェックおよびエラー訂正テクノロジ、メモリミラーリングテクノロジ、メモリホットアド/スイッチテクノロジ、アクティブPCIテクノロジ、アクティブ診断テクノロジなど

ハードウェアの冗長性を理解するのはより簡単です一部のコンポーネントの損傷によって引き起こされるハードウェアシステムの欠陥を確実にするためにハードウェアのコンポーネントの冗長バックアップですが、それはすることができません。コンポーネントの冗長性は、一般に一部の主要コンポーネントの冗長性であり、たとえば、ディスク冗長化テクノロジは、一般によく言われるRAIDテクノロジ、つまり、独立した複数のハードディスク(物理ハードディスク)が異なることを意味します。これらの方法を組み合わせて、単一のハードディスクよりも高いストレージパフォーマンスとデータの冗長性を提供するディスクグループ(論理ハードディスク)を形成します。現在のサーバー製品では、基本的にこの技術を採用し、RAID0、RAID1をサポートするので、サーバーはバスの帯域幅を最大限に活用してデータ操作を完了し、ディスク全体のアクセス性能を大幅に向上させ、ユーザーデータの可用性を最大化できます。 。同時に、現在のサーバー製品の中には、デュアルパワーとデュアルファンの冗長バックアップを提供でき、また、電源とファンの負荷を軽減して電力またはファンの損傷を軽減するホットスワップテクノロジをサポートするものもあります。システムの内部問題により、サーバーの不安定な動作とダウンタイムが根本的に回避されました。

しかし、ハードウェアだけに冗長性を提供するだけでは十分ではなく、サーバーの可用性を最大限に高めるためには、ハードウェアのオンライン診断テクノロジも必要です。たとえば、ホットスワップテクノロジとは、システムの電源を入れたときに一部のコンポーネントを挿入してダイヤルできることを意味します。一部のコンポーネントが破損していることが判明した場合はハードウェアの冗長性が確保されているため、システムは正常に動作を継続できるため、これは非常に重要です。ホットプラグテクノロジがない場合は、サーバーの電源を切る必要があります。これにより、人工サーバーが停止します。 Aerospace Allianceのほとんどのサーバー製品は、電源、ハードディスク、ファン、メモリ、ネットワークカードなどのハードウェアホットプラグをサポートする機能を採用しています。

ここでは、メモリエラー訂正テクノロジ、つまり新しいECCメモリ保護規格であるChipKillメモリテクノロジについても言及する必要があります。 Intelプロセッサアーキテクチャに基づくサーバーのCPUパフォーマンスが幾何学的な倍数で増加するにつれて、ハードディスクドライブのパフォーマンスは同じ期間中に5倍だけ高いので、十分なパフォーマンスを得るために。サーバは、CPU上で読み取られたデータを一時的に記憶するために大量のメモリを必要とし、その結果、大量のデータアクセスは、単一のメモリチップ上で1アクセスあたり4(32ビット)または8(64ビット)のデータをもたらす。 。大量のデータを一度に読み取ることで、複数のデータエラーが発生する可能性が大幅に増加し、ECCは2ビットエラーを訂正できず、すべてのビットデータが失われる可能性があり、システムはすぐに崩壊します。

サーバーにインストールされているメモリの量が増えており、システム内でメモリ関連のエラーが発生する可能性が高まっています。そのため、サーバー製品の信頼性を確保するために、Chipkill修復テクノロジだけでなく、メモリ保護、メモリミラーリング、ホットスワップパフォーマンスなどの純粋なハードウェア方法、およびメモリホットアドテクノロジなどのソフトウェア方法も使用されます。性別、システム全体の最大可用性が反映されます。

メモリミラーリングは、メインメモリとミラーメモリに配置されているメモリデータのコピーを2つ作成することです。システムが動作すると、データは両方のメモリに同時に書き込まれるため、メモリデータの2つの完全なバックアップがあります。チャンネル間のクロスイメージミラーリングのため、各チャンネルには完全なメモリーデータコピーのセットがあります。

システムチップセットに「フォールトトレランスのしきい値」が設定されています。いずれかのメモリが「フォールトトレランスしきい値」に達すると、そのチャネルにマークが付けられ、他のチャネルは単独で動作します。それでもデュアルチャネルメモリ帯域幅を維持します。

メモリミラーリングは、メモリ障害によるデータ損失を効果的に防止します。ミラーメモリとメインメモリは斜めに分散されており、片方のチャネルに障害が発生しても、もう一方のチャネルには障害のあるチャネルのメモリデータが残っているため、メモリチャネル障害によるデータ損失を防ぐことができます。信頼性ミラーメモリはメインメモリ容量以上の容量を持ち、システムが動作しているときは、ミラーメモリはシステムに認識されません。したがって、投資の面では、メモリ保護なしでメモリイメージデータ保護への投資は2倍になります。

メモリがホットスタンバイ(スペアリング)の場合、通常の状態ではホットバックアップ用のメモリは使用されません。つまり、システムはメモリ容量のこの部分を認識しません。各メモリチャネル内の1つのDIMMは使用されず、ホットスペアメモリ用に予約されています。メモリチェックエラー数のしきい値は、チップセットに設定されます。つまり、単位時間当たりのエラー数です。作業メモリの障害数がこの「フォールトトレランスしきい値」に達すると、システムはメインメモリへの書き込みとホットスペアメモリへの書き込みの2回書き込みを開始し、2つのメモリデータが一致していることを検出すると、ホットスタンバイメモリがメインメモリを置き換えます。メモリ作業、障害メモリが無効になり、ホットスタンバイメモリ交換障害メモリ作業タスクが完了し、メモリ障害やシステムダウンタイムによるシステム損失を効果的に回避できます。このホットスペアの容量は、メモリデータ移行の最大容量要件を満たすために、このホットスペアが存在するチャネルの最大メモリ容量以上である必要があります。

ご存じのとおり、サーバーの安定性に影響を与える主な理由はシステムの過熱ですが、過酷な環境下でサーバーの温度が長時間全負荷で動作していることを確認する方法はありますか?例えば、横風の吸い込み方法とは異なる前方風の取り方を採用することで、ラックに設置されたサーバーが実際の使用プロセス中に完全に遮られない風源を確保することができます。冗長ファンは、一方の冷却ファンが故障してヒートシンクとして機能しない場合に他方のファンがただちに動作し、一定の放熱能力を確保するためにのみ提供されています。

現在、一部のサーバー製品では、風の方向を集中させて制御するための独自のエアガイド経路が追加されています。熱放散問題に対する解決策はシステムの信頼性を改善しそして効果的に部品の寿命を延ばす。
zh-CN"],null,[1],zh-TW"]]]

Copyright © Windowsの知識 All Rights Reserved