Windows system >> Windowsの知識 >  >> コンピュータソフトウェアのチュートリアル >> サーバー技術 >> サーバーについて >> サーバーの稼働時間を最大にする方法

サーバーの稼働時間を最大にする方法

  
                  

サーバーを稼働させ続ける、または少なくとも必要に応じて準備を整えることは、すべてのデータセンター管理者が最も達成したい目標の1つです。

しかし、データセンターの管理者の中には、システムの稼働時間を最大限にするためのものであると率直に言う人はほとんどいません。専門家らは、実際には多くの管理者が、稼働時間にほとんどまたはまったくプラスの影響を与えない技術や慣行に多くの時間とお金を費やすと言います。

米国の金融データサービスプロバイダーであるSix TelekursのITオペレーションおよび物流サポート担当副社長Walter Beddoeは、稼働時間を最大化することは科学と管理の両方の技術であると考えています。 「仕事をする人、フォールトトレラントなハードウェアを使う人、動的なセキュリティを採用する人、メンテナンスや変更管理の方法など、さまざまなことをまとめる必要があります。最も重要なのは、自分の能力を最大限に引き出すことです。 "

プリンストンにある医用画像診断会社、プリンストン・ラジオロジーのIT担当ディレクター、アラン・ハワード氏は、部下たちに、稼働時間の改善に直接貢献しない行動やツールに時間とリソースを浪費しないように勧めます。たとえば、クラスタリングを実行するための作業は「非常に無駄」であり、ツールを使用した冗長構成ほど完全ではありません。 Howard氏によると、自動化できないクラスタ、つまり同期を手動で実行する必要があるクラスタでは、さらに問題が生じる可能性があるという。 「マスターノードに障害が発生した場合、致命的になる可能性があります。マスターノードに障害が発生するよりも、スタンバイノードに障害が発生した方が良いでしょう。」

たとえば、彼のチームはフェールオーバーとして使用されているWindows Serverのクラスタは、アプリケーション構成ファイルの変更を間に合わせてスタンバイサーバーにコピーできなかったため、アプリケーションをクラッシュさせました。 「アプリケーションのクラッシュを修正するための努力は、クラスタノードの障害を修正するための努力以上のものです。」

の後、彼のチームはもはや伝統的なクラスタサーバーを持っていません。代わりに、「シングルスタンバイサーバークラスター」を構成し、そのクラスターをデュアルコントローラーのCompellentストレージセンターSANにマッピングしたため、オンデマンドで仮想マシンをほぼシームレスに移行できました。

慎重な計画

ほとんどのデータセンター管理者は、調達から管理、交換まで、サーバー関連のすべての作業を慎重に計画することが、システムの信頼性を確保するための重要なステップであることに同意します。 。

ワシントン大学のIT運用およびエンジニアリングマネージャであるRaoul Gabiamは、ライフサイクル管理はサーバーの稼働時間計画に欠くことのできない部分であると言います。 「ハードウェアの交換時期、ハードウェアの交換方法、ソフトウェアのアップグレード方法を知ることは、システムのパフォーマンス、継続性、および全体的な稼働時間に影響を与えるため、非常に重要です。」たとえば、一度行う必要がある場合ソフトウェアをアップグレードし、次にハードウェアの必要性と既存のハードウェアの状態を理解することが重要です。より多くのダウンタイムを避けるために、ソフトウェアアップグレードのニーズを満たすためにハードウェアを購入する必要があるかもしれない、とGabiamは説明した。

Gabiamはまた、信頼できるサーバー操作を保証する方法として、標準化と調整を強く推奨します。 「誰かが何かをインストールしたり変更を加えたりする前に、変更管理プロセスを実行する必要があります。」

変更管理は、「変更を実装する前にすべてがどのように構成され変更されるか」を理解することです評価してください」とGabiamは言った。 「このようにして、許可されていないものとお互いに影響を与える可能性があるものを常に理解することができます。」

変更管理の規律に従うと、ある種の予測は可能です。サーバーを構成したり、新しい環境に配置したりするとどうなりますか。

Online Resourcesは、金融機関にトレーディングサービスを提供する会社であり、そのCTOであるPaul Frankoは、仕事への態度も大きな影響を与える可能性があると考えています。彼は、定期的だが重要なサーバー関連の作業を真剣に受け止め、タイムリーに対処できるようにするために特別な努力を払ったと述べました。

「私達は私達のさまざまな規則に従うことができることを保証するためにシステムチェックとバランスのメカニズムを提案しました」と彼は言いました。 Franko氏によると、管理者は部下の管理を定期的にチェックする必要があり、他の手段を二重チェックすることで人的ミスを最小限に抑えることができます。 「間違いを犯している人です。複数のチェックポイントを設定しないと、問題が解決する可能性があります。」

予防的メンテナンスの実践

定期的な予防的メンテナンス対策は信頼性のあるサーバーをサポートするための最も簡単で苦痛の少ない方法。 「システムの稼働時間は、システム全体で最も弱いコンポーネントの稼働時間と同じくらいの長さになる可能性があります」とBeddoe氏は述べた。長期的には、システムソフトウェアのアップグレード、条件付き電源の提供、および適切な冷却環境の確保という基本的なタスクによって、データセンターサーバーは予算を超えることなく障害なく動作することができます。ミッションチームは、問題を解決するために人々を動員しています。

Online ResourcesのCTOであるPaul Frankoは、仕事に対する態度がサーバー管理に大きな役割を果たすと考えています。彼は、定期的だが重要なサーバー関連の作業を真剣に受け止め、タイムリーに対処できるようにするために特別な努力をしたと述べました。

Franko氏は、必要な作業をすべて必要なときに確実に実行するために、どのタスクがサーバーのメンテナンス作業であるかを明確にし、明確なスケジュールに基づいて編成する必要があると述べました。 「セキュリティのアップグレードなど、一部の作業はすぐに実行する必要がありますが、他のタスクはバッチまたは定期的に実行されます。」この2番目の種類のタスクには、ソフトウェアの重要ではない機能改善へのアップグレードが含まれます。 。

Frankoさんは、サーバーのメンテナンスはこのようにして行うべきだと付け加えました。メンテナンスはサーバーの稼働時間を増やすべきではありません。 「メンテナンス作業のためにシステムの動作を遅くすることはできません。とにかくこれを実行する必要があります。」

メンテナンスのためにサーバーを削除する必要がある場合、Frankoのチームはこのメンテナンスは、ユーザーの需要が低い夜中または週末に予定されています。通常の営業時間内に機能サーバーを削除する唯一の理由は、ゼロデイセキュリティパッチなどの重要なソフトウェアのアップグレードをインストールまたは実行する必要があることです。

基本的なサーバー管理タスクの自動化

過去数年の間に、主に仮想化と関連技術の出現により、サーバー管理はより複雑になりました。サーバーの効率と使用率を向上させるためには、さまざまなベストプラクティスを設計する必要があります。

仮想化自体が、サーバーのダウンタイムからデータセンターを保護するのに役立ちます。サーバーを統合し、それらを共有環境で相互接続することにより、仮想化は複数の仮想マシンを異なるホスト上で実行することを可能にします。いずれか1つのホストに障害が発生すると、ワークロードが残りのホストに再分配されます。 「サーバーに障害が発生する可能性がありますが、それがサービス全体の配信に影響を与えるわけではありません」とGabiam氏は言います。

拡大する仮想化環境をより効果的に管理するために、Xenos Software、Uptime Software、Nimsoft、Nagios Enterpriseなどの企業は、データセンターのスタッフがサーバーのパフォーマンスと場所に集中できるようにすることを目的とした問題を立ち上げました。パフォーマンス向上の機会を最大限に活用するツール。

Beddoeは、そのようなツールが不可欠であると感じています。 「すべてのサーバーがいつでも可能なことを実行できるようにするには、安心できる何かが必要です。」

Copyright © Windowsの知識 All Rights Reserved