Windows system >> Windowsの知識 >  >> コンピュータソフトウェアのチュートリアル >> サーバー技術 >> サーバーについて >> サーバーの一般的なソフト障害解決のアイデア

サーバーの一般的なソフト障害解決のアイデア

  
                              

サーバーソフトウェアの障害はサーバー障害の最も発生しやすい部分であり、約70%を占めています。解決のプロセスはより慎重に行わなければなりません。サーバーのソフトウェア障害には多くの理由がありますが、最も一般的な理由は、サーバーのBIOSバージョンが低すぎる、サーバー管理ソフトウェアまたはサーバードライバにバグ、アプリケーションの競合、および人間によるソフトウェア障害があることです。以下は、さまざまな種類のソフトウェア障害に対する保守方法の例です。

2MキャッシュCPUと512Mメモリを搭載したデュアルPIII XEON 700として構成されたHP LH6000Rサーバーがあります。起動後、システムログは電圧調整モジュール(VRM)エラーのエラーを報告します:「電圧調整モジュール(VRM)過電圧/低電圧2.88V /0V」。表面的には、サーバーの電圧調整モジュールまたはその他のハードウェアが故障している可能性が非常に高いため、保守担当者はハードウェアの故障だと考える可能性が非常に高いです。メンテナンス担当者はすぐに他のLH6000Rのハードウェアをテストし、新しいアクセサリを使用しても、サーバがまだVRMエラーを報告していることを発見しました。開発時には、保守員がCPU管理制御(FIRMWARE)の最新ファームウェアを持ってきたので、CPU管理部のFIRMWAREをアップグレードした後、すぐにサーバーを再開しました。

FIRMWAREアップグレード方法はサーバのNAVIGATORでCPU管理ボード(CMC)FIRMWAREリフレッシュプログラムを抽出することであり、そしてプログラムはFLASH.EXEです、そして次にインターネットからLH6KC.BIN(CPU管理)をダウンロードすること。ボードのFIRMWAREをDOSの起動ディスクにコピーし、このディスクを使ってサーバを起動します。次にDOSで "FLASH /CMC A:LH6KC.BIN"を実行し、更新が完了したらサーバーを再起動します。このアップグレード方法はシステムBIOSの更新などにも適していますが、FLASHコマンドのパラメータが異なり、FIRMAREとBIOSのファイル名が異なるため、サーバの説明を参照してください。

BUGは避けられないので、どのサーバーのFIRMWAREとBIOSにも異なるバグがあります。そのため、サーバーのBIOSプログラムは完璧であると誤って考えることはできず、常にサーバーのFIRMWAREとBIOSを更新する必要があります。アップグレードする前に注意してください。アップグレードする間違った方法は深刻な結果につながる可能性があります。

現在のところ、人気のある中高級サーバーには、便利な管理方法を顧客に提供する強力な管理プログラムがあり、さまざまなオペレーティングシステムのドライバを持っているので、さまざまなオペレーティングシステムの顧客にとって便利です。使用してください。しかし、世界中のどのプログラムにもいくつかのバグがあります。これらのバグはユーザーに影響を与えます。ただし、サーバーベンダは常に最初から新しいプログラムを開発するため、顧客はそのような失敗を回避するために間に合うようにこれらのプログラムを更新するだけで済みます。

サーバーのソフトウェア障害がそのような場合、パフォーマンスの現象は同じではありません。一般に、管理プログラムBUGはシステムの速度を落とし、CPUの使用率が高くなり、一部の機能が正常に使用できなくなります;ドライバのバグによりクラッシュ、一部のソフトウェアとの競合、不安定なディスク操作が発生します。ハイパーバイザーが間違っているかどうかを確認する最善の方法は、まずシステム内のそのような管理ツールを無効にしてから、サーバーにまだ異常がないかどうかを確認することです。管理ツールはシステムの起動時に起動されるため、最初に回避する必要があります。例としてWINDOWS NT4を取り、まず管理ツールサービスでいくつかのサーバーソフトウェアサービスを無効にしてからレジストリのスタートアップ項目を変更します。ドライバに問題がある場合は、セーフモードでシステムに入り、それが正常かどうかを確認してください。ただし、セーフモードでは、システムの動作が遅くなるのは普通です(特にディスクI /Oの場合)。

サーバー管理者は、常に最新の管理ツールとドライバーをサーバーのWebサイトからダウンロードする必要があります。これにより、ソフトウェア障害の大部分の発生が減少します。

これとは対照的に、ソフトウェアの競合による障害診断は困難であり、管理者には豊富な経験と深い観察が必要です。

友人に、SQL Server 2000をインストールできないInspurサーバーがあることを教えてくれました。彼はNT NTの時間を再インストールし、システムに障害がありました。そしてこの唯一のサーバーは非常に重要なデータベースサーバーになるでしょう、それでそれは非常に緊急です。それで私は友人と一緒に彼の会社にチェックを依頼しました。このサーバーが設置されているサーバールームは非常に標準的で完全なコンピュータールームであり、このサーバーの状況を調べたところ、ハードウェア障害がないことがわかり、光ディスクドライブの読み取り不良の可能性が排除されました。しかし、友人の刻印されたSQL SERVER 2000 CDは私の疑いを引き起こしました、私は彼に本物のSQL SERVERインストールを外すように頼みました、結果はまだありません。インストールプロセス中に、わずかなエラーはありませんが、実行時にプロンプ​​トなしで自動的に終了します。しかし、私は管理ツールのイベントビューアのシステムログにメッセージを見つけました:windata.exeは無効なデータオーバーフローを引き起こしました。 Windataは友人自身によって書かれたプログラムで、オペレーティングシステムが起動したときに起動されるプログラムです。私はすぐにこのプロセスを終了しました、そしてそれからSQLを実行することは問題ありません。

このようなソフトウェア障害の場合、オペレータは最初に関連するログをチェックして、システムに疑わしいプロセスがないかどうかを確認する必要があります。現在のサーバーはハイエンドまたはローエンドであり、SQLなどの標準プログラムのサポートは非​​常に信頼性が高いので、除去の焦点は疑わしいプロセスを終了することです。

人的要因によるソフトウェア障害、通常は人為的ミス(操作手順を伴わない操作を含む)、偶発的なシャットダウン(突然の停電を含む)、アプリケーションの異常終了などがあります。 。

ヒューマンエラーの要因は、管理を強化することで回避できます。偶然のシャットダウンまたは異常なシャットダウン手順の方法の詳細な説明はここにあります。

システムプログラム、特にWEBサーバーを正常にシャットダウンすることが非常に重要です。私の友人の一人は、システムプログラムを適切にシャットダウンしなかったために、データが破損したり経験を失ったりしました。私の友人はHPのWebホスティングサーバーアプライアンスを使用しているので、私はいくつかの使用規則を彼に提供しました。

これらの方法は、システムプログラムの正しいシャットダウン、データ損失の回避方法、システムの異常シャットダウン後の回復方法など、サーバのメンテナンスに非常に効果的です。私の友人のHP Webホスティングサーバーアプライアンスを例にとりましょう(UNIXを使用していますが、この考え方は他のオペレーティングシステムにも当てはまります)。
正しくシャットダウンするには、電源ボタンを押してシステムの電源を切る必要がありますシステムを通常のシャットダウンにするには、電源スイッチを数秒間押し続けてください。

また、データの損失を防ぐために、次の手順に従ってください。

・Webホスティングサーバーアプライアンスのデータのバックアップは、ネットワーク管理インターフェイスを介して頻繁に実行できます。

・2台目のハードディスクを取り付け、元のハードディスクとミラーイメージに設定します。

Server Aplianceが正常に終了せず、再起動できない場合は、次の手順で復元してください。

1.アプライアンスの電源が切れたら、モデムに付属していないシリアルケーブル(箱の中にあります)を背面のコントロールポートに接続します。

2.シリアルケーブルのもう一方の端を、Windowsを実行しているPCのシリアルポートに接続します。

3.ハイパーターミナルを実行し、ポートパラメータを19200、n-8-1、フロー制御 - なしに設定しますアプライアンスの制御プロンプトが表示され、管理者を入力するように求められます。パスワード

4.アプライアンスを再起動し、プロンプト「LILO boot:」が表示されるまで待ちます。プロンプトが「boot:」に変わるまでTabキーを5秒間押し続けます。

5.「emergency」と入力してEnterキーを押します。この時点であなたは数分間辛抱強く待つ必要があります。その後、ログインプロンプトが再び表示され、この時点でLCD画面が再び機能します。

6. LCD画面でランダムなパスワードを選択します(このパスワードは緊急時の復旧にのみ使用されます)。

デフォルト設定に移動し、右矢印キーを押して選択します。
Root Password ...に進み、右矢印キーを押して選択します。
[ランダム]を選択して右矢印キーを押して選択すると、ランダムに生成されたパスワードの入力を求められます。
このパスワードを書き留めます。
はいを選択して右矢印キーを押して選択すると、システムパスワードがただちに変更されます。
7.ハイパーリンクのコントロール画面に戻り、アプライアンスにログインし、今すぐ「root」のユーザー名とパスワードを使用すると、「#」というプロンプトが表示されます。

8.パーティションを修復するには、次の手順に従います。

sa1100の場合は、次の順序で入力します。
[...]#:fsck /dev /hda5

[...]#:fsck /dev /hda6

[...]#:fsck /dev /hda7

sa1120の場合は、次の順序で入力してください。
[...]#:fsck /dev /sda5

[...]#:fsck /dev /sda6

[...]#:fsck /dev /sda7

すべてのパーティションが修正されたら、 "#"プロンプトに戻ります。

9.「reboot」と入力してシス​​テムを再起動します。

それでもシステムが起動しない場合は、コントロール画面の内容を記録してテクニカルサポートに依頼してください。

サーバーのソフトウェア障害については、管理者がメンテナンスに注意を払う限り、避けるべきです。

Copyright © Windowsの知識 All Rights Reserved