Windows system >> Windowsの知識 >  >> コンピュータソフトウェアのチュートリアル >> サーバー技術 >> サーバーについて >> エキスパートのトリック:サーバRAID 5の障害のトラブルシューティング方法?

エキスパートのトリック:サーバRAID 5の障害のトラブルシューティング方法?

  
                  

技術の継続的な進歩により、RAID 5の障害発生後は、サーバーの種類によって処理方法が異なります。

今日では、大規模アプリケーションのネットワークトポロジは一般にC /S構造またはB /S構造を採用しているため、大規模データベースを備えたサーバーを少なくとも1つ中央コンピュータルームに配置する必要があります。サーバーのセキュリティと信頼性に基づいて、サーバーのディスクは通常、安価なディスクの冗長アレイによってバックアップされます。 RAID 5アレイレベルは、独立したパリティディスクを使用しないパリティディスクアレイで、データブロッキングと独立アクセステクノロジを使用して、同じディスク上で複数のアクセス要求を並行して処理しながら、アレイ内のハードディスクを故障させません。 。

実用的なアプリケーションでは、やむを得ない客観的な理由でアレイの故障が発生する可能性があります。最も一般的な状況は、ハードディスクがオフラインで、オンラインステータスがDDD(Defunct Disk Drive)として表示され、ハードディスクに物理的または論理的な障害があることです。物理的な障害の場合はハードディスクの交換のみ、論理的な障害の場合はターゲットを絞った技術的修復を介してハードディスクのオンライン状態を復元し、ハードディスクデータのストライプ状態を元のアレイに維持し、データストレージシステムを続行できます。一貫性

ただし、HPの古いサーバー(HP LH6000など)の一部のデータ復旧は、HP ProLianシリーズのサーバーなどの新しいサーバーのデータ復旧とは異なります。そのため、サーバーごとにRAID 5の障害の処理方法が異なります。私は2台のサーバーの偶発的な停電によるRAID 5アレイカードのデータ障害にさらされており、異なる戦略を採用することで問題を解決しました。

トラブルシューティング

1つは2000年に購入したHP LH6000サーバーで、RAID 5ディスクアレイには4つの18GBハードディスクがあり、アレイカードはNetRaidです。この年に購入したHP ProLian ML370サーバーでは、4台の146GBハードディスクがRAID 5ディスクアレイになりました。アレイカードは、ホットスペア(Hot Spare)付きのSmartアレイ642です。両方のオペレーティングシステムはWindow 2000であり、データベースはServer 2000です。

HP LH6000には、次のような不具合があります:ハードディスクが赤く点滅し、マシンはまだ正常に動作していますが、システムが正常に動作するのにはそれほど時間がかかりません。

解決策は次のとおりです。

1.アレイをセルフテストするときに、サーバーを起動し、Ctrl + Mを押してNetRaid管理プログラムに入ります。アレイ情報を確認し、ハードディスクのステータスがFailedになっていることを確認し、変更した設定を使用してハードディスクを強制的にオンラインにします。サーバーを再起動し、システムに入る前にハードウェアセルフテストを無効にすると、起動に失敗します。

2.アレイをセルフテストするときに、サーバーを起動し、Ctrl + Mを押してNetRaid管理プログラムに入ります。ディスクアレイを選択し、オンラインに接続されているハードディスクを手動で故障させてから、別の故障したハードディスクを手動でオンラインに設定し、サーバーを再起動してシステムに入ります。

3.システムとデータベースが正常に実行されたら、アレイの設定ツールを起動して手動でFailed hard diskをRebuildに設定し、100%再構築後にサーバーを再起動してすべてのアレイとシステムを復元します。

著者の単位でERPシステム(HP ProLiant ML370)を実行している別のサーバー。4台の146GBホットスワップ対応ハードディスクをRAIDカード(Smartアレイアレイカード)を介してRAID 5 RAIDアレイに構成。 。動作中にハードディスクの1つが突然故障しました。 Server RAID 5は、ホットスペア(Hot Spare)が損傷したドライブを論理的に交換することを自動的に有効にします。ハードディスク全体のデータアクセスタスクは、元の読み取りおよび書き込みプロセスのシーケンスで完全に実行され、アプリケーションとデータベースには影響がありません。

HPに付属のACUツールを使用してハードディスクのステータスを確認し、赤信号アラームが表示されているハードディスクがオフラインであることを確認します。 HP ProLiantサーバーのRAID 5の2つのハードディスクが赤色の場合は、システムがクラッシュしてデータベースにアクセスできないが、システムが自動的にシャットダウンされないことを示します。 2台目のハードディスクが赤く点灯していると、従来の方法ではデータを復元することはできません。

したがって、HPの古いHP LH6000シリーズサーバーでは、アレイのデザインはHP ProLiantシリーズサーバーのアレイとは大きく異なります。操作方法に関する限り、HP LH6000サーバーのアレイ操作方法には、アレイの再削除やアレイの故障後の再構築など、さまざまな選択肢があります。初期化も手動で選択されます。ただし、HP ProLiantシリーズのサーバーアレイの初期化は、アレイの設定後にバックグラウンドで自動的に実行されるため、ProLiantシリーズサーバーはアレイエラー後にアレイを再設定することはできません。

HP LH6000サーバーでは、その他の予期せぬ理由でアレイ内のディスクがドロップされることがありますメンテナンス担当者は、オンラインまたはオフライン、再構築などを手動で選択してデータを回復できます。ただし、現在のHP ProLiantシリーズサーバーでは、アレイ内の古いサーバーのようにディスクが落ちることはなくなるため、ハードディスクが赤くなると、ハードディスクは基本的に破損しているため交換する必要があります。もちろん、あなたは再構築するためにハードドライブを再接続することを選択することができ(再構築)、そしてハードドライブがしばらくの間使用できるかどうかを確認できます。

テクニカルバックアップ

上記の2つの例から、同じブランドと異なるシリーズのサーバーでは、テクノロジが異なるために異なるRaid 5ディスク障害が発生することがわかります。 。しかし、データを再構築した後、データは保存され、そこから次のような経験を引き出すことができます。

どんな高度な技術も絶対確実というわけではないと考えています。データのセキュリティを確保したい場合は、バックアップジョブを実行する必要があります。データベースのリモートバックアップを1日に1回実行するのが最善です。少なくとも1つの新しいハードドライブを予約してください。アレイに追加するハードディスクは、故障したハードディスクの容量以上である必要があります。

状況に応じて、RAID 5+ホットスペアディスクの作成方法をお勧めします。これにより、データが失われる前にハードドライブを交換する可能性が2つあります。一般的なアプリケーションでは、データアクセスのパフォーマンス、信頼性、および最大ディスク容量を確保するためにRAID 5のみを使用できます。

管理者は、ディスクアレイの黄色い警告灯や管理ソフトウェアのドライブの状態など、アレイの状態を常に監視する必要があります。失敗が発生し、やがて解消されました。アレイのレベルに関係なく、データのバックアップはトラブルシューティングの前に実行する必要があります。

Copyright © Windowsの知識 All Rights Reserved