“ボリュームチェック”機能とは?
Arecaカードインターフェース内の、“ボリュームチェック”という機能をつかって、RAID配列のデータ整合性をテストすることができます。それにより、すべての関連データブロックが読み込まれ、パリティが計算されます。最終的には、格納されたパリティと計算されたパリティが比較されて、整合性を確認します。
通常は、RAIDセットのパフォーマンスはボリュームチェックにより影響を受けます。そのため、弊社では夜間といったDDPの負荷が低い時に実行することを推奨しております。
ボリュームチェックが必要な理由
ボリュームチェック実行中、すべてのディスクセクターは読込および書込みがされます。エラーが検出されなかったセクターは使用可能と認識されます。エラーが検出された場合は、データブロック他の安定したセクターに再割り当てされます。データがディスク上の他の健全なセクターに移動されると、障害のあるブロックは目印がつけられて、使用されることはありません。
ボリュームチェック中に行われる他の検査は、パリティーの整合性チェックがあります。これも重要なものでもしパリティデータが正しくないと、リードエラーやディスク障害発生時に元のデータの復旧が不可能になります。
障害ドライブを保持したDDPを使うと、結果として多くの問題を引き起こし、クライアントマシンのアプリケーションがクラッシュするとか、いろいろなもののパフォーマンス低下が見られるようになります。だから非常に重要なメンテナンスツールであるボリュームチェックを使って、より良いDDPのパフォーマンスを得たり、障害発生を避けることができます。
DDP web GUIを使ってボリュームチェックを行いたい場合は、こちらのトピックをご参照ください。
Hボリュームチェックの結果を確認する
DDP GUIから”Raid cards”ページに行き、確認したいRAIDカードをクリックします。そしてArecaインターフェースにログインします。(デフォルトログインおよびパスワードはadmin/0000)
“System Controls” メニュー配下の“View Events/Mute Beeper”セクションに行き、ログを確認します。“Time”と“Event Type”欄を確認し、下図にあるように“Complete Check”と表示されていることを確認します:
このスクリーンショットからは、8月31日に”r2”のRAIDセットが2つのエラー検出で終了しているということがみてとれます。
この結果からは2つのことが言えます:
- 壊れたセクターを含むドライブがあり、それにより信頼性を失っていることを表し、フェールしかけている可能性のある状態。
- 過去にデータがアクセスされる時に問題が起き、パリティデータが元のデータを修復する必要があった。
これらは通常我々には見えにくいものなので、ボリュームチェックを実行することは重要です:壊れたセクターが検出された際は、不良セクターとして記録されてデータブロックは再割り当てされます。その結果、同じセクターでの読み込みエラーは度と起きません。
しかし、ブロックの再割り当てでドライブはもう安全であるとは言えません。不良ブロックが検出されてから1週間後に改めて再度ボリュームチェックを実行するのが最善策です。もしドライブがフェールしかけているなら、いつ発生するのかは予測不能ですが、より頻繁に読み込みエラーが将来発生するであろうと言えます。
管理者が、ボリュームチェックを”RAID Check”ツールを使わないで、Arecaウェブインターフェースからボリュームチェックを行う場合は、最新の注意をもってこちらのトピックをご参照ください。