本ページでは、DDPが異常動作もしくはヒューマンエラーが起きた時に、Areca
Raidカードがどういう役割を担うかを学ぶことが出来ます。
様々な理由により、RAIDセットが縮退運転状態になったり、分裂状態や重複したRAIDセットを作り出すというよろしくない状態に陥ることがあります。
そのような状況では、最新の注意をもって操作をし、誤操作によるデータ紛失を避けなければいけません。
一般的な状況
下図にあるように、1つのドライブが”Missing”となっていますが、このRAIDセットのステータスには何も表示されていません。この状況は、ディスク障害の為DDPがクラッシュした時に起こる可能性があります。DDP再起動後には、RAIDセットのステータスが”incomplete”と表示され、そのディスクに呼応する論理ボリュームはDDP GUIには表示されなくなります。
全てのボリュームを回復する手順は以下になります:
この例では、”Missing”と表示されたディスクは新しいディスクと交換する必要が有ります。該当ディスクに呼応するAreca RAIDカードインターフェースにログイン後、次の操作を行います。
- ‘RAID Set Functions’を開く
- ‘Activate Incomplete RAID Sets’を選択する
- 対象のRAIDセットをActivateする
以上の操作後、DDPをリブートし全てのボリュームがDDP GUI上に表示されていることを確かめます。
以前は“auto-activate RAID set“という機能はデフォルトでは有効になっていました。Areca社は、この自動有効化はRAIDセットが不完全な場合において、本設定は危険であるとみなし、現在はデフォルトでは無効化されています。“auto-activate RAID set“オプションが有効時には、RAIDカードは自動で利用可能なディスクを不完全なRAIDセットに割り当て、データの再構築を開始します。ここでの問題は、他の不完全なRAIDセットのディスクが利用された場合、データ紛失を招く結果に終わります。
そのため、不完全なRAIDセットをActivateするには手動にて行うのが望ましいです。”Volume Check”機能を定期的に(少なくとも3ヶ月ごとの実行を推奨します)に実行するようにし、そういった状況を防止するようにしてください。
1つのRAIDセットが不完全な状態になるということが、RAID 5の内2つ以上のドライブが障害を起こした場合に起こる可能性があります。このような場合には、該当RAIDを同じドライブを使ってReactivateする以外、データ紛失を防ぎ復旧するには他に方法はありません。
これには、まずRAIDカードインターフェースにログインし、不完全なRAIDセットをActivateする必要が有ります。その操作に関しては、本ページ内での説明を参照して実行後、DDPを再起動することにより、全ボリュームがDDP GUI上でアクセス可能になります。
RAIDセットが利用可能になったことを確認後、障害を起こしたドライブを交換し、”Volume Check”機能を実行する必要が有ります。
さらに複雑な状況
もっとも重要なのは、異常な状態が起きた時に、冷静になり不適切な操作を避けてデータが紛失するのを避けることです。とりわけ‘rescue RAID set’の使用は避けるようにしてください。弊社からはよほどのことがない限り、この‘rescue RAID set’の使用を勧めることは殆どございません。
DDPの電源が落ちている間にドライブを引き抜く
DDPの電源をオフにしている際、一個のドライブが引き抜かれる時何が起きるかという例を下のスクリーンショットが表しています。
ご覧の通り、RAID セットの内の一つが同じ名前を持つ二つの異なるRAIDセットに分けられています。
この現時点で推測出来るように、複写されたRAIDセットに含まれる一つのドライブが、消滅した一つのドライブのところに行きます。
その場合、一致するAreca RAID カードのインターフェイスにログインをし、以下を行います:
- ‘RAID Set Functions’のメニューに行きます。
- Activate Incomplete RAID Sets’ 機能を選択します。
- RAIDセットに含まれる、 8個の内の7個のドライブを実行します。
- ‘Delete RAID set’ 機能を選択します。
- 8個の内一個のドライブを含むRAIDセットを削除します。
そして、‘system information’ ページ内にある、 ‘free’と表示される、ディスクを引き抜きます。次に、データ復旧を始める為に元に戻します。そして、復旧が終わったら、DDPをリブートし、DDPGUI内に全てのボリュームが表示されるかをチェックします。
DDPがリブートされている時、一方RAIDセットはホットスペアドライブを使用して、データ復旧をしています
下のスクリーンショットではRAIDセット内で、何もドライブが消滅していないという異なった場合での、同じような状況を確認出来ます。全てのRAIDセットの状況が‘normal’と表示されています。
どのドライブも消滅していないのは、ドライブに障害が起きた際、いわゆるホットスペアドライブがあらかじめ関連づけられているからです。このホットスペアドライブは、自動的に障害の起きたドライブの代わりにデータ復旧の為に使用されます。問題なのは、操作中にDDPがリブートされると、復旧操作が完了してても、障害の起きたディスクを持つRAIDカードは混乱し、それを複写したRAIDセットにおいてしまうのです。
よってそういった状況では、必ず一致するAreca RAIDカードにログインをし、下記の操作を行います;
- ‘Delete RAID set’ 機能を選択します。
- 7つの内1個のドライブを含む RAID セットを削除します。
障害の起きているドライブを新しい物と取り替えた後、そのような特異な状況下では、以前の物がRAIDセットの部分の一部になるので、ホットスペアを追加する必要があります。
DDPのマスターヘッドがリブートされている間、RAIDセットは、ホットスペアドライブを使用して、データ復旧をします
下のスクリーンショットは2つのDDPヘッドで構成されるリダンダントシステムに間違った操作をした配列の結果の特別なケースをあらわしています:
最初に起きたのは、一個のドライブの障害です。“R1″RAIDセットの性能を落としています。
前にホットスペアドライブを構成し、その後自動的に障害の起きたディスクの代わりをして、RAIDカードがデータ復旧の為に使用されます。
その場合、一致する Areca RAID card のインターフェイスにログインをして、以下の操作を行って下さい:
- 1ドライブしか持たない、TOS1 RAIDセットを削除します。
- 1ドライブしか持たない、R6 RAIDセットを削除します。
- 不完全な RAIDセットのデータを復旧に使用出来るように、ホットスペアドライブとして、ディスクのスロット10 09 20 17を再構築します。
その操作を行った後、スペアドライブの一つが不完全なRAIDセットの代わりにとって代わり、データが再復旧を始めます。