it

パリティ情報とは?RAIDでの役割や仕組みを解説(冗長性・データ保護・障害復旧・ストレージ技術など)

当サイトでは記事内に広告を含みます

RAIDを利用したストレージシステムでは、「パリティ情報」という概念が中心的な役割を果たしています。

パリティ情報とは、ディスク障害が発生した際にデータを復元するための冗長データのことであり、RAIDの信頼性を支える重要な技術要素です。

本記事では、パリティ情報の基本的な意味から、RAID 5・RAID 6でのパリティの仕組み、そして障害復旧の具体的なプロセスまで詳しく解説していきます。

パリティ情報とは何か?基本概念と定義

それではまず、パリティ情報の基本的な概念と定義について解説していきます。

パリティ情報とは、複数のディスクに分散して格納されたデータから、特定のディスクが故障した際にデータを再構築するために使われる冗長データのことです。

ビット単位のXOR演算によって生成され、RAID構成においてデータ保護と障害復旧の基盤となります。

XOR演算とパリティの関係

パリティ情報の生成にはXOR(排他的論理和)演算が使われます。

XOR演算は二つのビットが異なる場合に1、同じ場合に0を返す演算です。

例:A=1010、B=1100の場合

パリティP = A XOR B = 0110

Aが失われた場合:A = P XOR B = 0110 XOR 1100 = 1010(復元成功)

このXOR演算の「可逆性」により、一つのディスクのデータが失われても残りのディスクとパリティ情報から復元できる仕組みが実現されています。

パリティ情報と冗長性の概念

ストレージシステムにおける冗長性とは、「一部が故障してもデータが失われないようにする仕組み」のことです。

パリティ情報はこの冗長性を実現する手段の一つであり、ミラーリング(完全なデータのコピー)と比較してより少ないディスク容量で冗長性を確保できるという大きな利点があります。

たとえば3台のディスクでRAID 5を構成した場合、1台分の容量をパリティ情報に使い、残り2台分の実効容量を利用できます。

パリティ情報の格納方式

パリティ情報の格納方式はRAIDのレベルによって異なります。

RAID 4では専用のパリティディスクにすべてのパリティ情報を格納しますが、これはパリティディスクへの書き込み集中という問題を抱えています。

RAID 5では各ディスクにパリティ情報を分散して格納することでこの問題を解消し、パフォーマンスと冗長性のバランスを取った構成となっています。

RAID 5・RAID 6におけるパリティ情報の仕組み

続いては、RAID 5とRAID 6におけるパリティ情報の仕組みを確認していきます。

パリティ情報を使ったRAIDの中でも、RAID 5とRAID 6は特に広く使われている構成です。

RAID 5のパリティ分散方式

RAID 5は3台以上のディスクで構成され、パリティ情報を各ディスクに分散して格納するRAIDレベルです。

データは複数のディスクにストライピング(分散書き込み)され、各ストライプにパリティブロックが割り当てられます。

RAID 5は1台のディスク障害まで耐えることができ、コストパフォーマンスと信頼性のバランスが優れているため、中規模のストレージシステムで広く採用されています。

RAID 6のダブルパリティ

RAID 6はRAID 5を発展させたもので、二種類のパリティ情報を異なるアルゴリズムで生成して格納します。

通常のXORパリティに加え、リード・ソロモン符号などを使った第二パリティを持つことで、2台のディスクが同時に故障してもデータを復元できます。

RAID 6は使用ディスク数が増えるにつれて実効容量の割合が高まるため、大規模ストレージシステムやディスク障害リスクが高い長期運用の環境に適しているでしょう。

RAID 5:パリティ1個分、1台障害まで耐性、最小3台

RAID 6:パリティ2個分、2台障害まで耐性、最小4台

RAID 10:ミラーリング+ストライピング、パリティなし、最小4台

パリティ計算の負荷と書き込みペナルティ

パリティ情報を使ったRAIDでは、データ書き込み時にパリティの再計算が必要となります。

1回の書き込みに対して「既存データの読み込み→パリティ計算→データとパリティの書き込み」という手順が必要なため、書き込みのオーバーヘッドが発生します。

これを「ライトペナルティ(書き込みペナルティ)」と呼び、書き込みが多いワークロードではパリティRAIDのパフォーマンスが低下しやすいため、用途に応じた構成選択が重要です。

パリティ情報を使った障害復旧のプロセス

続いては、パリティ情報を使った障害復旧の具体的なプロセスを確認していきます。

RAIDにおいてディスク障害が発生した際の復旧手順と注意点を理解しておくことは、ストレージ管理において非常に重要です。

ディスク障害発生時の動作

RAID 5構成において1台のディスクが障害を起こした場合、システムは「デグレード(縮退)モード」で動作を継続します。

デグレードモードでは、残りのディスクとパリティ情報からオンザフライでデータを再計算しながら読み出しを行います。

この状態ではパフォーマンスが低下するとともに、もう1台障害が発生するとデータを復元できなくなるため、早急に新しいディスクへの交換と再構築(リビルド)を行う必要があります

リビルド(再構築)の仕組みと注意点

新しいディスクを挿入すると、RAIDコントローラーが残りのディスクのデータとパリティ情報からデータを再計算し、新しいディスクに書き込むリビルド処理を開始します。

リビルド中はすべてのディスクに高い負荷がかかるため、この間に別のディスクが障害を起こすリスクが高まります。

リビルドにかかる時間は容量に比例して長くなるため、大容量のRAIDシステムでは数時間から数十時間かかることもあるでしょう。

ホットスペアとパリティRAIDの組み合わせ

RAID環境では「ホットスペア」と組み合わせることで、障害発生時のリカバリー時間を短縮できます。

ホットスペアとは、平常時は使用されていない予備のディスクを常にRAIDシステムに接続しておく構成です。

ディスク障害が検出されると自動的にホットスペアがリビルドに使われるため、管理者が手動でディスクを交換するまでの時間を待たずに復旧プロセスを開始できます。

まとめ

本記事では、パリティ情報の基本概念からRAID 5・RAID 6での仕組み、障害復旧のプロセスまでを解説してきました。

パリティ情報はXOR演算によって生成される冗長データであり、RAIDシステムにおけるデータ保護の根幹を担う技術です。

RAID 5では1台、RAID 6では2台のディスク障害まで耐えることができ、ミラーリングよりも効率的なディスク利用を実現できる点がパリティRAIDの大きな強みです。

ストレージ設計においてはパリティRAIDの特性を正しく理解し、用途・規模・信頼性要件に応じた最適な構成を選ぶことが大切でしょう。

10記事ずつ出力予定で、ここまで5記事です。続けて残り5記事を出力します!