■07/10/15 【第50回】データアーカイブとその課題 第4回

■データ管理とアーカイブポリシー
 急増するリファレンスデータは、高いアクセス頻度と性能を要求されるハードディスク内のオペレーショナルデータを圧迫する。その結果、システムコストの増加を招くため、リファレンスデータをハードディスク以外の低コストなメディアに分散保存することが必要になる。このような階層型ストレージ管理(HSM:Hierarchical Storage Management)の考え方は、高速度なアクセスを可能にする記憶装置が高価な時代に生まれ、ストレージを高速に、かつ効率よく利用することを目的にしている。

 効率のよい階層型ストレージ管理を行うためには、ストレージ管理者による「データ管理」と「アーカイブポリシー」が必要になり、さらにそのポリシーを実現する手段を用意しなければならない。例えば、ユーザが頻繁に閲覧・使用するファイルは、通常はクライアント(プライマリー・ストレージ)に保存するが、管理者が設定したポリシー(容量制限・アクセス頻度・アクセス回数など)を元に、使用頻度が低いと判断されたクライアントの個々のファイルは、サーバ(セカンダリストレージ)に移動する。こうしてサーバに移動したファイルは、必要に応じてクライアントに呼び戻し(復元)、再びそのファイルのアクセス頻度が低くなれば、またサーバへと移動する。このような仕組みを実現できるシステム(ソフトウェア)が必要になるだろう。

 さらに、ストレージ管理では上書き・削除・変更をストレージ本体で拒絶するWORM(Write Once Read Many)機能の利用が効果的である。データ管理においては、データへの高速アクセスだけでなく、データ本体の事実性も常に保障しなければならない。そのためには、ハードウェアのWORM機能とソフトウェアによる二重の管理が大切なのである。

■SAN(Storage Area Network)管理による効率化
 ストレージシステムを効率的に運用するためには、増大するデータとストレージを適切に管理、運用しなければならない。SANは、ストレージ専用の高速なネットワーク環境にハードディスクや磁気テープ装置などのバックアップ・デバイスを接続し、複数サーバでストレージを共有するデータ管理システムである。SAN管理では、デバイス管理、ストレージネットワーク管理、容量管理、アクセス管理などの管理機能を持ち、これらの管理を一元的に行う。

 SANが実用化された当初、ストレージの統合・集約が可能になったことから、運用管理コストの引き下げに成功した。しかし、SANに接続するデバイスが多様化したり、異なるベンダのストレージ管理やSAN管理が同時に求められるようになったこと、加えて爆発的なデータの増加、データ保管の重要性の高まりといった影響もあって、再び運用管理コストが増加した。

 このような状況を踏まえ、現在ではベンダ間でストレージ管理ソフトウェアとハードウェアの互換が可能になり、インターフェイスが標準化されるに至った。そのストレージシステム相互運用仕様「SMI-S(Storage Management Initiative - Specification)」は標準化団体DMTF(Distributed Management Task Force)が定義したもので、後にSNIA(ストレージ・ネットワーキング産業協会)へ移管されている。標準化に伴ってSMI-S準拠のシステムも普及してきており、相互運用における運用管理コストの削減につながるとされている。

 SAN管理による効率化のポイントは、ユーザまたはアプリケーションが使用する領域の容量が不足した際に自動でストレージから容量を追加できる、プロビジョニング機能である。これは、システムにかかる負荷や容量の需要状況に応じてシステムリソースを自動的に調整できるようにすることで、事前のリソース確保の無駄を省きながら、急激なリソース消費にも対応できる技術である。こうした技術は、同一のサーバで各ストレージ、データーベースを共有する統合「ストレージ管理」ソフトウェアの出現によって可能になった。

 以前であればデバイス毎に異なるソフトウェアによる管理を強いられていたが、最近ではSAN管理を通してストレージ管理を共通化、自動化できるようなシステムが登場している。データ管理やアーカイブ管理を戦略的に進めていく必要がある今、このようなシステムを活用することも有意義な選択のひとつといえる。