■07/09/18 【第48回】データアーカイブとその課題 第2回

■データ管理と保護
 インターネット普及以前の文書管理は、一定の社内規程に沿い、主として紙媒体による統制がなされていた。しかし今日ではIT社会の進展にともない、情報管理は紙媒体ではなく、ストレージデバイスに蓄積されたデータを電子的に保管する時代になった。eメールによる情報交換やメディア交換による一般情報(見積もり・在庫データ・受発注データ)と機密情報(経営情報・顧客情報・開発情報)の急速な増加は、改めて企業に量的・質的なデータの管理・保存問題(データ統制)を投げかけている。


 通常の業務活動において、データ問題は、
1.データの消失
2.内部または外部侵入者によるデータ破壊・改ざん
3.データ量の増大によるリソースへの影響
4.3に由来するシステム全体への悪影響

などがあげられる。これらすべては、個々人の活動の効率を下げるだけでなく、企業のIT環境全体の保全と外部信用を悪化させる要因にもなる。

 データ保存にあたって、ハードウェアやシステムへの影響を考慮した場合、ただやみくもにすべての情報をバックアップする必要はない。重要度、参照度、時間および期限、機密度などに大別し、質的な管理を行うことで、量的な管理も可能になる。ビジネス遂行上必要なデータと、必ずしも必要ではないが保管しておくべきデータを区別し、バックアップデータを他のメディアへ移管する(アーカイブ)ことが大切になるのである。

■バックアップとアーカイブ
 バックアップは、システム上のデータを別メディアに複製し保存することを意味する。これはシステム障害に際して、データを復元(リカバリー)することを目的にしている。すなわち、データの復元がどの程度可能なのかが重要であり、不必要なデータが復元され、必要なデータが復元されないのでは、そもそもバックアップの意味はないのである。バックアップの基準は、復元ポイント(復旧ポイント)と呼ばれるリカバリーポイントと、障害発生後データを復元させるために必要な時間の両面を考慮しなければならない。バックアップシステムを検討するにあたり、バックアップは常に「最新」のデータしか復旧できず、定期的なバックアップの期間が長い場合には長期に渡り編集されたデータが喪失する危険があるため、常にバックアップコストと保存期間のリスクの両面から、バックアップシステムそのものを再考する必要がでてくる。

 一般に企業のバックアップ体制は、サーバと連動したテープデバイスへバックアップするのが主流である。一旦通常のディスクに書き込まれたデータがテープに書き込まれるDisk to Disk to Tape(D2D2T)という手法が、ディスクサブシステムをそのまま複製するレプリケーションや、複数のコンピュータを接続し、その互換性を活かし1台のコンピューターのように管理することができるクラスタリングよりも安価であるため普及している。

 データ量が多い今日では、ますますシステム容量やバックアップ時間を消費し、システム運用効率が悪化される懸念がある。定期的なバックアップですべてのデータを更新する必要はないので、差分バックアップ・増分バックアップを実施するのが通常である。そうすることで、バックアップ容量とバックアップ時間を縮小することができるのである。

 アーカイブは、法規制や各監査の需要に照らし合わせ、記録として最低限必要なデータを長期間に渡り保存する必要から生まれた。これはバックアップデータの量の適性化に必要であるとともに、参照頻度(アクセス数)、データの保全性、保管メディアの信頼性、データ相互互換性が高いことを必須条件とする。アーカイブは、その目的から記録の保存性を維持するために、上書きや消去ができない記録メディアに保管される必要がある。このように、バックアップとアーカイブは、定期的なデータ削除(システム条件)と長期的なデータ保存(ビジネス要件)という相互補完性を前提にしているのである。