多くの人々は、デジタルデータを長年にわたって保存する方法について考え、中にはすでにデータを失った経験のある人もいます。しかし、一般的なユーザーの大半は、情報アーカイブの専門家ではないため、そのような保存方法をどのように組織化すべきかについて考えないか、あるいは成功したものの統計的には重要ではない個人的な経験から必ずしも正しい結論を導き出せないことがよくあります。
この記事では、重要なファイルを何年も後でも利用できるようにしたいと考えている場合、特に一般ユーザーに焦点を当てて、具体的に何を考慮すべきかを詳しく説明します。つまり、私たちの目標は、可能な限り長い期間、つまり数十年間、運が良ければ100年間もデータを保存することです。
数十年にわたるデータ保存 — そのためには何が必要か?
現在および新規のデータを非常に長期間保存することを決定した場合、まず考慮すべきことは、特定のタイプのストレージ、つまり最も長寿命のストレージが必要だということではありません。
最も重要な「要素」は、潜在的な障害点を考慮した保存戦略です。これは、必要に応じて調整しながら継続的に運用するシステムです。
ストレージは重要な要素ですが、考慮すべき唯一の要素ではありません。重要なデータを「最も信頼性の高いディスク」に一度だけ記録し 安全な保管場所に保管しても、しばらくするとデータにアクセスできなくなる可能性があり、その期間は100年どころか、10年にも満たない場合が多いのです。
失敗の考えられる原因
アーカイブデータの長期保存に関しては、「明日までデータを保存する」というケースよりも、失敗の原因となる要因がはるかに多くなります。
保存を妨げる要因としては、どのようなものが考えられるでしょうか?いくつかの例を、カテゴリー別に挙げてみましょう。
物理的なリスク
- 書き込み時の隠れた障害、または「ファントムコピー」。最も厄介でありながら、特に偽造のフラッシュメモリやSSDが市場に出回っている現状では、十分に起こりうる問題の一つです。これは、ごく普通のストレージでも発生する可能性があります。メモリセルや SSD コントローラの障害、光学ディスクの書き込みドライブのエラーなどが原因です。要点は、手動またはバックアップツールによるコピープロセスは、あらゆる点で正常に完了したように見えますが、実際にはデータがまったく書き込まれていないか、整合性が損なわれた状態で書き込まれているということです。
- 外部要因(光、熱、湿気、衝撃、電場)がなくても、保存期間に応じてストレージが劣化すること。これは、一般ユーザーが利用できるあらゆるタイプのストレージ(ハードディスク、SSD、メモリカード、その他のフラッシュストレージ、光ディスク)に当てはまります。
- ストレージの紛失または破壊:盗難、外部要因による保管場所の破壊、紛失(または家族によるゴミ箱への「廃棄」)。
- 「静かな」データ破損(ビット腐敗)。ストレージ上のビットの偶発的な変化。あらゆるタイプのストレージで発生する可能性があります。この場合、ファイルはストレージ上で表示され、開くことも可能ですが、一部のフラグメントはアクセスできません。圧縮および暗号化されたデータのアーカイブにとって特に危険です。これらのデータの場合、個々のビットが破損しただけでも、正常に保存された情報さえも読み取ることができなくなる可能性があります。
技術的リスク
- ストレージを読み取ることができる互換性のあるデバイス、特に特定のストレージデバイスへのアクセスがない場合。より一般的なストレージは通常、より簡単です。たとえば、2025年の今日でも、3.5インチフロッピーディスクを読み取ることができるドライブを見つけることができます。
- プロプライエタリなファイル形式のサポート終了。例:Adobe PageMaker や Adobe/Macromedia Flash を使って文書を作成した場合、その文書を開くことはまだ可能ですが、以前ほど簡単ではありません。これらのサポートと開発が終了してから、それぞれ 20 年と 5 年が経過しています。
外部および経済的なリスク
- 財務。たとえば、今日、ストレージシステムの構築に投資することができます。しかし、数十年後にデータを読み取るために、例えば故障した機器の交換など、その時点で自分の能力を超える投資が必要にならないという保証はありません。
- クラウドプロバイダーによるデータのアクセス不能または破壊。後者は可能性が低いでしょう。一方、前者は現代の世界では十分に起こりうることであり、ある意味で既に起こっています。認証が不可能になることから、特定のサーバーにアクセスできなくなることまで、さまざまな形で発生しています。
人的要因
- 暗号化されたデータのパスワードを忘れたり紛失したりすること。
- ストレージの内容や価値を知っている、あるいは理解している人物がいない。あなただけが理解できる「特別な」方法でストレージを整理し、可能な限りわかりやすい説明書を添付しなかった場合、あなたの後継者が十分な好奇心やスキルを持たない限り、データは失われてしまうでしょう。
より長期の保管に関しては、このリストはさらに広がります。本当に長期間の場合、言語の変化、電力の入手困難(または非常に高いコスト)、半導体製品の生産の停滞、現在予測が難しい法的規制などの要因が影響し始める可能性があります。
これらはほんの一例です。実際には、戦略が失敗する可能性はもっと多くあり、失敗につながる可能性のある事態を最大限に考慮した保管システムを構築するために、事前に検討しておく必要があります。
自律的なデータ保存のためのストレージの信頼性
データ保存に関して、ほとんどのユーザーが注目するのはストレージです。どのストレージがより信頼性が高く、どのようなリスクにさらされており、それぞれのストレージでデータを何年間保存できるのか、といった点です。
これらの質問に対する簡単な答えは、コンピュータから切り離した状態で保存した場合のデータをまとめた表で説明できます。
ハードディスクドライブ(HDD)
保存期間: 3~10年
主な要因とリスク:
機械的要因と磁気的要因。モーター内の潤滑剤の劣化、ヘッドとプラッタの「固着」(スティクション)、セルの漸進的な磁気消失(ビットロット)。
アーカイブに関する推奨事項:
注意して扱うこと。 磁場を更新し、機械的状態を確認するために、1~2年に1回、定期的に接続する必要がある。「設置してそのまま」には向かない。
SSDドライブ(TLC/QLC)
保存期間: 2~10年
主な要因とリスク:
電荷のリーク。メモリセル内の電荷は、時間の経過とともに「リーク」します。リークの速度は、保管温度(温度が高いほど速くなる)とセルの劣化に大きく依存します。
アーカイブに関する推奨事項:
細心の注意を払って扱うこと。長期の低温保存にはまったく不向き。不適切な条件下では、2、3年でデータが劣化する場合がある。
USBフラッシュメモリ/メモリーカード
保存期間: 1~5年
主な要因とリスク:
低品質のフラッシュメモリ。SSDと同様ですが、通常、信頼性の低いチップやコントローラが使用されています。警告なしにデータが完全に失われるリスクが高い。
アーカイブに関する推奨事項:
推奨されません。データの転送には適していますが、保存には適していません。
光ディスク(CD-R、DVD-R)
保存期間: 5~20年
主な要因とリスク:
有機層の劣化。有機色素の記録層は、光(特に紫外線)、湿気、温度変化によって劣化します。ディスクの品質が極めて重要です。
アーカイブに関する推奨事項:
条件付きで適している。 重要度の低いデータのみに使用すること。信頼できるメーカーのディスクと、理想的な保管条件(暗所、低温、乾燥)が必要である。
光ディスク(BD-R HTL)
保存期間: 15~50年以上
主な要因とリスク:
無機層の安定性。光に耐性のある無機相変化層を使用。リスク:物理的損傷、ディスクの層間剥離(接着剤の劣化)、反射層の酸化。製造品質が重要な要素。
アーカイブに関する推奨事項:
推奨。長期アーカイブに適した、良質で入手しやすい選択肢です。トップメーカー(Verbatim/MCC、Sony、Panasonic)のディスクを選ぶことをお勧めします。
光ディスク(M-DISC)
保存期間:100年以上(1000年と公表)
主な要素とリスク:
超耐久性のある無機層。特許取得の「石」層を使用しており、レーザーで物理的に焼き付けられます。外部要因に対する耐性が最大です。 注意点:この技術の最大の利点と研究が進んでいるのは、DVD M-DISCです。BD-R M-DISC も非常に信頼性が高いですが、高品質の BD-R HTL との違いはそれほど顕著ではありません。
アーカイブに関する推奨事項:
強く推奨します。 最も貴重なデータに対して「記録して棚に保管する」という戦略に最適な選択肢です。
テープドライブ (LTO)
保存期間: 15~30 年
主な要因とリスク:
磁気テープの安定性。アーカイブの専門的基準。テープは非常に安定していますが、読み取り/書き込みには特殊で高価な機器が必要であり、保管条件も厳守する必要があります。
アーカイブに関する推奨事項:
推奨。 企業および専門的アーカイブのゴールドスタンダード。家庭での使用には通常、高価で複雑すぎます。
実際には、事態はもっと複雑です。表の数値は保証ではなく、統計および確率値であり、保管条件やストレージの製造品質から、特定の製造ロットやお客様への配送条件まで、さまざまな要因の影響を受けます。
また、個人的な経験もここでは当てはまりません。15年前のメモリーカードでも、そのデータがまだ完全に読み取れる場合もあります。しかし、それはそれが信頼できる保存方法であるという意味ではありません。それは、今日の製造技術とは異なる、単なる幸運に過ぎません。統計を参考にしてください。
なぜ、コンピューターから切り離した状態での保存について話しているのでしょうか?その理由は、リスクの低減にあります。確かに、接続された SSD は電荷の漏れの影響を受けにくいですが、誤操作、マルウェア、OS の障害によってデータを失う可能性は高くなります。NASストレージも完全に保護されているわけではありません。脆弱性やその他のファームウェアの欠陥が頻繁に発見されています。クラウドストレージやネットワークストレージとの自動同期?暗号化ウイルスによる被害も同期される可能性があります。
「リアルタイム」のアーカイブには最適です。しかし、完全に「オフライン」のデータコピーも用意しておくのが賢明でしょう。
情報損失の可能性を減らす方法
ここでは、データの保存を保証するものではありませんが、成功の可能性を高める基本的な原則についてご説明します。
- 1つのコピーだけに頼らないでください。それは失敗につながる可能性が非常に高いです。よく知られたルール、一種の標準である「3-2-1」があります。これは、3つのデータコピーを2種類の異なるメディアに保存し、1つのコピーを別の地理的な場所に保管することを意味します。これは、家庭ユーザーには必ずしも実現できるものではありませんが、真剣に検討する価値があります。他にも、4-3-2 や GFS などのアプローチがあります。
- プロプライエタリなファイル形式や圧縮ファイル形式は避けてください。前者は、サポート終了やソフトウェアの入手不可により、開くことが困難になる場合があります。後者はデータ破損の影響を受けやすい:非圧縮形式は、多少の損失はあるものの、破損しても正常に読み取ることができるが、圧縮形式は完全に読み取れなくなる可能性がある(ただし、アーカイブには、アーカイブ時にそのように設定しておけば、破損時の復元用の追加データが含まれている場合がある)。
- 定期的にデータの監査(チェック)を行い、根本的に新しい、またはより信頼性の高い/適切なストレージが登場したら、移行を行ってください。最初にデータが書き換え不可のストレージに記録されていた場合は、移行時にそのストレージを廃棄しないでください。
- ビット腐敗の要因を考慮してください。ストレージ上のデータに望ましくない変化が生じていないことを確認する唯一の方法は、バックアップの前後、およびその後もチェックサムを照合することです。ここでは、ExactFile、QuickSFV、TeraCopy、HashCheck、CrcCheckCopy などのツールを学習しておくと役立つでしょう。リストは冗長です。ご自身に合ったものを選択してください。必要なメカニズムがすでに組み込まれているファイルシステム(ZFSなど)もありますが、それらを使用すると、最も人気のあるOSでFSが広くサポートされていないため、自分以外の誰かにとって、このファイルシステムを搭載したディスクが「故障している」と認識されるリスクがあります。
- データに関するドキュメントは、将来自分や、そのデータの利用対象となる可能性のある人のために、ストレージのルート、つまり物理メディア上でそのデータが保存されているのと同じ場所に、各コピーとともに保管しておいてください。ドキュメントには、データそのものとその価値だけでなく、データへのアクセス方法も記載しておくことが重要です。今日では当然と思われることも、10年、20年後にはそうではないかもしれません。
- デジタルデータの保存方法を研究してください。さまざまなアプローチがあります:単純な階層、ジョニー・デシマル、PARA、年代順、タグ付けなどです。自分だけでなく、そのデータの対象者にとっても適切で理解しやすい方法を見つけてください。
- 写真や文書など、物理的な形で表現できるデータは、デジタル形式だけでなく保存しておくことが重要です。これにより信頼性が高まり、読み取りデバイスへの依存度が低下し、自分以外の誰かがそれらに気付く可能性が高まります。デジタルデータは壊れやすく、肉眼では読めない。
- 重要なビデオは、ファイルとしてだけでなく、通常のブルーレイディスク形式でも記録して、家庭用プレーヤーで再生できるようにしておくのが良い。動作するドライブを備えたこのようなプレーヤーやゲーム機(これらもビデオを再生することができます)は、何年も経ってからでも見つけることができ、古いソフトウェアを探す必要はありません。また、組み込みのエラー訂正アルゴリズムにより、再生が成功する可能性が高まります。
- 資金に余裕があり、読み取り装置自体を乾燥した場所で「保管」できる場合は、有用である可能性があります。
追加情報
10年以上前に書かれたこの資料の最初のバージョンでも、そして今日、その更新版でも、私は何度か光学ディスク(Blu-Ray、 M-Disc DVD などについて何度か言及しました。2025 年には、もはや誰も使用していないこの技術は、果たして現実的であるのか、という疑問を持つ方もいらっしゃるかもしれません。
私の見解では、はい、現実的です。このタイプのストレージは、人と人、あるいはデバイス間の高速データ転送には適していませんが、データアーカイブの保存には適しています。
- これは、一般ユーザーが利用できる、重要なデータをオフラインで保存する最も信頼性の高い方法の1つであり、HDDなどの他のタイプのストレージを補完するものとして、安心して使用することができます。
- 高品質のBD-R HTLディスクやM-Discは、今でも購入することができます。有名な中国のサイトを利用する必要があるかもしれませんが、入手不可能というわけではありません。
- ソニーをはじめとする一部の企業は、光学ディスクカートリッジを使用した企業向けストレージシステムを、現在も製造しています。データ保存期間は50年間保証されています。同じ製造ライン(Sony BD-R 128 Gb)のディスクは、一般ユーザーも購入することができます。
- M-Disc DVD は、組織によるテストや一般ユーザーによる実験で、その並外れた信頼性を実証しています。これらの実験結果は、ロシア語圏のインターネット、例えば IXBT フォーラムなどで閲覧できます。M-Disc Blu-Rayも存在します。記録可能なデータ量がより多いにもかかわらず、テストでは、その信頼性は他の高品質BD-Rに近く、それらにとって達成不可能なものではないことが示されています。
私の推奨は、本当に重要なデータの追加の信頼性の高い、かつ多額の費用を必要としないコピーを作成する必要がある場合、このタイプのストレージを軽視しないことです。ただし、ディスクの品質が最優先事項であることを覚えておいてください。
結論
データを数十年にわたって保存するという構想は、大胆ですが、正しいアプローチを取れば実現可能です。その主な構成要素は次のとおりです。
- 計画性と体系性
- データの冗長性
- 積極的な管理
- オープンなデータ形式
- さまざまなタイプのストレージの使用
- 情報の文書化と整理
