バックアップとバックアップとバックアップとミラーとスナップショットと変更履歴

この世には6つの概念をすべてバックアップで済ませてしまうおじさんというのが存在する。実現できることが全く違うのでちゃんと理解しておくといいよ!!

①完全バックアップ
ある時点の全データの複製をつくっておくことを完全バックアップといいます。当然ながら、複製の時点までデータを復旧することができますが、「複製以降に発生したデータ」は戻すことができません。全データ複製をできるだけ頻繁にすることを考えますが、大きなデータの複製には非常に時間がかかるので、しばしば頻繁な完全バックアップは現実的な解ではありません。
できるだけデータ損失を防ぐためには、以下②⑥と組み合わせる必要があります。

差分バックアップ
完全バックアップは非常に時間がかかるため、頻度を減らしたいところです。そこで「最後に完全バックアップを採取した後に発生した変更点」のみを複製するという機能が生まれました。この機能を差分バックアップといいます。例えば完全バックアップを週に1回、差分バックアップを1日1回とすることで、日々のバックアップ時間が非常に長いという状態を防ぐことができます。とはいえ、最後に取得したバックアップから、次回の差分バックアップまでに発生したデータが損失した場合、復旧できません。

③バックアップ
同じことができる機材、環境、人材をあらかじめ用意しておくことをバックアップといいます。当然ながら、データ損失には対応できません。データの損失が問題にならない、データ損失対応は別途用意されている場合に使用される概念です。

④ミラー
「HWが故障してもシステムが動作し続ける」ことを目的としています。③の概念と近いため、バックアップと呼ばれることがありますが、非常に危険です。ミラーは「HWの障害でデータ損失する可能性」を大幅に減らすことができますが、SWの問題でデータ損失する可能性は削減できません。人間のミスによるデータ損失も防げません。データ損失を防ぎたいのであれば、①、②、⑥と組み合わせる必要があります。

⑤スナップショット
「一瞬で複製を行ったかのように見せかける技術」をスナップショットといいます。上記①のバックアップはどうやっても時間がかかってしまい、かつバックアップの最中にも新しいデータが発生してしまいます。スナップショットは「採取した時点の状態を複製せずに固定」することができます。
よく用いられるのは、スナップショット採取以前のデータを「更新禁止」に、採取以降のデータを「差分データ」として管理し、現在の状態は「更新禁止データ」と「差分データ」のサマリ、スナップショット採取時のデータは「更新禁止データ」から取得する方法です*1
本手法の弱点は「データの複製は実際には行われていないため、更新禁止データが破壊されてしまうと、スナップショットも現在のデータもどちらも破壊されてしまう」点になります。
上記①と組み合わせて「スナップショット」→「スナップショットのバックアップ」とすることで、ある時点のデータをシステムに負荷をかけずにバックアップすることが可能となります。

⑥変更履歴、バージョン履歴
ファイルシステムやアプリケーションが提供してくれる機能。ファイルの変更が行われた際に、ファイルの変更履歴を記録しておく機能。ユーザは「記録が残っている限り」ファイルを過去の状態に戻すことができる。よってファイルサーバにて強力な効果を発揮する。人為的ミスによるデータ損失リスクやSW原因のデータ損失リスクを大幅に軽減することができる。



特にミラーをバックアップと言っちゃうおじさんはヤバいよ!!

*1:またはスナップショット採取時点で差分データの作成を開始し、スナップショット採取時のデータは現在のデータから差分データを減算して作成する