障害訓練

システムというものは、その系が脆弱であればあるほど、担当者の障害対応能力があがる。トラブルが頻発するシステムの担当者は、否応無しに障害時のスキルアップを強制されると言えるし、障害がシステムの理解を加速させてくれると言っても過言ではない。
逆にいえば、完全な系に限りなく近いシステムは、担当者の障害対応スキルがあがらないし、システムの理解も深まらない。こんなシステムで問題が発生すると、解決が遅延したり、場合によっては解決が行えなかったりするのだ。
であるなら、障害を強制的に発生させてそれを解決させるというような訓練方法が必要になってくるだろう。
「壊れたシステム」を準備しておいて、その復旧を課題とすれば、一定以上のスキルがあることは、高い確度で保証できる。だから、いつでも障害時の対応を訓練できるようにクラウドとして「壊れた環境を提供する」ことが今後求められるんじゃ無いだろうか。
そして壊れた環境の復旧を定期的な義務とし、資格化してしまえば、訓練として非常に有効だろう。