暫定球の打ち方

システム屋にとって、重要な能力のひとつが、「ゴルフでいうところの暫定球を打つべきか判断する能力」だ。
例えば、OSがこけたといったトラブルの場合、もちろんOSの復旧をトライするのは非常に重要だが、同時に復旧できなかった場合に備えて、OSの再インストール、データの抜き出し、バックアップデータの検証、これらを平行で行う必要がある。
例えば、インストールメディアが正常に動作しないといったトラブルの場合、ISO9660ファイルに変換して、データとして送ってもらうのと同時に、代替メディアを宅急便で送ってもらうべきだ。さらに言えば、代替メディアは必ず、インストールが正常に行えることを検証した上で、送ってもらうべきだろう。
なぜこんなことが、必要なのかと言えば、対応策が失敗した場合に、その失敗にかけていた時間が戻って来ないからだ。例えば宅急便が翌日配達されるためのデッドライン5分前に、メディアのコピーをはじめても間に合わない。

トラブルに対応している間に、対応策で更なるトラブルが発生する可能性は高い。そして、まず間違いなく言えることだが、対応中に発生したトラブルは、それがどんなに単純な原因で発生したことだとしても、原因を見つけて対応することは難しい。冷静さを失っているからだ。

不思議なことに、複数経路で対策をおこなっておくと、メインの経路で問題が解決し、1経路で対策を行うと、その経路がたちいかなくなって別経路を用いる必要が発生する。これは複数の経路があると言う安心感が、冷静さを取り戻してくれることが、一因だろう。
ただし、トラブル発生時、なんでもかんでも複数経路用意しておく何てことは、コスト上あり得ない。明らかに、簡単に解決可能なトラブルや緊急性を伴わないトラブル等、1経路で十分な対応がほとんどである。
難度や重要性や緊急性を加味して判断すべきだろう。もう一つ、複数経路を思い浮かべられる技術力も必要だ。これが冒頭述べた「暫定球を打つべきかどうか判断する能力」になる。

まあ、なんとなくこんな感じのことを思ったりしたりした。