本当にあった怖い話

真夏のピークが去ったような気がしないでもないが、天気予報士がテレビで言っているわけでもなく、明日あさってはクソ暑いようなのである。

とういうことで、誰が言ったか知らないが、暑い季節には怖い話を聞いて背筋を震え上がらせということなので、システム屋の怖い話をいくつか思い出して書いてみようと思う。

ある意味rm -rf /

これは後輩から聞いた話。
ある日、当社が監視しているシステムが動作しなくなったとのことで、開発会社に問い合わせた。すると、なぜかこのシステムの重要なファイルがことごとく消えているというではないか。

監視はしているけれど、削除とかしているわけではないので、詳しくしらべてもらったところ、以下のようなことが判明した。
①このシステムでは定期的に古いファイルを削除する処理が動作する。
②この処理は、指定されたフォルダに対して、ファイル削除処理を実行する。
③削除処理前に、プログラムはcドライブ直下をカレントディレクトリにしている
④プログラムは「指定したフォルダに移動して、そのフォルダ以下のファイルフォルダを削除する」
⑤指定したフォルダがない場合、、、、、、
移動に失敗するが、削除処理は動作する。

古畑任三郎は言った、たまたまが重なるのは2回まで

これは私がやらかした話。

あるシステムのリカバリ処理に呼ばれた。リカバリ用の管理アプリを起動し、「このボタン押すとリカバリめちゃくちゃ大変(というかアドリブでのリカバリになってしまう)だから、絶対クリックしないようにしよう」と思いつつリカバリ作業をやっていると、
①たまたまマウスカーソルが危険なボタンの近くにあり
②たまたま肘が後ろの人とぶつかって
③たまたまマウスの形状とキーボードの形状のせいで、、、、
マウスがキーボードの下に潜り込んでクリックされてしまった。

単一障害点が許されるのは1個までだよねキャハハ

一点モノのシステムで障害が発生したようで、その障害が私のよく知るミドルウェアで発生しているようだったので、調査に連れていかれた。

到着してミドルウェアの設定を確認してみると、2つのサーバに搭載されているHDD10本のうち
6本のHDDどれが壊れてもシステムが停止する可能性が高い設計だった

そして停止するだけならまだしも
6本HDDどれが壊れてもデータ損失が発生する可能性が高い設計だった

さらに
HDDが壊れるとリカバリに72時間かかる設計だった

そして一番おそろしいのが
このミドルウェアは「単一障害点をなくすこと」を目的としていた*1

ということで、皆さん、リカバリ作業はマウスをできるだけ使わないようにしましょう*2

*1:一体どうやったら、単一障害点除外するためのミドルウェアで、単一障害点を6か所も作るような設計ができるんだろうか。

*2:巻き込まれ事故は注意しようがない