通信障害
先般のKDDI様での通信障害は、トップの会見で一応の区切りとなりました。ライフラインとなった通信の重要性と危うさの点で改めて様々な問題提起となりました。一つは人為的ミス。人は必ずミスを犯します。長年コンピュータに携わり、SEもしていると様々な場面に出くわし肝を冷やしたことも何度あります。いつの間にか膨大になったシステムの更新。恐らく現場では何度もシュミレーションをして準備をしていたことかと思います。簡単な人為的ミスが発端だそうですが、大抵の場合そうです。そしてそれらは想定外の方に転んでいきます。難しいのは実機でのリカバリ確認ができない事です。これで行けるはず、こうなっているから、こうすればうまくいくはずというものの繰り返しです。皆さんのバックアップシステムは一度でもバックアップから戻して立ち上げたことがありますか?普通は怖くてできないですよね。(笑)今あるシステムを使ってやろうものなら、何かあったら復帰できないということですから。つまり、同じ構成のマシンを用意してそこでやって見るというのが求められます。中々そこまでお金をかけることはできないと思います。コールドスタンバイと言った2重に機器を持っているところもありますが、本番環境と切り離されてなかったりするのでこれはこれでそういう向きには使いにくかったりします。せいぜい、納品時に一度確認した程度かなと思います。ましてやデータが膨大になってきたシステムを入れ替える。。コピーだけで何日も。。途中でとまったらどうしよう。。眠れない日々となります。そういう危ういものの上にあるということを経営者も理解しないといけないでしょう。なんでそんなことが起きるのって言っている間は、DXできてません。切りがないのも事実ですが、リスク判断があっても先のようなことは起こるわけです。責められるべきですが、事例として全SEが参考にできるような資料公開があればいいですね。