COLUMN

コラム

第89回:日本で相次ぐシステム障害 ― フェイスブックから学ぶインフラ運用の「訓練」とは ?

昨今、日本を支える大企業において、大規模システム障害が多発しています。復旧に時間がかかることも多く、ニュースで大きく取り上げられることもありますね。「IT 障害をゼロにする」をミッションに掲げている弊社にとっては、心が痛む状況です。

実は、海外企業でもシステムトラブルが多発しています。2021 年 10 月初めにも、米国 Facebook(フェイスブック)社(※ 当時)で、大規模なシステム障害が発生しました。みなさんも、Instagram(インスタグラム)や Messenger(メッセンジャー)などのサービスが利用できなくなったことは、記憶に新しいのではないでしょうか?
しかし、フェイスブックは、短期間(約 6 時間)、かつ、安全にシステム復旧した、と評価されています。
※ 現在は、Meta(メタ)へ社名変更しています。

このような例を端緒として、日本企業と海外企業では、システム障害発生時の対応が「雲泥の差」とも言われています・・・。では、その差とは一体、何でしょうか。本コラムで、フェイスブックの事例を手掛かりにして、その違いを紐解いてみましょう。

 

日本企業と海外企業の差、それは「訓練」の差です。
小中学生時代、学校でおこなっていた「避難訓練」を思い出してください。災害発生のリスクを考え、非常事態でもスムーズに身の安全を守れるよう準備やシミュレーションしていましたよね。

フェイスブックでは、そうした「訓練」という考え方を、システム運用にも採用し、システム障害対応の訓練を徹底しています。様々なシステム障害を想定し、実際にストレステストをおこないながら、システムを復旧させる経験を積んでいたのです。その結果、有事の際にもスムーズなシステム復旧が実現できました。
そして、フェイスブックの成功のカギは、障害発生後の復旧の技術ではなく、訓練による “事前の備え” にあったのです。裏を返せば、訓練を怠っていると、事態を悪化させる可能性があるとも言えます。

フェイスブックの事例は、システムを運用する上で「訓練」がいかに大切かを教えてくれます。どんな企業でもシステムトラブルは起こりうるもの。だからこそ、現状、自分達がどの程度の規模のシステム環境を持っているのか把握し、どのようなトラブル発生の可能性があるのか考える。そして、万が一、トラブルが発生してしまった場合にも、素早く対応し、復旧できるように訓練しておく。
こうした 現状把握 事前準備 をどこまでできているのか、その差こそが、企業の未来を左右するのではないでしょうか。

 

 

とはいえ、一体、何をどのように訓練すればいいのか、どのように現状把握し、どのように事前準備をすればいいのか・・・。一から訓練プログラムを作成し、実行していくのは、簡単なことではないでしょう。

弊社では、情報管理ソリューション「System Answer G3」の提供、および専門技術者によるコンサルティングサービスを通じ、システムの現状把握や将来予測をおこなっております。

“IT 障害をゼロにする” ソリューション
システム情報管理ソフトウェア「System Answer G3」

独自の分析機能によって、サーバーがどのくらいのリソースを消費しているのか、どのネットワーク機器にどの程度のトラフィックが流れているのか、と現状把握することができます。さらに、それらが数日後 / 数年後にはどの程度の数値になる可能性があるのか、将来予測もできます。日々の運用はもちろん、いざという時に備える「訓練」にも、ご活用いただけるでしょう

 

 

弊社は、お客様環境の “IT 障害をゼロにする” をミッションとし、システムの安定稼働に向けてお手伝いさせていただいております。このミッションを達成し、お客様の事業、ひいては、社会全体に貢献できるよう取り組んでまいります。

「どこから手を付ければいいのか分からない」といったご相談もお気軽にご連絡いただければ幸いです。

by マーケティング部 インサイドセールスグループ 増田 芽吹

一覧を見る

CONTACT

お気軽にお問い合わせ下さい