COLUMN

コラム

IT 障害の原因は…人? ~ ITOGUCHI による運用の DX でインフラ運用の構造を変える~

アイビーシー(株) ビジネスソリューション事業本部 副本部長
兼 プロダクト事業部 事業部長
橋本和也

 

2026 年のゴールデンウィークも終わり新緑の季節を迎えましたが、 IT の運用現場の皆様にとっては、連休中にシステムの切り替えを行ったり、連休明けの問合せの数に辟易していたりと、忙しい日々をお過ごしのこととお察しします。私たちも、 6 月に控える「Interop Tokyo 2026」に向けた準備など、 5 月は営業日も少ないことからバタバタする時期です。
今回は、私たちが掲げる「IT 障害ゼロ」という命題に対し、「オブザーバビリティ(可観測性)」「運用のサステナビリティ(持続可能性)」という観点から、 ITOGUCHI がどのようにエンジニアを救い、強靭なインフラを実現するのかをお伝えします。

 

 

■  IT 障害の 8 割は 「人」 が原因?

ハードウェア障害の多くは避けられないものですが、世界的な調査データ(Uptime Institute)によれば、障害の 66 ~ 80 %にヒューマンエラーが(寄与要因として)関与しており、「重大なダウンタイムの 80 %は、適切な運用・管理で防げた」との報告があります。また、クラウドセキュリティ障害の大半は設定ミスであり、最大 99 %が顧客側の設定不備に起因しているとの報告もあります(Gartner 予測)。つまり重要な問題は、ハード故障よりも「人間のプロセス(設定・変更・運用)」だということです。

なぜ、優秀なエンジニアがミスを犯すのでしょうか。
この背景には、変更頻度の増大やドキュメント不足などが要因として考えられ、クラウド時代のインフラは、「壊れる」より「間違える」ほうが起きやすい構造になっていると思います。また、その構造上の問題を私たち自身が作り上げてしまっている状況があり、情報のブラックボックス化、情報の陳腐化(ドキュメントを更新せず、データが古くなる)、特定個人に依存する属人化などが、現場の判断を狂わせています。不運と片付けている障害の多くは、ミスを誘発する「情報の不透明性」によって引き起こされていると考えられます。

 

 

■ 運用のサステナビリティを奪う障害対策の限界

ヒューマンエラー(組織や運用設計も含めたもの)が多発する環境下で、私たちがこれまで取ってきた対策は、どのようなものだったでしょうか。多くの現場では、障害が起きるたびに「チェック工程の追加」や「ダブルチェックの徹底」といった、さらなる人間の注意力を強いる再発防止策が積み上げられてきました。しかし、このような対策だけではもはやサステナビリティ(持続可能性)はありません。それは環境の変化に対策が追い付かないことは元より、エンジニアの疲弊を招くからです。
エンジニアが本来取り組むべきことは、ビジネスを加速させるための DX 戦略的なインフラ改善であるはずです。ところが、現実は日々のトラブル対応と、手動での構成図更新といった「作業」に忙殺され、技術的な成長や未来への投資に時間が割けない「スキルの空洞化」が起きています(当社も同様の課題はあります)。「IT 障害ゼロ」への道は、エンジニアにさらなる努力を強いることではなく、「頑張らなくてもミスが起きない、迷わない構造」へと管理の在り方を DX することにあると考えます。

 

 

■ 「見えない自動化」が招く新たな不透明性

業務負荷を軽減するために「スクリプト化」や「完全自動化」を推進する動きもありますが、ここにも新たな罠が潜んでいます。特定の担当者しか中身がわからないスクリプトは「新たな属人化」を生み、インフラをさらにブラックボックス化させます 。
また、ボタン一つで全てが完了する環境は、いざ自動化ツール自体が不具合を起こした際、現場が「内部で今、何が起きているのか」という基礎的な状況把握すらできなくさせる「認知能力の喪失」を招きます。情報の不透明性が解消されないまま自動化だけが進めば、誤った設定が一瞬で全拠点へ波及し、被害を最大化させるというパラドックスすら引き起こしかねません。(逆にそういった事故が怖いので、自動化が進まないという現場もあると思います。)
本来の運用 DX とは、人間を完全に排除することではありません。人間が「見て、判断して、実行する」ための知性や情報を、テクノロジーによって拡張することであるべきだと認識しています。

 

 

■ オブザーバビリティ(可観測性)が変える「管理の解像度」

そこで重要になるのが、単なる監視(Monitoring)を超えたオブザーバビリティ(Observability)という概念です。従来の監視が「動いているか、止まっているか」を知らせるものだったのに対し、オブザーバビリティは「なぜ、その状態で動いているのか」という内部の真実を、外部からいつでも把握できる状態を指します。
IBC が提供する「ITOGUCHI」は、まさにこのオブザーバビリティをインフラ運用の中心に据えるプラットフォームです。

 

1. 情報の共通言語化

ITOGUCHI は、マルチクラウドやオンプレミスからデータを自動収集し、常に「最新の状態」を MAP (構成図)として描き出します。エンジニアを悩ませてきた IP アドレスやホスト名のリストを脳内で構成図に変換するような過度な認知負荷を排除し、情報を「視覚的な場所」としてマッピングすることで、誰でも直感的にシステムの構成を把握できるようになります。これにより、情報の解釈違いから生じる判断ミスを構造的に防ぎます。

 

2. 過去と現在の「変化」を特定

「知らない間に設定が変わっていた」「不要なリソースが残っていた」という変化は、障害の火種です。 ITOGUCHI は構成履歴を自動で記録するため、「いつ・何を変えたのか」を即座に遡ることが可能です。これにより、原因究明にかかる時間を圧倒的に短縮し、現場を「終わりのない調査」から解放します。

 

3. 属人化を「組織の資産」へ

障害対応の記録や設定の意図を、 MAP 上の資産に紐付けて蓄積します。これにより、特定の個人の頭の中にしかない「記憶(属人化)」を、チーム全員が活用できる「記録(ナレッジ)」へ変換します。ベテランが不在であっても、過去の対応履歴から「正解」を導き出せる環境を整えることで、組織としての持続可能性を実現します。

 

 

■「IT 障害ゼロ」はシステムではなく、人間を中心に考える

IT 環境がどんなに複雑になっても、それを操り、ビジネスを支えているのは「人間」です。「IT障害ゼロ」を目指すということは、エンジニアにさらなる注意を強いることではありません。むしろ、人間の注意力の限界を認め、その限界をテクノロジーで補完することで、エンジニアを「不毛な手作業」や「過度なプレッシャー」から解放することだと、私たちは考えます 。
初期の ITOGUCHI 開発着手時に「ひとことで言ったら、このツールは何?」と聞かれたことがあったので、「コミュニケーションツールです」と答えたことがあります。「はて?」という顔をされたのですぐに引っ込めました(笑)が、多くの人が共通の構成図をベースに、運用に関するやり取りができる、そういった人間(コミュニケーション)を中心に据えたサービスを私たちは目指しています。
ITOGUCHI はシステムのコンテキストを共通言語化し、今までの運用のコンテキストを大きく転換します。「IT 障害は人が原因」と言われない環境、運用作りを私たちは支援します。
運用の DX とは、決してシステムを無機質な自動化の仕組に変えることではありません。エンジニアが「見えない不安」から解放され、自身のスキルを未来のために使える「余裕」を取り戻すこと。その積み重ねが、組織としての運用のサステナビリティを実現します 。

 

6 月の「Interop Tokyo 2026」では、 ITOGUCHI Ver 2.1.0 (仮)の最新デモを通じて、この「運用のコンテキストの転換」を直接体感していただけるよう準備を進めています。ぜひ幕張メッセの会場で、皆様の現場にある「悩み」を「解決の糸口」に変えるお手伝いをさせてください 。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

INTEROPの詳細はこちら

 

ITOGUCHIについてはこちら

 

 

■もっとわかりやすく!まんがでわかるITOGUCHIはこちら

Part.1

Part.2

Part.3

一覧を見る

CONTACT

お気軽にお問い合わせ下さい