COLUMN

コラム

第69回:システム運用自動化に取り組んでみませんか? ~ System Answer G3 と Kompira 連携 ~

皆様、ネットワークやサーバー機器に対する日々の障害対応は、どのように実施されておりますでしょうか。

 

今回のコラムは、System Answer G3 と運用自動化プラットフォームである Kompira との連携をおこない、問題の事前検知と障害発生時の運用自動化というテーマでお伝えしていきます。

 

早速ですが、皆様、人は足りていますか? 総務省が公開している情報通信白書を見ると、日本の生産年齢人口は 1995 年をピークに減少の一途をたどっており、情報通信産業の雇用者数も、急増することはないと読み取ることができます。

 

【我が国の人口および人口構成の推移】

出典:総務省「平成 30 年版 情報通信白書

 

【情報通信産業の雇用者数の推移】

出典:総務省「令和元年版 情報通信白書

 

このような情勢の中で、皆様はどのような運用管理の体制を敷いておりますでしょうか。企業様によりさまざまな工夫をされていると思いますが、限られた人員で品質を担保したまま運用を続けていくには限界があります。そこで、活用したいのが運用の自動化ですが、まずは順を追って、インシデントから考えていきたいと思います。

 

インシデントが発生した際は、「問題(未知の解決すべき対象)」と「既知のエラー(原因・対策が判明している対象)」に分けられます。

 

① 問題(未知の解決すべき対象)

「問題」に対しては、System Answer G3 を用いて機器の性能情報を取得し、変化点を事前に捉えることで、未然に防ぐことが可能です。具体的な分析の方法としては、System Answer G3 に標準機能として搭載している以下の機能で実現することができます。

 

■ ベースライン

過去の稼働状況から時間別平均値、偏差値を自動学習し、稼働予測グラフを自動表示。

 

※ ベースラインの詳細については、第 61 回コラム(障害予兆検知のための時系列データと相関分析 ~ グラフを自動でブックマークに紐づけるような仕組みも作ってみました ~)でご紹介しています。

 

■ トレンドライン

表示期間における増加率や減少率を自動的に計算し、グラフ上に傾向線を描画。

 

■ タイムシフト

表示した時間と直近過去の同じ時間のグラフを重ね合わせて、現在と過去の状態を比較。

 

■ レイテンシー分析

レスポンス監視のデータから、ランクを設定することで遅延状況を把握。

 

また、性能情報以外にも、サーバーの役割に応じたプロセスごとの状況監視(CPU・メモリー・プロセス数)や特定ポートへのレスポンス監視をおこなうことで、サービスが適切に提供されているかという点から監視ができます。

 

② 既知のエラー(原因・対策が判明している対象)

「既知のエラー」については、取得している性能情報やプロセスごとの状況などに対して、静的なしきい値を設けることにより、対応を実施するためのトリガーにすることができます。ただし、アラートを受信した際に、ログの収集をおこなったり、一次復旧作業をおこなったりと、人の手が介在している場面も多く存在するかと思います。

 

そこで、運用自動化プラットフォームである Kompira との連携をおこない、アラート発生後に以下のような定型的な作業を自動化してみてはいかがでしょうか。

・複数のアラートをもとに対応可否を判断
・対象機器にログインし、ログの収集や一次復旧対応の実施
・電話やメールで担当者に連絡
・インシデントチケットの起票                 など

 

System Answer G3 だけでは実現できない一次復旧対応までの処理を、Kompira と連携することにより解決できます。

 

「人は増えないが、対象機器が増える」といった状況下において、同時にアラートが発生した場合、どうしても優先度をつけて順番に対応しなければなりません。また、担当者のスキルセットによる対応の属人化も、大きな課題として挙げられます。

 

対応している工程を細かく見ていけば、定型化できる部分はあり、まず、その部分だけでも定型化することで大きな工数削減につながります。積極的に Kompira と連携して対応フローを自動化することで、障害発生状況の分析や今後の対策に注力することができ、現場の付加価値を上げていくことができます。

 

冒頭で申し上げたとおり、今後、生産人口は減少していきます。そのような状況の中で、定型的な作業を、人手を介しておこなう余裕はありますか? 人の入れ替えが発生しても、ミスなく、漏れなく、品質を一定に保ち、日々の対応ができますでしょうか?

 

今回は障害対応におけるフローの自動化が主でしたが、運用自動化プラットフォームである Kompira は、設定変更などの定型作業もジョブフローに組み込むことで、申請処理や作業フローを自動化することも可能です。

 

■ 障害検知後のフロー例

 

また、System Answer G3 のオプション製品である Stats Option と連携して、報告書や分析の自動化をおこなうこともできます。

Stats Option の詳細については、第 50 回コラム(問題個所の早期発見と改善に向けて)でご紹介しています。

 

System Answer G3 + Kompira の連携により、皆様の業務品質と付加価値の向上に寄与できると考えておりますので、製品のトライアルやご要望などございましたら、お気軽にお声掛けいただけますと幸いです。

 

 

by プロダクト&サービス統括部 コンサルティングサービス部 主任 廣田 雅史

一覧を見る

CONTACT

お気軽にお問い合わせ下さい