COLUMN

コラム

第92回:IT 障害に繋がる異常な状態を早期発見!~ 変動検知機能 ~

IBC が開発・販売するシステム情報管理ソフトウェア「System Answer G3」は、2021 年 9 月より順次、システムの未来を予測する新機能:将来予測オプション「キャパシティ予知」、「昨対比較」、「変動検知」をリリースしています。そこで、この将来予測オプションについて全 3 回にわたって詳しくご紹介していきます。最後となる本コラムでは、つい先日リリースいたしました「変動検知」についてご紹介します。

 

新年明けましておめでとうございます。みなさんは年末年始をいかがお過ごしでしたか。今年は久しぶりに故郷に帰省された方も多かったのではないかと思います。私も地元の繁華街が思っていた以上に賑わっており、少しずつ従来の日常を取り戻しつつあるのかなと改めて実感いたしました。しかし新たな変異株の感染者数が増加傾向にあるようで、引き続き、注意が必要ですね。

さて、今年は寅年です。寅年の相場格言は、「千里を走る」と言われ、過去の寅年は政治的なビックイベントや我々の生活様式に影響を与えるような変化が多く発生してきた年のようです。確かに今年は北京オリンピックや、サッカーW 杯、参議院選挙など、我々の暮らしに影響を与えそうなイベントが目白押しです。このようなイベント期間にいつもと異なる負荷状況になるシステムを運用する情報システム部門のご担当者様は、イベント期間に向けた準備に余念がないかと思います。そうでなくてもシステムがいつもどおり稼働しているか否かということは、情報システム部門の皆様にとっては常日頃から頭を悩ませる問題だと思います。

このような問題に、先日リリースいたしました System Answer G3 の新機能「変動検知」がとても役に立ちます。変動検知機能は、既存のベースライン機能を進化させた機能です。ベースライン機能については、既にご存知の方もいらっしゃるかもしれませんが、過去に執筆したコラム も併せてご確認いただければ、ベースライン機能についてご理解いただけるかと思います。

第61回:障害予兆検知のための時系列データと相関分析 ~ グラフを自動でブックマークに紐づけるような仕組みも作ってみました ~

 

ベースラインは、下図のような「いつも通りかどうかの範囲」を表します。この範囲から逸脱があった場合に、「いつもと異なる異常な状態」だと判断します。

 

紫色のライン:過去データから算出された平均値
緑色のライン:取得値
薄緑色のエリア:過去データから算出されたいつも通りの範囲(標準偏差の任意の倍数

 

 

では、ベースライン機能から「変動検知」機能が進化した点をご紹介します。

  • 祝日を考慮して学習可能になった(会社の創立記念日休暇なども任意に設定可能)
  • 上位何 % や下位何 % をはずれ値として学習対象外に設定可能になった
  • 学習日やベースライン判定日の手動設定が可能になった

これらの機能を実装することで、不要なアラートを大幅に削減でき、期間によって異なるシステム傾向が発生する業種・業界特有のシステムへの適用も可能になったため、様々なシーンでご利用いただけます。

例えば、

  • いつもの月末と同じ稼働状況かどうか
  • 過去の年末年始の繁忙期と比べて今年の稼働状況はどうか
  • 新システムリリース後の稼働に変化がないか確認したい
  • 飛び石連休の平日は学習対象外にしたい、不要なアラートを検知したくない

このようなご要望に変動検知機能はお応えすることができます。直近 3 年間のイベント期間の傾向を学習させて今年のイベント期間を比較するような長期的な観点での活用も出来れば、新システムリリース後 1 週間の稼働状況が変化なく安定稼働しているかどうかを確認するような短期的な観点での活用も出来るようになっています。

また、監視ノード毎や項目毎に一括で適用可否設定ができるようになり、さらには、ベースラインの範囲設定(標準偏差の任意の倍数設定)のチューニングもベースライングラフを見ながら設定可能になりました。細かい部分ですが、このような点も使い勝手が良くなっています。

一般的にシステムの稼働状況に変動がないかどうかを確認するために、エンジニアが張り付いて常時チェックすることも多々ありますが、人的リソースやコストがかさんでしまいます。「一定のしきい値を超えた」というような単純な負荷増加の事象ではない場合、「いつもと異なる事象が発生した」と、人の目ではなかなか気づけない場合もあります。そうした業務を System Answer G3 が人に成り代わっておこなうことができます。過去データを元に算出した一定のポリシーに従い、システムの変動を検知するのです。しかも、この変動検知機能は、System Answer G3 の標準機能となっています。そのため、System Answer G3 をご利用いただいているお客様であれば、先日リリースした v03.24-00 へバージョンアップしていただくことで、追加料金なく、誰でも簡単に、蓄積している過去データを元に変動検知をご利用いただけます

 

「変動がある = 即トラブル」というわけではございませんので、全ての変動がすぐにシステム障害に繋がるわけではありません。ですが、安定稼働していたシステムで障害が発生する場合は、その前に必ずどこかに変動が発生しています。ですので、いつ、どこで変動があったのかを検知することは、障害の未然防止に繋がりますし、万が一障害が発生してしまっても迅速な切り分けが可能になりますので、被害を最小化することが可能です。そのため、このような変動を検知することは、とても重要なのです。

是非、System Answer G3 の変動検知機能をご利用いただき、IT 障害に強い運用体制の構築を実現していただけましたら幸いです。

by DX・コンサルティング部 シニアコンサルタント 亀山 悟史

一覧を見る

CONTACT

お気軽にお問い合わせ下さい