COLUMN

コラム

第88回:シンプルなキャパシティ管理の決定版 ~ キャパシティ予知機能 ~

IBC が開発・販売するシステム情報管理ソフトウェア「System Answer G3」は、2021 年 9 月より順次、システムの未来を予測する新機能:将来予測オプション「キャパシティ予知」、「昨対比較」、「変動検知」をリリースしています。そこで、この将来予測オプションについて全 3 回にわたって詳しくご紹介していきます。初回の本コラムでは、「キャパシティ予知」についてご紹介します。

新型コロナウイルス蔓延に伴う緊急事態宣言が解除され、東京にも活気が戻ってきているのを感じます。夜の居酒屋などに賑わいが戻ってきていると共に、久々に飲み過ぎてしまって足元がふらついている会社員風の方を見ると、危ないと思う一方で微笑ましくも感じます。お台場などの大型ショッピングモールにも都外ナンバーの車が増え、土日に駐車場待ちの渋滞が発生しています。こんな光景はいつ以来でしょうか。
社会が以前の形を取り戻そうとしている状況ですが、完全に元に戻ることはありません。リモートワークなどを筆頭に働き方や経済活動のあり方は、新型コロナ以前とは異なる新しい形態で進んでいくでしょう。IT 業界は常に変化を続け、不可逆な進化をいくつも経て今の形があると思います。しかしながら今回は、今までのようなテクノロジーベースの変化ではなく、社会や人といった要因による大きな変化です。まだこの問題は継続していますが、IT 業界に身を置くものとして社会の変化や課題というものにどのように貢献していくかを改めて考えさせられます。

このような社会情勢ですが、弊社 IBC は今期で 20 期目を迎えました。創業時からネットワークのトラブルの解決のため尽力してまいりましたが、特に現在の System Answer G3 をはじめとしたキャパシティ管理の製品やレポートサービスなどは長年お客様から支持されています。
我々のレポートサービスでは、サーバーのリソースやネットワークトラフィックが現在どういった傾向で、いつ性能限界を迎えるか、もしくは現在の異常箇所はどこなのかといったことを報告させていただいています。
この度、そのノウハウをもとにレポーティングサービスとしてご提供しているものの一部を「将来予測オプション」として製品化しました。その中でも「キャパシティ予知機能」は多くのお客様がトラブルを未然に防ぐために必要な情報です。過去のデータから将来のサーバーリソースやトラフィック量がどの時点でキャパシティオーバーとなるのか、その情報が監視設定を入れるだけでわかる / 予測できる機能になっています。
本コラムでは、将来予測オプションの中でもキャパシティ予知の機能概要と活用方法について簡単にお伝えできればと思います。

繰り返しになりますが、今回の将来予測オプションは、弊社の提供するサービスでおこなっていることを機能化したものになります。System Answer G3 を利用したレポーティングサービスや SAMS(MSP:マネージドサービスプロバイダー)の月次レポートなどでキャパシティに関する報告をしていますが、私も MSP 運用者として将来のリソースひっ迫がわかった時点で通知が欲しいという思いがありました。しかし、このような予知機能は IT インフラの監視製品としては実装しにくいというのが正直なところです。まず、開発者としてはそのデータや予測の精度が非常に気になる部分ですし、結果を保証することもできません。また監視という機能で考えた場合は、現在の状況をモニタリングするのが監視機能であって、そのため何が監視できるのか、どういったアラートが出るのか、といったことが焦点になることが多く、将来のことは監視よりも BI(ビジネスインテリジェンス) やコンサルに頼るというのが一般的です。更にその機能が、何らかのロジックでかなり正確な結果が得られるとなったとしても、その計算をするために既存監視製品の 5 倍のサーバースペックが必要です、となってしまえばと、なかなかお客様に使っていただく機会がありません。
そういった意味でバランスをとるのが非常に厄介であったため、社内でもいろいろな議論がありましたが、この度シンプルな機能に絞ってリリースすることができました。

簡単にどんな機能か説明いたします。仕組みは非常にシンプルで、過去のデータから最悪のケースを想定した場合に、将来どの時点でリソースがひっ迫するのかを検出し、アラートを通知する機能になります。以下が機能概要です。

  • キャパシティ予知の直線をグラフ描画
  • 予測に必要な基礎データとなる計測期間(過去何日など)は任意に設定可能
  • 任意のしきい値またはリソース上限値に到達する日を予測値として保持
  • 物理的に上限のあるメモリ容量やディスク容量などの最大容量を 100 % として自動で最大値設定
  • 予測した日を一覧で閲覧でき、かつホスト名や予測日などでフィルタリング可能
  • アラート検知基準としての物理最大値 / しきい値の両方を選択可能
  • バッチ処理アラート通知として、日ごと、週ごと、隔週、月ごと、任意のタイミングでアラートを通知し、通知するタイミングはお客様にて時間で指定可能

今までも弊社のサービスや、System Answer G3 のデータを目視すればある程度予測できていましたが、この時点、つまり将来のリソースが上限に到達する予測日時が判明した時点でアラート情報として通知することはできていませんでした。その点を機能化したことがポイントになります。

以下、実際の画面を用いてご紹介します。

 

図1. キャパシティ予知グラフ

 

図1 は実際のキャパシティ予知機能のリソース予測グラフです。

右肩上がりの緑の直線がキャパシティ予知の予測線になっており、過去のデータから見ると、“このセッション数のグラフは 2022 年 3 月 23 日にはしきい値に達しますよ” というアラートがユーザーに届きます。実際にはこちらの機器のスペック上限が 40,000 セッションで、その 80 % でアラートとして検知するように設定しており、何日連続(例えば5日連続)でしきい値超過予測を検知したかをトリガーにしてアラート通知をおこないます。
このグラフだけ見ると、「まぁそうなるよね」とか「手作業でも計算できるよね」という声が聞こえてきそうですが、意外と実際の運用上はそうならないことが多いと思います。

以下のグラフをご覧ください。

 

 

図2 と 図3 はキャパシティ予知機能でアラートを検知したグラフの 1 週間と 1 か月のデータです。このグラフを見る限り上昇傾向にあると気づく人はほとんどいないのではないでしょうか。お読みいただいている皆さんは、多くの機器やサーバー、クラウドインフラを管理している運用者かと思いますが、それぞれのデータを個別にチェックし続けることは困難ですよね。仮に現在の状態を毎日モニタリングしていますという方がいても、図1 の傾向は把握できていても 図2、図3 の状態を予測することは極めて困難でしょう。
弊社の System Answer G3 を利用されているお客様で最も多い層ですと、リソースのデータソースが 5,000 ~ 20,000 に及びます。そのデータ全ての上昇傾向に対して事前に検知し、日時を予測し、対策を打つということを可能にしたのが、今回のキャパシティ予知機能になります。

この機能は将来予測オプションの一部の機能ですが、将来予測オプションは過去データが溜まっている状態ほど威力を発揮するオプション機能です。そのため既に System Answer G3 をご利用のお客様には是非使っていただきたい機能ですし、これから導入を検討したいという企業様については 3 か月のデータがあればかなりのリソースで予測ができますので、重要なリソースほど早めに監視をおこなうことを推奨いたします。

System Answer G3 上ではトレンドラインアラートという表示になっている今回のキャパシティ予知機能のアラートですが、皆さんにはこの一覧画面も是非ご活用いただきたいと考えています。

 

図4. ログ – トレンドライン

 

図4 は全体を監視分析することでどの監視項目がいつキャパシティを超えるのかを一覧で確認できる画面です。更に予測日時まで表示されていますので、どれから対策すればいいのかすぐに把握することが可能です。

また、上部の横棒グラフは 1 か月以内に ×× 件、3 か月以内に ●● 件のリソース超過が起きますという全体数を示しています。仮にこれをレポートで出して欲しいと IT コンサルに依頼したらいくら費用がかかるかわかりません。それだけ価値のあるデータがこの画面から「いつでも」「最新の状態」で確認することが可能です。

そして、各フィールドはフィルタ条件を書けるようになっています(図4 ①)。ここで絞込することもできますし、上部の棒グラフ(図4 ②)の例えばしきい値超過の部分をクリックすると、図5 のようにその条件に合ったフィルタがかかった状態で表示してくれます。

 

図5. 3 か月以内アラート – しきい値超過

 

このように、蓄積したリソースデータから予測した情報を簡単に見える化する機能がキャパシティ予知機能であり、将来に向けたアクションを運用現場にもたらしてくれる機能でもあります。

 

IBC は 20 期目を迎え、新たなミッションとして「IT 障害をゼロにする」を掲げています。そのための第一歩として長年培ってきたキャパシティ管理について、キャパシティ超過が起こる前に通知する機能をリリースできたことは非常にうれしく思っています。
新型コロナの状況はまだまだ先を見通せない状況ですが、我々は皆様の IT システムの健全性を保つために今後も次のアクションに繋がる機能を検討し、将来に不安を感じさせない IT システム運用に貢献していきたいと考えています。

 

by ビジネスソリューション事業本部 プロダクト事業部長 橋本 和也

一覧を見る

CONTACT

お気軽にお問い合わせ下さい