VMware/サーバー/ネットワーク監視ツール
COLUMN
2012.02.28

第10回:「レスポンス」の監視を考えてみて

今回の「kanshi de mirai」は、2月8日(大安) に新しくサービス提供を開始しました「System Answer RS ~今日のレスポンス~」にまつわるお話をいたします。

ICTサービスの運用の中で、多数発生し、解決することが難しい事象の一つとして、「レスポンスの遅延」があります。

下記のような経験はございませんか。

  • エンドユーザーから「***システムが遅い!!」と言われたが、システムを調査したタイミングでは正常で、
    結局解決ができなかった

そもそも遅延が発生したことを把握できないので、どうしようもないという意見も多数お聞きします。

サーバーとクライアント(サーバー)間の通信には、大きくネットワークの遅延とサーバーの遅延が発生します。アイビーシーでは、サービスレベル管理の位置付けで、初期リリースの製品からレスポンス監視機能を搭載しております。ネットワークの遅延を把握するICMPレスポンス監視や、サーバーの遅延を把握する各種アプリケーション(http等)レスポンス監視機能により、応答時間がどれくらいかを簡単に可視化することができました。

数年前からWAN回線ではベストエフォート型が普及し、最近ではクラウドが爆発的に発展していく中で、このレスポンスの問題は非常に重要な位置付けとなってきました。また、「早い」「遅い」といったレスポンスというものは、「感覚」的なものも含まれ、実態を捉えることが難しい要素でもあります。

レスポンスの更なる可視化の必要性から、現System Answerシリーズではサービスの「早い」「遅い」を簡単に把握することができる、レイテンシー分析機能を開発し提供をしております。

この機能はSLAの考えを盛り込み、レスポンス応答の計測結果を5段階にランク分けをおこない、サービスレベルの傾向を分かりやすく把握することで、膨大な監視対象の中から、システムのボトルネックとなる「遅延箇所」を特定しやすくなりました。またCPUやMemory、Traffic等のリソース情報も同時に取得することで、ボトルネックの「原因」までも特定することが可能となります。

社内インフラシステムでは上記の手法で解決できましたが、社外に公開しているシステムはインターネット環境を加味して考えなければなりません。

ECサイトやSaaSといった外部公開サービスを提供されている管理者の方から、自社システムには問題が無いのに、お客様からくるレスポンス遅延といったクレームの実態調査に非常に工数がかかっている、といった声をよくお聞きします。

インターネット環境は非常に複雑な仕組みであり、ネットワーク遅延で考えると、対象のお客様の地域ならびにプロバイダといった構成を考慮する必要があります。

今回発表した「System Answer RS ~今日のレスポンス~」の最大のコンセプトは、サービス品質の指標となる「お客様の体感レスポンス」を可視化するクラウド型性能監視サービスです。インターネット上に公開されているサービスを、東京・大阪・九州の3拠点からの応答状況を把握することが可能となっており、今後の需要に応じて全国の主要拠点ならびに海外にも監視拠点を設置することを検討しております。

このサービスの立ち上げ時に、計測サイトから弊社の仮のWebサーバーやいくつかのサイトのレスポンスを計測したところ、地域でのレスポンスの最小遅延値(ネットワークのベースとなる遅延)や傾向はかなり変化があることを、実測値で把握することができました。

ある一日のWebレスポンス監視の計測結果を下記に記載致します。

 

最小遅延時間

平均遅延時間

東京

7.66 ms

39.74 ms

大阪

71.24 ms

105.56 ms

九州

65.90 ms

89.86 ms

※ 計測時間 2月**日 0:00~23:59

レスポンス監視の最小遅延は、ネットワークやサーバー・アプリケーションを介しての最低限発生する遅延を表しており、平均遅延はそれぞれに負荷がかかった際に発生する遅延を加味したサービスレベルのアベレージ値と考えられます。

それぞれは非常に小さい値なのですが、Webアプリケーションは複数のセッションが発生しますので、1画面を表示するときにはセッション毎の遅延が体感として付加されます。仮にですが、このサイトを利用されるユーザーが西日本の方が多いのであれば、サイト配置としては適切ではなく、大阪方面等に配置することで、サイト利用時の快適さ(満足感)を向上させることが可能となるかもしれません。

レスポンス監視は最小・平均だけでなく、時間・曜日による傾向も加味する必要がありますし、販促キャンペーンの展開や、テレビや雑誌の特集に掲載されたといった、Webサイト提供者のイベントによるレスポンスへの影響も考慮が必要です。

このサービスは上記のような応答時間の遅延をいち早く把握できるように、メールや音声ガイダンスによる通知機能も実装しております。

システムの運用方法も変化をしており、管理コンソールで定常的にチェックをする手法から、いつでもどこでも現状を確認ができ、突発的な事象の変化もいち早く把握して機会損失を極力低減することが、変化の大きいICTサービスの運用の基本になってくると考えています。

会社の看板であるホームページがどのように見られているのか、収益を得るサービスがお客様にどのように体感されているか、を「可視化」することから、まずは始めてみませんか。

次回のテーマは「蓄積性能データ二次加工による工数削減事例」です。

by コンサルティング部 塚本浩之

お電話でのお問い合わせ
受付 9:30〜17:30(平日)
トップに戻る
上に戻る