今回のコラムは、クラウドインテグレーションを提供する SCI Project が担当させていただきます。SCI(Specific Cloud Integration)は、お客様が特定のクラウドプロバイダーの仕様に合わせて運用方法を変えるのではなく、お客様が利用しているシステムの状況に合わせて、最適なクラウドプロバイダーの選定から移行や運用までを提供するプロジェクトです。また、SCI Project では、お客様ごとに最適なサービスをご提供するために、さまざまな製品の検証をおこなっています。
今回は、System Answer G2 をご利用中のお客様から「オンプレミスとパブリッククラウドが混在するハイブリッド環境の監視をおこないたい」というお声をいただきましたので、ハイブリッド環境の監視について取り上げます。
ハイブリッド環境の場合、監視をおこなうにあたってはオンプレミス、クラウドプロバイダー、マネージドサービスなどさまざまな基盤に対して、情報収集をおこなう必要があります。
しかし、クラウドプロバイダーやマネージドサービスなどでは API が独自に提供されていて、それぞれ監視方法が異なるため、System Answer G2 ですべての情報を収集するのではなく、API での情報収集が得意なツールと System Answer G2 を連携させる方法をお勧めします。
どのように連携して実現するのかをご紹介する前に、「API での情報収集が得意なツール」を選択する際に、重要であると考えるポイントを挙げます。
- ポイント1:導入が容易
- ポイント2:情報を一元的に見える化
【ポイント1:導入が容易】
環境を構築する際、煩雑で工数のかかる作業や準備が不要な SaaS 型のサービスを利用することをお勧めします。クラウドプロバイダーやマネージドサービス側で、API にて情報収集ができるようにテンプレート化されていることも重要です。また、監視することによりサーバーに負荷を与えないよう作りこまれていることも大切です。
お客様が使用しているクラウドプロバイダーやマネージドサービスとの API 連携が豊富な製品を選択してください。
【ポイント2:情報を一元的に見える化】
システムを安定して運用するには、直感的に何が起こっているかを把握できる画面構成が重要だと考えます。そのためには、見る人が見たい情報だけを見られるような、ユーザーインターフェイスが必要です。
また、特にハイブリッド環境ではシステム構成が複雑になるため、クラウドからオンプレミスまで全体の見える化をおこない、トラブル時に素早く原因調査および解決に取りかかれるように、一元的に管理できる環境が望ましいです。
例えば、ハイブリッド環境において下記のようなケースがよくあります。
- パブリッククラウド環境では、バーストする HTTP リクエストを処理するために、スケールする WEB サーバーを配置
- オンプレミス環境では、パフォーマンスを要する DB サーバーを配置
このようなケースでも、監視対象の基盤に左右されることなく管理できることが望ましく、HTTP リクエストの処理や DB サーバーの処理がどのくらいおこなわれているかといった双方の監視項目を取得することを想定しても、個別で見るだけではなく、グラフを集約して一元管理をするべきです。
◆ 検証:System Answer G2 との連携によるハイブリッド環境の統合監視
System Answer G2 はパブリッククラウドとの連携を実現していますが、今回は前述のポイントを加味し、API での情報収集が得意なツールとして、AWS 以外のクラウドプロバイダーの情報収集も可能な「Datadog」を選択し、System Answer G2 と連携した環境を構築して、検証をおこないました。
Datadog は、クラウド環境ならびにオンプレミスサーバーのアプリケーションとミドルウェアに対しては、細かい情報を容易に取得することができますが、オンプレミスのネットワーク機器やアプライアンス製品にはエージェントを導入することができず、監視がおこなえません。一方 System Answer G2 は、クラウド環境だけでなく、オンプレミスの機器に対しても細かい情報を容易に取得することができます。
上記の特徴を考慮し、次の図のようにハイブリッド環境の監視を構築しました。
※ 補足
クラウド側のサーバーは仮想マシンを、マネージドサービスはクラウドが提供しているデータベースおよびストレージサービスを指しています。
System Answer G2 は、PostgreSQL や Apache などのミドルウェアおよびアプリケーションに対しても監視をおこなえますが、今回の検証ではオンプレミス側のミドルウェアおよびアプリケーションに対しても Datadog を利用してみました。
なお、Datadog で取得したデータは、下記のとおり API 連携で System Answer G2 に取り込んでいます。
※ 補足
上図では、次の情報を取得しています。
- Datadog
対象環境:パブリッククラウドのサーバー
監視内容:CPU 使用率、DB コネクション数
- System Answer G2
対象環境:オンプレミスのサーバー
監視内容:CPU ロードアベレージ、TCP オープン数、物理メモリーの使用容量、ICMP レスポンス
このように、ハイブリッド環境を単一のツール(System Answer G2)で、一元管理することができます。
System Answer G2 は 3 年間分のデータを保持し、豊富な分析機能を実装していますので、長期的かつ多角的に分析をおこなうことが可能です。
一つの画面で各種データの相関性を確認し、ベースライン機能やトレンドライン機能により予測分析や傾向把握ができるため、サイレント障害の検知や遅延および障害の原因特定をおこなうことができます。
※ ベースライン機能とトレンドライン機能の詳細は、 機能ページの「分析機能」をご参照ください。
今回は Datadog との連携によるハイブリッド環境の監視について簡潔にご紹介させていただきました。今回の内容を含め、ハイブリッド環境の構築や運用にご興味がございましたら、私が所属する SCI Project にコンタクトいただけると幸いです。
by SCI Project 前原 日向