今回のコラムではタイトルにある通り、仮想環境について弊社での実例やサーバーやネットワークといった仮想環境の監視手法などをご紹介したいと思います。
仮想化というと「クラウド」というキーワードをテレビや新聞、インターネットなどのメディア媒体で目や耳にする機会が多くなりました。
詳細な説明については割愛させて頂きますがクラウドとは、
DaaS(Desktop as a Service)
・・・仮想デスクトップサービス
SaaS(Software as a Service)
・・・ソフトウェアサービス
PaaS(Platform as a Service)
・・・プラットフォームサービス
IaaS(Infrastructure as a Service)
…インフラストラクチャサービス
といったネットワークを介した各種サービスが提供されております。
これらは多種他業種でも利用されており、最近ではWindows 2003 ServerやWindows XPのサポート終了に伴いDaaS、VDI(Virtual Desktop Infrastructure)といった仮想デスクトップサービスや、自社で仮想環境を構築し物理から仮想へ移行したお客様もいらっしゃるのではないかと思います。
弊社でも最新バージョンを提供する前の製品やテンプレートなどの検証で仮想化を利用することがあります。
弊社での実例からですが、検証環境というと・・・仮想ホスト上に簡単に環境を構築出来てしまう点から、どうしてもゲストOSが乱立してしまい必要以上のリソースを消費してパフォーマンス不足を感じることがあります。
パフォーマンス不足を感じてしまう点について、物理と仮想ではサイジングに違いがあります。
物理ではCPUやメモリーといったリソースは、少し高めのスペックを用意することが基準でした。これは導入後のユーザー数の増加や機能の追加などに対応出来るように初期導入時にハードウェアのEOL(End Of Life)を見据えて3年後や5年後でも安定して稼働出来るようリソースに余剰を持たせて設計するためです。
時代が変わり仮想では、CPUやメモリーといったリソースはとりあえず標準値を割り当て、負荷状態が高いと感じるようであればリソースの追加を行います。
仮想環境では物理サーバー1台で1サービスとして賄っていたものを、複数台で構成したリソースプールで多数のサービスを稼働させることで、リソースを有効活用することを目的としています。
CPUやメモリーが常に90%程度であっても、それ以上超えなければリソースを闇雲に消費することなく、有効活用が出来ていると言えます。
物理と仮想の監視手法の違いについて、上記のことを踏まえると物理監視はWarningやCriticalといったしきい値を設け、超えた場合は要因に対しての対策やリソースの拡張を検討します。
仮想監視では物理監視と同様にしきい値を設けますが、負荷状況に応じて要因に対して対策を行う、リソースの拡張を検討する、ゲストOSを移動/追加する、ストレージとの接続部(NFS、FC、iSCSI)を調査する・・・と物理監視と比較すると様々な検討事項が増えます。
例えばですが、一見CPUやメモリーといったリソースが充分であっても、パフォーマンス不足を感じてしまうことがあります。
それは仮想ディスクのI/Oが影響していることが考えられます。
仮想ホスト上のゲストOSをファイルサーバーやデータベースサーバーなどの用途で利用する場合、データの書き込み・読み出しが頻繁に行われます。
更にゲストOSが複数台配置されていると、ゲストOSのI/Oが競合してしまい、ストレージの能力を超えて仮想マシンのパフォーマンスが悪化する懸念も考えられます。
ディスクI/Oはトラブルの一因になりやすく、仮想環境でデータが一番集中する箇所となります。
ディスク書き込み量や数、キュー、応答レイテンシーといったポイントをチェックする必要があります。
また、1サービスの影響が複数サービスに影響を及ぼす危険性もあり要注意です。
弊社の製品紹介となり恐縮ですが、System Answer G2ではCPUやメモリーのリソース、ディスクの読み書き回数や遅延といった性能情報を、仮想ホストとゲスト毎にサマリ画面やランキング表示、グラフとして把握することが出来ます。
上記の監視として、各サービスのリソースを過去から把握出来ること(傾向的把握)は当然のこと、リソースプール内でどのゲストOSがリソースを使用しているかを把握出来る見え方(総合的把握)も仮想環境の監視を行う上で重要となります。
ちなみに、vCenterでは統計情報をデフォルトで最小1日/5分間隔、最大1年/1日間隔までしか保存出来ませんが、System Answer G2ではデフォルトで3年/1分間隔の性能情報を保存出来ます。
当然のことながらサービスは仮想環境内だけには留まらず、その先に繋がっているスイッチ、ルーター、Firewall、ロードバランサーなどのネットワークがボトルネックとなっていないかを把握する必要性もあります。
物理監視と比較すると、仮想監視ではゲストOS単一だけを注視するべきではなく、仮想ホストやネットワークを含めた広い範囲での性能情報の把握が重要となります。
一時的に負荷が高かったのか、または周期性があるものか・・・様々な観点より安定した”パフォーマンス”であるかを見極め、通常の監視に加えてリソース拡張などのご検討にお役立て頂ければ幸いです。
by 技術部技術課 黒木 伸一