VMware/サーバー/ネットワーク監視ツール
COLUMN
2016.03.14

第38回:Global Baselineで実現する、一歩先行くシステム運用/イーサネットスイッチ編

IBCが提供する「System Answer™ RS Global Baseline」は、さまざまな環境で取得した実測値ベースの情報をもとに、システム運用における新しい指標作りを目指すソリューションです。
お客様環境に依存しない傾向分析や、実測データをもとにした勘に頼らないシステム運用を実現します。

Global Baselineでは、国内900システム以上でご利用いただいているSystem Answerシリーズのお客様の中から、許諾を頂いたお客様のネットワークやサーバー機器を中心としたインフラ機器の性能情報の収集・統計を行っています。オンプレミス/クラウド環境、仮想環境などを問わずSystem Answerシリーズによって監視されているネットワーク/サーバー機器の性能情報は、Global BaselineによってIBCの管理するサーバーに集約され、登録したお客様には現在のところ無償にて情報を閲覧・活用の場をご提供させていただいております。
※Global Baselineの詳細

今回は、イーサネットスイッチ(L2/L3)を例に、その一端をご紹介します。

イーサネットスイッチのベンダーシェア状況

まずは2016年3月時点でのGlobal Baselineの情報をもとに、ベンダー別 L2/L3スイッチカテゴリ稼働機器数ランキングを見てみましょう。

図①

Cisco Systems 社製品が約7割と圧倒的シェアを占めておりましたので、今回は多くのお客様に導入されているCisco Systems 社製のスイッチを例に、機器の傾向把握について考察します。

システムの安定運用には「機器特性の把握」が必要

一般的に、インフラ機器の運用方法を検討する場合は、各機器の「機能」に着目します。
例えば、L2スイッチではパケットの転送をハードウェアで行います。その為、パケットの転送にCPU処理は行われず、CPU使用率は機器負荷の指標としては相応しくありません。「パケット数」や「トラフィック流量」といった、実際にどの程度のパケットを処理しているのかを示す項目を注視すべきだといえます。

一方、L3スイッチの場合、機種によっては一部のパケット転送をソフトウェアにて行うため、パケット転送量とCPU使用率に相関がみられることがあります。パケット転送量と併せてCPUの負荷状況も把握することによって、インターフェイスの帯域には余裕があるにも関わらず、CPUの限界値を超えたことによってパフォーマンスが低下する、といった事象を未然に防ぐことができます。

上記のような機器のカテゴリ毎の特徴を、Global Baseline 登録機器数の上位に入っている2製品の性能情報をもとに、ご紹介します。

図②1

L2スイッチ「catalyst296024TT」の場合、「CPU Use Rate(CPU使用率)」は「Packet Unicast(ユニキャストパケット数)」との関連性はみられず、常に4%で一定です。運用方法を検討するにあたり、CPU使用率ではなくパケット数やトラフィック流量といったインターフェイス情報を取得する必要があります。また、廃棄パケット検出数を取得することでネットワークの品質を把握することも有効です。
図②2

L3スイッチ「catalyst 6506」の場合は、基本的にソフトウェアではなく、ハードウェアで転送が行われ、スーパバイザ―のCPUは使用されません。しかし、ネットワーク制御関連やCEF/FIB等の処理にはCPUが使用される為、ネットワーク構成や通信内容と合わせ稼働状況を把握する必要があります。

上記の通り、L2/L3スイッチ等の機器カテゴリによって、おおよその監視ポイントを把握することができます。加えて、機種毎の傾向を把握することによって、より正確なキャパシティ計画を立てることができます。 次にHewlett-Packard社製L2スイッチを例に考察します。

図②3

先ほどご紹介した「catalyst296024TT」では、CPU使用率は一定でしたが、「hpSwitchJ4819A」ではCPU使用率に変動があることが分かります。
通常、L2スイッチではCPUはあまり使用しませんが、機器の設定によってはスパニングツリープロトコル(※)の処理などを行うことによってCPU負荷が発生する場合があります。

このように機器のシステムプロセスがCPU時間を消費してしまう場合、トラフィックの流量が少なくても、一定のCPU負荷が発生し続けている状態となります。この場合、インターフェイスの帯域幅が限界を迎える前にCPUが高負荷状態になってしまい、ネットワーク障害を引き起こす可能性があります。このような機器は、L2スイッチであってもCPU使用率などのリソース情報を継続的に監視することが必要となります。

(※)LAN内でループ構成を回避するためのデータリンク層の通信プロトコル

Global Baseline で、今まで把握できなかった機器特性が見えてくる

確実な運用を行う為には機種毎の特性を把握し、それに応じた監視ポイントを策定する必要があります。
ですが、機器ベンダーから提供される情報は、処理能力の「目安」を示しているだけで、実際の稼働性能状況は公開されておりません。

また、同一機種であっても、設置環境や実装機能の使用状況によっても稼働状況は変わります。自社システム内の機器だけではなく、様々な環境で稼働している機器の稼働状況を把握することによって、より多角的に機器特性を把握し、より確実な運用を実現することができるのです。

Global Baselineの活用により、マルチベンダー機器で構成されたお客様のシステム環境において、

● 機種ごとに異なる特有な傾向分析検討 ● 機種間での性能比較検討 ● 平均的なCPUやメモリー、トラフィックの情報をもとにした閾値検討

などサービスの性能向上に関わる様々なヒントとなる情報が得られます。
また、データの傾向が見えてくればお客様システムに必要な機器スペックが明確になり、機器選定を行う上での判断材料として活用することができます。

Global Baseline について

さて、今回ご紹介した「System Answer™ RS Global Baseline」は、IBCがお客様向けに無償で提供している情報サービスです。ご興味のある方は、弊社までお問い合わせ下さい。

System Answer G2をご利用のお客様でしたら、お問い合わせ頂ければすぐにご利用頂けます。 また、まだSystem Answer G2をご利用でないお客様で、ご興味をお持ちの方はお問い合わせフォームにてその旨をお伝え下さい。

今後とも、「System Answer™ RS Global Baseline」の情報をもとに、こちらのコラムで様々な考察を提供して参りますので、どうぞご期待ください。

by 事業開発推進部 上村 裕美子

お電話でのお問い合わせ
受付 9:30〜17:30(平日)
トップに戻る
上に戻る