CASE STUDY

導入事例・導入実績

能動的な予防保守で県下 169 校のインフラを守る!
~ 属人化排除:5 年先・10 年先の担当者まで高い運用水準を引き継ぐために ~

System Answer G3
官公庁・自治体・公益法人

神奈川県教育委員会

神奈川県教育委員会

神奈川県教育委員会は、神奈川県内における学校の設置、教員の人事や研修、校舎の整備、使用する教科書の選定、図書館や博物館の設置、文化財の保存などをおこなう。県立の高等学校(通信制含む)138 校、中等教育学校(中高一貫校)2 校、特別支援学校 29 校を管理する(2021 年 4 月 1 日現在)。

所在地
横浜市中区日本大通 1 神奈川県庁東庁舎
導入内容
開始
2020 年 8 月
用途
ネットワークセンター、クラウドシステム、県立学校 169 校の L3 スイッチ
規模・対象
20,000 項目

■Azure 環境での G3 活用例:Azure Virtual Machines における CPU クレジット減少の検知

Azure Virtual Machines には複数のシリーズがある。そのうち、例えば B シリーズの仮想マシンでは、CPU の基準パフォーマンスを 100 % 使用していない場合、仮想マシンのインスタンスのクレジットが蓄積されていく。クレジットが十分に蓄積されると、アプリケーションで高い CPU パフォーマンスが必要になった際に vCPU の使用量を最大 100 % まで引き上げることができる。負荷の急増に対応可能かつ価格設定も手頃な一方で、CPU クレジットが枯渇すると性能が制限されてしまうため、 CPU クレジットが枯渇しそうな場合はいち早く検知し、高いパフォーマンスが必要なタイミングとクレジット減少のタイミングがかぶらないように注意しなければならない。

 

このため、システムの安定稼働のためには、CPU 使用率の監視(SNMP 監視)だけでなく、CPU クレジットの監視(Azure Monitor API 監視)も重要となる。

 

System Answer G3 の傾向分析機能や将来予測機能を使用することで、この課題の解決と Azure のさらに柔軟な活用を見込むことができる。

導入背景

元々 JP1 を導入していたが監視範囲はサーバーのみであり、ネットワーク側に問題が発生した場合は各スイッチの管理画面に 1 台ずつログインして確認をおこなっていた。補助的に MRTG(トラフィックモニターが中心の OSS)も使用していたが、障害検知や原因の分析、対策運用に十分活かしきれていないという課題があった。そのため、サーバー運用に使用していた既存の JP1 の拡大や、フリーツールである ZABBIX を作りこんで乗り換えることなどを検討したが、教育委員会は定期的に人員の入れ替わりがあるため、今後新しく配属される担当者にはシステム運用の経験がない可能性があり、フリーツールを作りこむ形では運用やメンテナンスの難易度が上がってしまい、使いこなせなくなってしまう懸念があった。

たとえ担当異動があっても、これまでの運用水準を 5 年先・10 年先まで維持し、さらに高めていくために、システム更改に合わせて新たな監視ツールを探すこととなった。

採用理由

新たな監視ツールに期待していたのは、直感的な操作による属人化排除ができることと、ロケーションを問わない一元管理ができることであった。また、運用改善の第一段階として、これまでの「ユーザーからサービス障害の連絡を受けてから問題発生個所を探す」という後手の対応を、「こちらから異常を検知し、能動的に対処する」という先手対応に変える必要があると考えていた。これらを叶えるツールとして 、予防保守を得意とする System Answer G3 が候補に挙がった。

G3 は、グラフィカルな画面表示によって専門性を持たない職員でも今起きている事象を把握することができ、これまでの変化を踏まえて今後どのように変化していくかを予測するトレンドライン機能によって次のシステムのサイジングや現行システムの設定変更のヒントを得ることができる。

また、G3 側であらかじめ用意されているテンプレートによる ZABBIX エージェントとの連携機能を用いることで、Windows サービス監視を実現することができた。ツール間連携にあたっては、アイビーシーの SE 協力のもと事前検証をおこない導入の不安を解消することができたため、ZABBIX と一部併用という形で System Answer G3 を採用することを決定した。

効果・感想

導入から数か月が経過し、データが蓄積されてきたことで、トレンドライン機能による分析が活用できるようになり、しきい値超過のタイミングや短期・長期でのパフォーマンス変化を視覚的にわかりやすく実感することができた。また、Windows Update の際に WSUS の TCP セッションの確立数を確認することで、回線帯域の制限から同時に 5,000 台前後の処理が上限であることが分かった。さらに、配布がどれくらいの日数で終わっているかまで確認することができ、今後の運用設計にも非常に役立った。

今後のプラン

台風の時期や非常事態宣言発令になると、休校情報の確認のために学生からのアクセスが集中して Web サーバーの負荷が高騰し、遅延が起きることがある。このとき、ユーザーからの指摘が入る前にこちらから Web サーバーの情報を確認して、手動でのスケールアウトが必要かどうか判断できるようにしたいと考えている。そのため Web サーバーの情報だけでなく Azure のアプリケーションゲートウェイの状態も可視化できるように、テンプレート化をアイビーシーに依頼しているところである。

また、今後は他の校務システムにも監視範囲を広げ、全てのシステムにおいて高品質なデータ収集と迅速な対応を目指したい。

CONTACT

お気軽にお問い合わせ下さい