![]() |
<登場人物>
![]() | 新入社員 たかし IBCの新入社員。情シスに配属され、IT障害と奮闘中。 週末は趣味の波乗りに行くことで癒されている。 | ![]() | 長老 しげる たかしが困っていると現れるIBCのベテラン社員。IT障害をゼロにするために日々精進している。 |
<前回までの話>
新入社員のたかしは、OSS系の監視ツールを使い監視運用に奮闘中。配属先の大先輩である 長老 しげる から監視運用のためには、正しい粒度の稼働データを把握・分析する必要性と、その稼働データを詳細に記録するためのツール選定が重要であることを教えられた。
前回のお話(第2回「障害を未然に防ぐために何からやれば良いのか?」)はこちらから
第3回 最適な監視ツールの選び方
![]() | 長老(しげる) 「さて、たかし、監視ツールを選ぶ時に最も重要なことを考えたことがあるか?」 |
![]() | 新入社員(たかし) 「監視ツールを選ぶって、監視対象のサーバーやネットワーク機器の死活監視とかログ監視をして、アラート通知があれば良いと思っていましたけど…?」 |
![]() | 長老(しげる) 「それももちろん大事だが、監視ツールで最も重要なのは、まず『正確にシステムの健康状態を把握できるか』だ。」 |
![]() | 新入社員(たかし) 「健康状態? 稼働しているかどうかだけじゃなくて、もっと深く分析する必要があるんですか?」 |
![]() | 長老(しげる) 「その通りだ。例えば、サーバーやネットワーク機器が単に稼働しているだけでは足りん。どういう状態で稼働しているのか、その挙動やパフォーマンスを細かく監視しないと、重大な障害の兆しに気づけないことがあるんだ。」 |
![]() | 新入社員(たかし) 「なるほど。例えば、CPUの温度が上がりすぎているとか、メモリが異常に使用されているとか、そういう細かい兆候ですね。」 |
![]() | 長老(しげる) 「そうじゃ。そういう兆候を見逃してしまうと、後々大きな障害に繋がることが多い。例えば、温度の上昇が続いていたら、ハードディスクやファンに異常が出ている可能性がある。それを見逃さないためには、細かいデータをきちんと把握することが重要なんだ。」 |
![]() | 新入社員(たかし) 「あー、だからデータを蓄積して、その傾向を長期間追い続けることが必要なんですね。確かに、その方が障害の予兆を早期に見つけやすいですよね。」 |
![]() | 長老(しげる) 「その通りだ。単に『今、動いている』だけじゃなく、どう動いているか、どのリソースが使われているか、その変化を長期間にわたってモニタリングすることが大事なんじゃ。」 |
![]() | 新入社員(たかし) 「なるほど。それで、監視対象の膨大なデータをどうやって扱うんですか?」 |
![]() | 長老(しげる) 「それがまた難しいところなんだ。膨大なデータを蓄積していくわけだから、圧縮して保存するだけではすぐに限界が来る。それに、圧縮するとデータが劣化してしまう可能性もあるから、非圧縮で長期間保存できることが必須なんだ。」 |
![]() | 新入社員(たかし) 「非圧縮ですか! データの圧縮は容量の節約にはなるけど、長期的な分析には向かないということですね。」 |
![]() | 長老(しげる) 「その通りだ。非圧縮でデータを保存できることが、正確な監視には欠かせない。特に過去のデータを分析して傾向を見つけるためには、圧縮によるデータの損失は避けなければならない。」 |
![]() | 新入社員(たかし) 「でも、それだけデータを保存していくと、ストレージの容量が足りなくなりませんか?」 |
![]() | 長老(しげる) 「その点も考慮した優れたツールが必要なんじゃ。ストレージに負担をかけずに、大量のデータを効率的に管理できる仕組みがあるツールなら、問題なく運用できる。」 |
![]() | 新入社員(たかし) 「そうか。じゃあ、単にデータを保存するだけじゃなくて、そのデータを効率的に可視化し、分析できるかも重要なポイントですね。」 |
![]() | 長老(しげる) 「その通りじゃ。データをただ保存しても、それをどう見せるか、どう活用するかが重要なんじゃ。例えば、グラフやチャートで分かりやすく表示されることで、直感的に異常を見つけやすくなる。」 |
![]() | 新入社員(たかし) 「確かに、膨大なデータをそのまま見せられても、どこに異常があるのか分かりづらいですもんね。」 |
![]() | 長老(しげる) 「その通りじゃ。可視化は重要な要素で、さらに重要なのは、障害の予兆を早期に発見できることだ。」 |
![]() | 新入社員(たかし) 「予兆検知ですね。障害が発生する前に、異常をキャッチできれば、システムのダウンタイムを減らせますもんね。」 |
![]() | 長老(しげる) 「そうじゃ。予兆を早期に発見できるツールがあれば、大事なシステムのダウンタイムを減らし、業務の中断を防げる。」 |
![]() | 新入社員(たかし) 「でも、これだけ重要な要素が揃った監視ツールって、なかなか見つからない気がしますね。」 |
![]() | 長老(しげる) 「うむ、わしもいろいろと探したが、なかなか理想的なツールは見つからなかった。」 |
![]() | 新入社員(たかし) 「え、じゃあ、理想のツールってあるんですか?」 |
![]() | 長老(しげる) 「そう、実はあるんじゃ…。」 |
![]() | 新入社員(たかし) 「ホントに!?どんなツールですか!?」 |
![]() | 長老(しげる) (ちょっと間を置いて、にやりと笑う)「うーん、それは…ふふふ、まぁ、わしも長い間探し続けたんじゃが…」 |
![]() | 新入社員(たかし) (焦りながら)「え、え、長老! もったいぶらないでくださいよ!気になります!何なんですか、そのツールは!?」 |
![]() | 長老(しげる) 「まぁまぁ、焦らず。いいか? 本当に探しに探して、やっと見つけた、究極の監視ツールじゃ。」 |
![]() | 新入社員(たかし) 「究極の…!? そんなものがあるんですか!?」 |
![]() | 長老(しげる) (満足げにうなずく)「うむ、あるんじゃ。これこそ、全ての監視ツールの中でも、まさに『答え』なんじゃよ。」 |
![]() | 新入社員(たかし) 「答え…?『システムの答え』…?」 |
![]() | 長老(しげる) (ゆっくりと顔を近づけながら、重要そうに)「そうじゃ… その名も、 System Answer じゃ!」 |
![]() | 新入社員(たかし) (目を見開いて)「シ、システムアンサー!!!」 |
![]() | 長老(しげる) (嬉しそうに)「ふふふ、やっと気づいたか。そうじゃ、System Answer じゃよ。」 |
![]() | 新入社員(たかし) 「システムアンサー!!!(叫びながら後ろに倒れる)それ、そんなの、存在するんですか!? こんな凄いツール、僕、今まで全然聞いたことないです! まさか、長老が隠してたんですか!?」 |
![]() | 長老(しげる) (笑いながら)「あはは、いやいや、隠していたわけじゃないぞ。ただ、良いタイミングを待っていただけじゃ。」 |
![]() | 新入社員(たかし) 「だって、長老、あんなに長い間、色んなツールを使ってきたんでしょう? それなのに、今まで『システムアンサー』の名前を聞いたことがないなんて…!」 |
![]() | 長老(しげる) (真面目に)「そうじゃ。わしも多くの監視ツールを試した。だが、System Answerは違った。どんな障害の予兆も見逃さず、膨大なデータを簡単に管理でき、そして何より…その速さと正確さ、驚愕するレベルじゃ。 |
![]() | 新入社員(たかし) (手を広げて驚きながら)「そんな、まさに未来のツールじゃないですか!どうして今まで気づかなかったんだろう…!」 |
![]() | 長老(しげる) (笑いながら)「気づくのが遅すぎたな。だが、これを知った今、お前もこれからは監視の達人になるぞ。」 |
![]() | 新入社員(たかし) (でも、長老、もしそのSystem Answerが本当にそんなに凄いなら、他の企業もみんな使っているんじゃないですか?どんな実績があるんですか?」 |
![]() | 長老(しげる) (ちょっと得意げに)「うむ、実績も凄いんじゃ。20年以上も運用されていて、多くの企業が導入し、信頼している。サポートも充実しておるから、安心して使えるぞ。」 |
![]() | 新入社員(たかし) (目をキラキラさせながら)「20年以上も!それだけ多くの企業が使っているなんて、もう信じられないです!まさに、システムの答え…!」 |
![]() | 長老(しげる) 「その通りじゃ、たかし。これからは、System Answer で、監視もキャパシティプランニングも、何でもできるぞ!」 |
![]() | 新入社員(たかし) 「すごい!ああ、長老、僕、今すぐにでもそのツールを使いたい!早く詳細を教えてください!」 |
![]() | 長老(しげる) (にっこり笑って)「ふふふ、急がずとも。次回は、System Answer の魅力をたっぷりと伝えてやろう。」 |
新入社員たかしの奮闘はまだまだ続く・・・
たかしが早く使いたい、情シスのお悩みを解決できるツールはこちら↓