VMware/サーバー/ネットワーク監視ツール
COLUMN
2011.12.26

第8回:運用の課題と解決

前回の「kanshi de mirai」では、死活監視から性能監視、そして性能管理へというテーマで、ICTサービスにおいて監視を行う目的や、さまざまな監視形態についてご紹介しました。

今回は「運用の課題と解決」と題しまして、監視から少し話を広げて、ICTサービスの運用における課題とその解決についてお話しをしたいと思います。

私が携わってきた過去の経験やお客様先での運用課題などを通じて、一つの事例としてご紹介させて頂きますので、現状の運用の改善や最適化のヒントになれば幸いです。

・運用が果たすべき目的
利用するユーザーに対し「安心安全を提供する」ことが大きな目的であると考えます。
お客様の業種、業態、ICTサービスの利用状況により、運用の形態は様々です。
その中で、管理すべき項目やサービスレベルを定め、各メンバーの役割を明確にし、運用フローを策定し、実践する必要があります。
ここで大切なことは、管理すべき項目やサービスレベルの策定に関して、トラブルの想定や管理項目に不足が無いように注意することです。

この想定がしっかりできていないと、不測の事態が発生した際に「想定外」という事態となり、トラブルの収束に時間を要し、さらに大きなトラブルへと発展してしまうことになります。
膨大なコストをかけて、過剰な運用プロセスを策定する必要はありませんが、トラブルは発生するものという認識の下、できる限りの想定を行うことが運用における第一歩であると考えます。

・運用の標準化
ITサービスの運用におけるガイドラインとして、ITIL(Information Technology Infrastructure Library)というものがあります。
ITILでは、ITサービスの品質向上や中長期的なコスト削減を目的として、運用方法を書籍化したものです。
多くの企業がITILを参考として運用プロセスを策定しています。
現在ITILはバージョン3まで発表されており、企業戦略の一つとしてのITの位置付けやセキュリティ対策といった内容まで含まれています。

このように、障害対応だけを考えて運用プロセスを策定する時代ではなくなっているということがわかります。
単純に、障害を検知して復旧することだけではなく、ITの活用方法を検討し、サービスレベルを向上し、運用を効率化しコストを削減するといった役割が運用には求められています。
クラウド時代の主役は運用にあるとも言われています。

コールセンターにおける標準化フレームワークとしては、COPCといった規格等も存在します。

・運用における課題
多くの運用課題は、実際に問題が発生してから発覚することが大半です。
私の経験では、システムの構築から運用への受け渡しがうまくできていない、運用までを考慮したシステム構築がされていない、契約の内容が曖昧である、ナレッジが共有されていない、各自の役割が明確でない、などがトラブルの原因であることが多いように感じます。

大きな問題の一つとしては、SLAにあります。
サービスレベルといっても、様々なサービスレベルがあります。
保守におけるサービスレベルでは、障害発生時からエンジニアが現地へ駆け付ける時間を設定しているものや、復旧までを約束しているものもあります。
クラウドサービスなどでは、稼働率をサービスレベルとして設けていたり、回線事業者では、ダウンタイムを設定したりしている場合があります。

なぜSLAが設定されているのに、問題が起きるのか?
認識の相違がほとんどではないでしょうか?
障害発生時というのは、どの時間を指しているのでしょうか?
お客様が障害に気付いた時間?
監視で障害を検知した時間?
駆け付ける必要があると判断した時間?
お客様の受け取り方ひとつで、大きな時間のずれが生じてしまいます。

SLAは契約事項ですので、相手によって認識にずれがあってはいけません。
保障対象外の事象や、サービスレベルの具体的な内容を策定し
お客様へ正しい説明を行い認識を合わせることで、多くのトラブルを防ぐことが可能であると考えます。

SLAを例にとりましたが、運用フロー、管理手法、ナレッジなど、運用におけるすべての過程で社内・社外問わず同様の事が言えるかと思います。

特に社内での連携(特に営業と技術)がうまくないなんていう話もよく耳にするところですが、責任の範囲を明確にし、両者がよく話し合い、明確な責任範囲と運用フローを確立することで、そのようなトラブルも未然に防ぐことが可能となります。

・課題の解決
運用課題の解決は、多くが運用プロセスの見直しで解決できると考えます。
ITIL等のフレームワークを活用する手段もありますが、まずは明確になっている小さな課題から手をつけてみましょう。

IT技術者は保守的で変化に弱いと言われていますが、変化を恐れず現状の課題に立ち向かってみてはいかがでしょうか?
高度なスキルを要する課題もありますが、大半は運用プロセスやフローの標準化、責任範囲の明確化、各部門間やお客様のコミュニケーションで解決できる課題です。

・運用はお客様との絶好のコンタクトポイント
運用や保守といった場面では、トラブルが起きてお客様へ謝罪することも多いなんていうマイナスイメージを持たれている方も多いかと思いますが、お客様と会話する絶好の機会であると考えてみてはいかがでしょうか?

トラブルは起きるものとして想定の範囲を広げ、お客様が気づく前に障害を検知し迅速に対応し、お客様から喜ばれる、顧客満足度を向上させる運用を確立して頂きたいと思います。

予防保守を実現し、運用の場面から新たなシステム提案へつなげることも可能です。
このようなPDCAサイクルが、営業、構築技術、運用の中で回っていくことが運用の理想です。

それには、運用に携わるメンバーだけでなく直接運用には関わらない営業職や技術職も
運用に対しての理想を日々考え、改善していく必要があります。

次回のテーマは「OpenFlow環境の性能監視」です。

by コンサルティング部 明星 誠

お電話でのお問い合わせ
受付 9:30〜17:30(平日)
トップに戻る
上に戻る