USER

ユーザー会報告

第 3 回 IBC ユーザー会(大阪)報告:インフラ管理と障害対応の HowTo をご紹介、さらに自動化対応したいものとは?

2017 年度 第 3 回 IBC ユーザー会(大阪)報告

2018 年 2 月上旬に、第 3 回 IBC ユーザー会(大阪)が開催されましたので、その内容についてご報告します。

今回は、6 社 8 名の会員様にご出席いただき、各社におけるインフラ管理と障害対応について、ディスカッションしていただきました。

【インフラ管理】

  • 仕様書や設計書がなく、各自が設定内容を読んで理解し、エスカレーションや障害対応を考えるようなシステムになっている。
  • 技術者の育成として、二人体制で作業や運用をおこない、ナレッジ共有や強化を図りたいと考えている。
  • 運用管理として定期的にコンフィグバックアップを取り、数世代分手元に保存と管理をしている。
  • 保存は DR 管理ができているファイルサーバーに保管し、変更などをおこなう場合は、スナップショットでの世代管理をしている。
  • スナップショットの管理により、障害発生時はダウンタイムを短くするために、復元やイメージからリカバリーを即時おこなっている。
  • 保守手引書はあるが、すべての障害事象に対しての対応方法は書ききれていない。そのため、対応方法が不明な場合は、経験値のある技術者に問い合わせがいくような体制になっている。
  • DMZ 管理やセキュリティ管理は、ポリシーを定め、定期的な脆弱性診断を実施している。
  • システム設計や管理は、経緯や理由などをドキュメントに残している。

【設計・構成】

  • 仕様書や設計書がないため、各社員の技術力と経験がもとになっている状況である。
  • プロジェクト単位でハードウェアを購入するため、機器の仕様はバラバラで、必要に応じてサイジングをしている。
  • システム構成方針資料をもとに、基本設計書を作成している。
  • 設計書はページ数が多いと読まないため、15 ページくらいに留めたうえで、イメージ図の入った基本概念で作成しており、それを見れば理解できるようになっている。
  • インターネット通信は、Proxy 経由でログを監視するようにしており、trace でログチェックし、怪しい通信が生じた場合は、対策を取り入れている。
  • 保守会社は常時 2 名常駐しており、基本的な障害対応は任せている。また、構成管理や設計ドキュメントも保守会社側にて作成してもらっている。

【障害対応】

  • 障害が発生しないよう、極力事前の対策や対応に努めている。
  • ドキュメントが多すぎると探すことをしなくなるため、結局は経験である。
  • ネットワーク機器は初期設定から 10 分程度で設置・設定できるようにしているため、障害発生時も迅速に対応できるようにしている。
  • ベンダーに任せているのは Oracle データベースで、遠隔地に設置した DR サーバーとリアルタイム同期をおこない、障害発生したとしても影響がないようにしている。
  • 機器故障または回線、ルーターなどの切り分けと把握は、System Answer G2 で対応している。
  • 障害検知としては、各拠点で随時追加をしているため、故障や管理を含めてあまり行き届いていない。
  • システム障害があった場合は、基本はベンダー側で対応をおこない、判断が必要な時のみ対応をしている。
  • System Answer G2 で傾向や兆候を見ながら障害予兆をとらえるため、データの粒度が 1 分間隔であることは大事。
  • フローは、トラッカーで怪しい通信を定期的にチェックし、障害となりえそうな要因は対策するようにしている。
  • 障害検知は、ダウンを検知した場合アラート通知をおこなう仕組みを取り入れており、長時間応答がなかった場合は、保守会社側で機器入れ替えや調査対応をおこなう。
  • 自身は PC 担当でもあるため、遅いなどのクレームが多々ある。その際、障害の原因究明をおこなうために、System Answer G2 を活用している。

当社として感じたことは、インフラ管理に対する考え方や文化は各社で異なるため、皆様のご要望すべてにお応えできる製品を開発することは難しいということです。ただし、その中でも共通して抱えていらっしゃる課題もあるため、できる限り多くのお客様のお役に立てる製品を提供させていただきたいと考えています。ユーザー会は各社のご意見をお聞かせいただける貴重な機会であるため、製品やサービスの開発にあたり参考とさせていただきます。

次回の開催テーマは、事前アンケートの結果、クラウドと自動化への関心が高く、さらに、クラウド利用における BCP 対策やリソースの分散に対するご意見が多かったため、クラウド導入をテーマにディスカッションしていただく予定です。また、データセンターの見学をご希望される会員様が多いので、見学会も検討しています。

なお、自動化対応とクラウド利用の状況についてのご回答結果は以下の通りです。

【自動化対応】

◆ 障害対応

  • メール通知対応:5 社
  • 障害エスカレーション:3 社
  • 障害の切り分け対応:1 社
  • 障害復旧対応:1 社

◆ 構成・設定変更

  • システム構築の自動処理:2 社
  • ネットワーク機器の設定変更:1 社
  • サーバー設定変更:1 社
  • アカウント関連の管理:1 社

◆ その他

  • システム構成の情報収集:3 社
  • 感染端末の遮断:1 社

【クラウド利用】

◆ 利用クラウド

  • AWS:4 社
  • Azure:2 社
  • Bluemix:1 社
  • Enterprise Cloud:1 社
  • プライベート基盤:1 社

◆ クラウドでの稼働システム

  • ファイルストレージ:1 社
  • 開発データバックアップ:1 社
  • 在庫・生産管理:1 社
  • グループウェア:1 社
  • 検証・開発環境:3 社
  • 長期データ保存:1 社

引き続き、別会場にて開催された懇親会で、会員様同士で親睦を深めていただきました。

本ユーザー会にご興味がございましたら、担当営業までご連絡ください。多くの会員様のご参加をお待ちしています。

【ご出席いただいた会員様(順不同、敬称略)】

  • 応用電機株式会社
  • 京セラ株式会社
  • 三菱日立パワーシステムズ株式会社
  • 株式会社イルグルム

他 2 社

一覧を見る

CONTACT

お気軽にお問い合わせ下さい