インシデント管理
システム管理のつぼ(2012年12月号)
フロンティア開発部 米山陽介
デージーネットマガジン11月号にてサーバ管理のプロセスについて紹介させていただきました。今月号は、「インシデント管理」について説明していきます。
インシデント管理とは、利用者がシステムを正常に利用できるための妨げとなっている問題を素早く解決し、正常に利用できるようにする事です。
では、どうしたらインシデント管理を上手くできるのでしょうか?
上手く管理をするためには、問題をできるだけ早く知ること、正常に利用できる状態にできるだけ早く戻すことが重要になります。
デージーネットでは、できるだけサービスに近い状態でシステムを監視するように提案し、問題が起こったことをいち早く知ることができるようにしています。
また、お客様からの問い合わせメールを複数の担当者で共有管理をしています。それにより、初動を早くし、素早く問題を解決できるようになります。
また、問題の分析を行い、正常に利用できるようにするために、技術者が直接お客様とお話し、より正確に情報をつかみ対処しております。
つまり、安定したサービスを提供するためには、下記のように事前にこうしたことに対処するための仕組みを作っておくことが重要なのです。
・早期に問題を知り、素早く対応できる仕組み
・問題を正確に分析をするために仕組み