IT管理部 インフラグループ 運用/保守担当者です。
ITインフラ業務に従事していると必ずついてまわる突発的な障害対応。
昨年転職してきたばかりで元々ネットワークエンジニアの筆者が新米社内SEとして、
障害対応中に考えていることや心構えのようなものを書き残したいと思います。
・事象発生時
つい焦ってしまいがちですが、規模や影響に関わらず必ず落ち着くよう努めています。
動揺は伝播するので障害対応中は見かけだけでも冷静に努める、昔先輩に習ったことです。
・調査中
自身の持つ知見とその観点から結論を急ぎたくなりますが、
異なるスキルや同じでも範囲や深さが違うメンバーが集まって一緒に働いているので
適宜周りと相談することを心がけています。
・対応中
事象判明後は内外との認識合わせや、
振り返りを容易にするため以下のように図で整理し対応を練るようにしています。
百聞は一見に如かず
・障害だけでなく様々対応する中で学んだこと
初めから可能な限り事象の構造を俯瞰視点で見るように意識しています。
人間いざとなると各々これまでの経験で得たメインスキルの観点から考えをスタートしようとしまいますし、
状況によってはシステム的な観点だけで無く物理的な操作/運用についても考慮しなければなりませんでした。
様々経験する中で得た学びを一言で言えば「広く浅いことは悪くない」...といったところでしょうか。
ITインフラ関連領域について、ひとつひとつは深くなくとも広い知見を持ち、
それらを用い柔軟に考えられることが企業内部のエンジニアとして肝要であると考えます。