Skip to content

Latest commit

 

History

History
81 lines (55 loc) · 7.44 KB

index.md

File metadata and controls

81 lines (55 loc) · 7.44 KB
cover hero hero_alt_text
assets/img/covers/incident_response_docs.png
assets/img/headers/iStock-1097331490-3992x2242-e4f3f2d.png
Incident Response at PagerDuty

この文書は、PagerDutyのインシデント対応プロセスの一部をカバーしています。これは、PagerDuty社内で重大なインシデントが発生した場合や、新入社員がオンコールの責任を担う準備をする際に使用される社内文書の簡略版です。インシデントへの備えだけでなく、インシデント発生中および発生後の対応についても情報を提供しています。オンコール要員や運用中のインシデント対応プロセスに関わる人々(または正式なインシデント対応プロセスを導入したいと考えている人々)が使用することを想定しています。この文書が何であり、なぜ存在するのかについての詳細は、about pageを参照してください。

!!! tip "何から始めたらわからない方へ" インシデント対応が初めてで、まだ組織内に正式なプロセスがない場合は、まず Getting Started ページを参照し、はじめにすべきことの簡単なリストを確認することをお勧めします。 さらに、Training Course ページで、当社のプロセス概要について詳しい情報を得ることもできます。

オンコールについて

オンコールの経験がない場合、オンコールとはどのようなものか疑問に思うかもしれません。これらのページでは、オンコールに求められること、およびオンコール対応を支援するリソースについて説明しています。

  • Being On-Call - オンコール時のガイド。オンコール担当者の責任と、責任でないことについて。
  • Alerting Principles - いつ・どのようなときにエンジニアを呼び出すかについて、判断するための原則

インシデント発生前

インシデント発生前に知っておくべき情報。実際のインシデント発生時には、これらを読んでいる余裕はないでしょう。

  • What is an Incident? - インシデント対応について語る前に、インシデントとは実際に何なのかを定義する必要があります。
  • Severity Levels - 自社の重大度レベル分類に関する情報。SEV-3とSEV-1の違いは何か? それらはどのような対応が必要になるのか?
  • Different Roles for Incidents - インシデント発生時の役割(インシデント・コマンダー(IC)、記録係など)に関する情報
  • Incident Call Etiquette - インシデント通知のエチケットガイドライン(通知を受ける前にご確認ください)。
  • Complex Incidents - 大規模で複雑なインシデントの処理に関するガイド

インシデント発生中

重大インシデント発生中におけるプロセスおよび情報。

  • During an Incident - インシデント発生時に何をすべきか、建設的に貢献する方法に関する情報
  • Security Incident Response - セキュリティインシデントは、通常の運用インシデントとは異なる方法で対応されます。

インシデント解決後

過ちを繰り返さないための取り組み、常に改善を続けるためのフォローアップのプロセス。

  • After an Incident - インシデント解決後に取るべき対応に関する情報
  • Postmortem Process - ポストモーテムのプロセス、その内容、およびポストモーテムレポートの作成方法に関する情報
  • Postmortem Template - 重大インシデントのポストモーテムレポートを作成する際に使用するテンプレート
  • Effective Postmortems - 効果的なポストモーテムレポートを記述するためのガイド

危機対応

インシデント対応は、技術的なインシデントへの対処だけではありません。危機はいつでも起こり得ます。あなたはそれに対して備えができていますか?最悪の事態への対処の仕方によって、現在の顧客や潜在顧客の目には、貴社のブランドやその価値がどう映るかが決まります。

  • Introduction - 危機対応の概要と、この文書の対象者について
  • Terminology - このガイドで使用される主な用語と概念の一覧
  • Crisis Leadership - 基本原則と貴社の価値観を対応に組み込むことについて
  • Crisis Response Operations - 危機対応計画の実行
  • Pre-crisis Phase - 準備のための活動を最大限に活用し、チームを常に準備万端にしておくことについて
  • PagerDuty for CRMOps - 当社がPagerDutyを危機対応管理オペレーションに活用している方法

トレーニング

インシデント対応について学びたいですか? こちらをご覧ください。

トレーニングガイド

  • Incident Commander Training - インシデント対応チームの指揮官(インシデント・コマンダー)になるためのガイドです
  • Deputy Training - 副指揮官(Deputy)となり、インシデント・コマンダーを支援する方法
  • Scribe Training - 書記係(Scribe)になるためのガイド
  • Subject Matter Expert Training - 重大インシデントに関わるすべての参加者の責任と行動に関するガイド
  • Customer Liaison Training - インシデント発生時に外部向け連絡係(Customer Liaison)として行動する方法に関するガイド
  • Internal Liaison Training - インシデント発生時に内部向け連絡係(Internal Liaison)として行動する方法に関するガイド

トレーニングコース

その他の情報

インシデント対応に関連する外部の有用な資料や情報

  • Reading - インシデント対応に関連する推奨読み物
  • ChatOps - この文書で参照しているチャットボットコマンドの説明
  • Anti-Patterns - PagerDutyが自社で試した結果、却下したもののリスト - 私たちの過ちから学ぼう