1
/
5

PagerDutyで運用保守?やってみたらこうなった

24時間365日システムを安定稼働させるために欠かせない運用保守業務。
その中でも、障害発生時の対応スピードは重要なポイントです。
そんな中で注目されているのが、インシデント対応自動化ツール「PagerDuty」です。

今回は、実際にPagerDutyを導入して運用保守業務に組み込んでみた体験談を交えつつ、メリット・デメリット、導入時の注意点などを紹介します。


目次

  • PagerDutyとは?

  • 実際に運用に組み込んでみた結果

  • ✅ メリット1. 通知の自動化が便利すぎる

  • ✅ メリット2. オンコールスケジュール管理が超便利

  • ✅ メリット3. インシデント対応の見える化が進んだ

  • ✅ メリット4. 関係者の巻き込みがスムーズ

  • ⚠️ デメリット1. 英語表記が多く、最初はとっつきにくい

  • ⚠️ デメリット2. コストが高め

  • ⚠️ デメリット3. 最初の設定が複雑

  • ⚠️ デメリット4. アラートが多すぎると逆に疲れる

  • PagerDutyの運用保守で気をつけたポイント

  • まとめ:PagerDutyは運用保守の味方か?


PagerDutyとは?

PagerDutyは、インシデントの通知、対応フローの自動化、エスカレーション、関係者への連絡などを一元的に管理できるクラウドサービスです。運営会社は、2010年に設立されました。

PagerDutyは、リアルタイムのアラート管理、通知、障害のトラブルシューティングを通じて、運用チームが問題に迅速に対応できるようサポートしています。
また、ZabbixやDatadogなどの監視ツールと連携することで、アラートを自動でPagerDutyに取り込み、関係者へ通知することで、対応フローをトリガーします。

システムの運用監視業務に興味がある方は、こちらをご覧ください。

DevOps Engineer
AWS・Linux|3か月の研修でクラウドエンジニアへの第一歩!!
株式会社ジャスミンシステムは、情報通信分野におけるコンサルティング事業やシステム/ビジネス両面でのオペレーション事業を主軸とする、創業8年目を迎える会社です。人月契約の常駐型支援のみを行う会社が多いSI業界にありながら、スポット対応の実績を豊富に持ち、依頼先がない特殊な案件へ柔軟に対応した実績があります。 これまで、モダンな技術を中心としたソフトウェア開発案件から野外イベントに対応した防塵防滴のネットワーク機器開発、全国出張によるフィールドサービス等を多角的に展開してきました。”営業だけをやる社員”や”事務だけをやる社員”を置く「専任分業方式」を取らず、全員が取引先の担当業務に裁量権と責任を持つ「兼務分業方式」を採用していることも大きな特徴の一つです。 多様性を重視し、年齢や性別、新型コロナウィルスのような不測の事態、あらゆるモノやコトをプラスに捉え、年々業績を大きく伸ばしています。
株式会社ジャスミンシステム


実際に運用に組み込んでみた結果

ここからは、実際にPagerDutyを使って運用保守した感想をメリット・デメリットにわけて紹介します

メリット1. 通知の自動化が便利すぎる

アラートが発生すると、PagerDutyが即座にユーザーへ通知します。
インシデント情報は、メールや電話、SMS、モバイルアプリなどさまざまなチャネルを通じて届けられます。
通知の自動化により、オンコール担当者に確実に通知が届き、通知漏れのリスクを大幅に軽減できるでしょう。

メリット2. オンコールスケジュール管理が超便利

PagerDutyのシフト機能は、当番制のスケジュール管理を自動化し、通知を適切な担当者に送る仕組みです。
あらかじめシフトを設定しておくことで、当番の担当者のみに通知が届くようになります。
そのため、休日や深夜の対応が特定の人に偏ることなく、チーム全体で平等に対応できるようになるでしょう。

メリット3. インシデント対応の見える化が進んだ

PagerDutyのタイムライン機能は、インシデント対応の経過を自動で時系列に記録する機能です。
対応の履歴やタイムラインは、自動で記録されます。
そのため、後からの振り返りがしやすくなります。
また、ポストモーテム(事後検証)にも活用できることで、ナレッジも蓄積できるでしょう。

メリット4. 関係者の巻き込みがスムーズ

PagerDutyを利用すると、インシデントが発生した際には、関係者をすぐに招集(エスカレーション)できます。
また、SlackやTeamsなどのオンラインツールを連携することによって、連絡体制もスムーズかつ効率的に整います。

⚠️ デメリット1. 英語表記が多く、最初はとっつきにくい

UIやドキュメントは、基本的に英語で提供されています。
日本人のユーザーもいますが、日本語でのサポートが少ないため、初めて使う人にとっては戸惑うこともあります。
しかし、翻訳ツールを併用したり、慣れたりしてしまえば大きな問題はありません。

⚠️ デメリット2. コストが高め

PagerDutyの主要なプランと料金(月払い)は、以下の通りです。

  • Free:無料
  • Professional:$25
  • Business:$49
  • Digital Operations:応相談

プロフェッショナルプラン以上は月額費用が比較的高く、小規模なチームやスタートアップにとってはコストが負担になります。

⚠️ デメリット3. 最初の設定が複雑

PagerDutyを使い始めるためには、監視ツールとの連携やロール設定、スケジュール管理といった初期設定が必要です。
PagerDutyの初期設定を進めるためには、ある程度の工数がかかります。
そのため、導入時に運用ルールを明確にしておかないと、運用が混乱しやすくなります。

⚠️ デメリット4. アラートが多すぎると逆に疲れる

監視設定が不十分だと、深夜でも些細なアラートが大量に届くことがあるでしょう。
そのため、終日アラートが頻発すると、対応する側が疲弊してしまいます。
通知量を抑制するためには、アラートのしきい値や通知ルールを適切に最適化する必要があります。

PagerDutyの運用保守で気をつけたポイント

PagerDutyの運用保守では、以下の3つを意識しました。

  • オンコールルールを文書化:誰がいつ対応するのか、一次対応フロー、エスカレーションの基準などを明確にする。
  • 不要アラートの抑制:監視ツール側でアラートの重要度を見直し、PagerDutyに連携させるのは本当に対応が必要なものだけに絞る。
  • 振り返り文化の定着:インシデント対応後は、PagerDutyの履歴をもとにポストモーテムを行い、再発防止と改善に役立てる。

PagerDutyを利用しようとしている方は、検討してみてください。

まとめ:PagerDutyは運用保守の味方か?

答えはYES。ただし、設計と運用ルールが重要!

PagerDutyは、運用保守の「対応スピード」と「対応品質」を向上させる強力なツールです。

ただし、

  • アラート設計
  • オンコール体制の整備
  • チームでのルール共有

ができていないと、むしろ通知疲れや混乱を招く恐れがあります。

ツールに使われるのではなく、ツールを使いこなす意識が大事です。

導入を検討している方は、まず無料トライアルで試してみて、自社の運用スタイルに合うかどうかを見極めてください!

PagerDutyを上手に活用して、「スマートな運用保守」 を目指しましょう!

株式会社ジャスミンシステム's job postings

システム

Weekly ranking

Show other rankings
Like Takumi Wada's Story
Let Takumi Wada's company know you're interested in their content