モニタリング&アラート設計
PROシステム監視とアラートの設計をサポート。メトリクス選定、閾値設定、エスカレーションルールを策定。
使用例
Webサービスの監視アラートを設計したい…
このスキルの使い方
スキルをコピー 上のボタンを使用
AIアシスタントに貼り付け (Claude、ChatGPT など)
下に情報を入力 (任意) プロンプトに含めるためにコピー
送信してチャットを開始 AIと会話
おすすめのカスタマイズ
| 説明 | デフォルト | あなたの値 |
|---|---|---|
| ターゲットSLO率(例:99.95%可用性で99.95) | 99.95 | |
| SLO評価のタイムウィンドウ(30日、7日、1時間など) | 30d | |
| クリティカル/ページアラート用のバーンレート倍率 | 14.4 | |
| 警告/チケットアラート用のバーンレート倍率 | 1.0 | |
| ターゲット監視プラットフォーム(Prometheus、Datadog、Dynatrace、Grafana) | prometheus | |
| 分散トレースバックエンド(Jaeger、Zipkin、Tempo、Datadog) | jaeger |
Design comprehensive observability systems that provide real-time visibility into system health, performance, and reliability. Create SLO-based alerting strategies with multi-burn-rate rules, reduce alert fatigue through intelligent optimization, and integrate monitoring with incident response workflows for faster resolution.
参考文献
このスキルは以下の信頼できる情報源の調査に基づいて作成されました:
- From Monitoring to Observability: A Paradigm Shift in IT Operations Comprehensive guide on the shift from traditional monitoring to observability covering logs, metrics, and traces
- Ways to Alert on Significant Events (Google SRE Workbook) Official Google approach to multi-burn-rate and multi-window SLO-based alerting strategies
- Designing Tomorrow's Observability: Software Architect's Guide Deep dive into observability architecture, tool selection, and implementation patterns
- Monitoring Distributed Cloud-Based Microservices Framework for monitoring cloud microservices covering APM, infrastructure health, and log aggregation
- Intelligent Alerting with AI-Powered Anomaly Detection Modern ML approaches to noise reduction including predictive alerting and Holt-Winters forecasting
- SLO Monitoring Guide - Measuring Service Reliability Practical guide on SLO setup, SLI definition, and actionable threshold configuration
- How We Use Sloth for SLO Monitoring with Prometheus Real-world implementation of multi-window, multi-burn-rate alerting at Mattermost
- Observability Best Practices - Embrace.io Best practices including actionable alerts, cross-department collaboration, and data quality