key-performance-indicators
1.0 KPI(「ゴールデンシグナル」)の理解
組織は、ビジネスや運用の健 全性やリスクに関する洞察を提供する主要業績評価指標(KPI)、別名「ゴールデンシグナル」を活用しています。組織の各部門は、それぞれの成果を測定するための独自の KPI を持っています。例えば、eコマースアプリケーションのプロダクトチームは、カートの注文を正常に処理する能力を KPI として追跡します。オンコール運用チームは、インシデントの平均検出時間(MTTD)を KPI として測定します。財務チームにとっては、予算内のリソースコストが重要な KPI となります。
サービスレベルインジケータ(SLI)、サービスレベル目標(SLO)、サービスレベル合意(SLA)は、サービス信頼性管理の重要な要素です。このガイドでは、Amazon CloudWatch とその機能を使用して SLI、SLO、SLA を計算し監視するためのベストプラクティスを、明確で簡潔な例とともに概説します。
- SLI(サービスレベルインジケータ): サービスのパフォーマンスを定量的に測定するもの。
- SLO(サービスレベル目標): SLI の目標値で、望ましいパフォーマンスレベルを表します。
- SLA(サービスレベル合意): サービスプロバイダーとユーザー間で、期待されるサービスレベルを規定する契約。
一般的な SLI の例:
- 可用性:サービスが稼働している時間の割合
- レイテンシー:リクエストを処理するのにかかる時間
- エラー率:失敗したリクエストの割合
2.0 顧客とステークホルダーの要件を発見する(以下のテ ンプレートを使用することを推奨)
- 最上位の質問から始めます:「対象のワークロード(例:決済ポータル、eコマース注文、ユーザー登録、データレポート、サポートポータルなど)に関するビジネス価値またはビジネス上の問題は何か」
- ビジネス価値を以下のようなカテゴリに分類します:ユーザーエクスペリエンス(UX)、ビジネスエクスペリエンス(BX)、運用エクスペリエンス(OpsX)、セキュリティエクスペリエンス(SecX)、開発者エクスペリエンス(DevX)
- 各カテゴリの主要なシグナル、いわゆる「ゴールデンシグナル」を導き出します。UX と BX に関する主要なシグナルは、通常ビジネスメトリクスを構成します
ID | イニシャル | 顧客 | ビジネスニーズ | 測定項目 | 情報源 | 良好な状態とは? | アラート | ダッシュボード | レポート |
---|---|---|---|---|---|---|---|---|---|
M1 | 例 | 外部エンドユーザー | ユーザーエクスペリエンス | レスポンスタイム(ページレイテンシー) | ログ / トレース | 99.9% が 5 秒未満 | いいえ | はい | いいえ |
M2 | 例 | ビジネス |