ダッシュボード
ダッシュボードは、オブザーバビリティソリューションの重要な部分です。データの整理された可視化を実現します。 データの履歴を確認し、関連する他のデータと並べて表示することができます。 また、コンテキストを提供することもできます。 全体像を理解するのに役立ちます。
多くの場合、データを収集してアラームを作成した後、そこで終わってしまいます。 しかし、アラームは特定の時点のデータ、通常は単一のメトリクスまたは少量のデータセットしか表示しません。 ダッシュボードは、時間の経過に伴う動作を確認するのに役立ちます。

実践的な例:高 CPU に対するアラームを考える
マシンが望ましい値よりも高い CPU で動作していることがわかりました。対応が必要でしょうか?また、どのくらい早く対応する必要があるでしょうか?判断の助けとなる要素を見てみましょう。
- このインスタンス/アプリケーションの通常の CPU 使用率はどのくらいですか?
- これは一時的なスパイクですか?それとも CPU が増加傾向にありますか?
- パフォーマンスに影響が出ていますか?影響が出ていない場合、影響が出るまでどのく らいの時間がありますか?
- これは定期的に発生する事象ですか?また、通常は自然に回復しますか?
データの履歴を確認する
CPU の履歴を示す時系列グラフがあるダッシュボードを考えてみましょう。 このメトリクスだけでも、一時的なスパイクなのか、上昇傾向なのかを確認できます。 また、上昇傾向の速さも確認でき、対応の優先順位を判断することができます。
ワークフローへの影響を確認する
しかし、このマシンは何をしているのでしょうか?全体的な文脈の中でどの程度重要なのでしょうか?ここで、レスポンスタイム、スループット、エラー、その他の指標など、ワークフローのパフォーマンスの可視化を追加することを考えてみましょう。 これにより、高い CPU 使用率がこのインスタンスがサポートしているワークフローやユーザーにどのような影響を与えているかを確認できます。