オブザーバビリティとは
概要
オブザーバビリティとは、観測対象のシステムからのシグナルに基づいて、継続的にアクション可能な洞察を生成および発見する機能で す。つまり、オブザーバビリティを使用すると、システムの状態を外部出力から理解し、(修正)アクションを実行できます。
対処する問題
コンピュータシステムは、CPU 時間、メモリ、ディスク領域などの低レベルのシグナルや、API 応答時間、エラー、トランザクション毎秒などの高レベルかつビジネス上のシグナルを観測することで測定されます。
システムの可観測性は、その運用と開発コストに大きな影響を与えます。観測可能なシステムは、操作者に意味のある実行可能なデータを提供し、(インシデント応答の高速化、開発者生産性の向上など) 望ましい結果を達成し、手間とダウンタイムを少なくすることができます。
効果
より多くの情報が必ずしも観測性の高いシステムにつながるとは限らないことを理解することが重要です。 実際、システムが生成する情報量が多すぎると、アプリケーションによって発生するノイズから価値のある正常性を示すシグナルを特定することが難しくなる場合があります。 観測性には、正しい意思決定を行うために、正しい消費者(人またはソフトウェアの一部)が、正しいタイミングで、正しいデータを必要とします。
ここ で見つけられるもの
このサイトには、オブザーバビリティのベストプラクティスが含まれています。何を行うべきか、何を行うべきでないか、そしてそれらを実行する方法のレシピのコレクションです。ここにあるコンテンツのほとんどはベンダーに依存せず、あらゆる優れたオブザーバビリティソリューションが提供するものを表しています。
ただし、オブザーバビリティを製品ではなくソリューションとして考えることが重要です。オブザーバビリティはあなたのプラクティスから来るものであり、強力な開発とDevOpsのリーダーシップに不可欠なものです。観測されているアプリケーションとは、運用の原則としてオブザーバビリティを位置づけているものであり、セキュリティがプロジェクトを組織化する方法の最前線にあるのと同様です。事後的にオブザーバビリティを「ボルトオン」しようとすることはアンチパターンであり、成功する可能性が低くなります。
このサイトは4つのカテゴリに整理されています:
- ダッシュボード、アプリケーションパフォーマンスモニタリング、コンテナなどのソリューションごとのベストプラクティス
- ログやトレースなど、異なるデータタイプの使用に関するベストプラクティス
- 特定のAWSツールのベストプラクティス(ただし、これらは他のベンダー製品にも大部分適用できます)
- AWSによるオブザーバビリティのためのキュレー ションされたレシピ
このサイトは、AWSと顧客が解決した実際のユースケースに基づいています。
オブザーバビリティは、現代のアプリケーション開発の核心であり、マイクロサービスや多数の外部インテグレーションを持つ複雑なアプリケーションなどの分散システムを運用する際の重要な考慮事項です。私たちはそれを、正常なワークロードの主要指標とみなしており、ここで経験を共有できることを嬉しく思います!