ベストプラクティスの概要
オブザーバビリティは幅広いトピックであり、成熟したツールの環境があります。しかし、すべてのツールがすべてのソリューションに適しているわけではありません。オブザーバビリティの要件、構成、最終的なデプロイメントを通じてナビゲートするのを支援するために、オブザーバビリティ戦略に関する意思決定プロセスに役立つ 5 つの主要なベストプラクティスをまとめました。
重要なものをモニタリングする
オブザーバビリティで最も重要な考慮事項は、サーバー、ネットワーク、アプリケーション、または顧客ではありません。それは、あなた、あなたのビジネス、プロジェクト、またはユーザーにとって重要なものです。
まず、成功基準から始めましょう。例えば、e コマースアプリケーションを運営している場合、成功の指標は過去 1 時間の購入数かもしれません。非営利団体の場合、月間目標に対する寄付金額かもしれません。決済プロセッサーは取引処理時間を監視し、大学は学生の出席率を測定したいかもしれません。
成功指標は誰にとっても異なります!ここでは e コマースアプリケーションを例として使用していますが、あなたのプロジェクトは全く異なる測定基準を持つ可能性があります。それでも、アドバイスは同じです:良い 状態がどのようなものかを知り、それを測定してください。
アプリケーションに関係なく、まずは主要な指標を特定することから始めなければなりません。そして、そこから ワーキングバックワーズ1 して、アプリケーションやインフラストラクチャの観点からどのような影響があるかを確認します。例えば、Web サーバーの高い CPU 使 用率が顧客満足度を危険にさらし、結果的に売上に影響を与えるのであれば、CPU 使用率のモニタリングは重要です!
目標を把握し、測定しましょう!
重要なトップレベルの KPI を特定したら、次はそれらを自動的に追跡・測定する方法を確立することです。成功の重要な要因は、ワークロードの運用を監視するのと同じシステムでこれを行うことです。eコマースワークロードの例では、以下のようなことが考えられます:
- 売上データを時系列として公開する
- ユーザー登録を同じシステムで追跡する
- 顧客がウェブページに滞在する時間を測定し、(再度)このデータを時系列にプッシュする
ほとんどの顧客は既にこのデータを持っていますが、オブザーバビリティの観点から見ると必ずしも適切な場所にあるとは限りません。売上データやユーザー登録データは、通常、リレーショナルデータベースやビジネスインテリジェンス報告システムで見つけることができます。また、訪問時間のデータはログから抽出するか、リアルユーザーモニタリングから取得できます。
メトリクスデータの元の場所や形式に関わらず、それは時系列として維持される必要があります。ビジネス、個人、学術、その他どのような目的であれ、あなたにとって最も重要な主要メトリクスはすべて、他のオブザーバビリティデータ(時にシグナルやテレメトリと呼ばれる)と相関付けるために、時系列形式である必要があります。
図 1:時系列の例
コンテキスト伝播とツール選択
ツールの選択は重要で、問題の運用と修正方法に大きな違いをもたらします。しかし、最適でないツールを選ぶよりも悪いのは、すべての基本的なシグナルタイプに対してツールを選ぶことです。例えば、ワークロードから基本的なログを収集しても、トランザクショントレースが欠けていると、ギャップが生じます。その結果、アプリケーション体験全体の一貫性のない見方になってしまいます。オブザーバビリティの現代的なアプローチはすべて、アプリケーショントレースで「点と点を結ぶ」ことに依存しています。
健全性と運用の完全な全体像を得るには、ログ、メトリクス、トレースを収集し、相関関係、分析、異常検出、ダッシュボード、アラームなどを実行するツールが必要です。
一部のオブザーバビリティソリューションには上記のすべてが含まれていない場合がありますが、既存のシステムを補強、拡張、または付加価値を与えることを目的としています。いずれの場合も、オブザーバビリティプロジェクトを開始する際には、ツールの相互運用性と拡張性が重要な考慮事項となります。