ベストプラクティスの概要
オブザーバビリティは、成熟したツールの状況を持つ広範なトピックです。ただし、すべてのツールがすべてのソリューションに適しているわけではありません。オブザーバビリティの要件、設定、最終的なデプロイメントをナビゲートするために、オブザーバビリティ戦略の意思決定プロセスに役立つ 5 つの主要なベストプラクティスをまとめました。
重要なことを監視する
オブザーバビリティにおいて最も重要な考慮事項は、サーバー、ネットワーク、アプリケーション、または顧客ではありません。あなた、あなたのビジネス、プロジェクト、またはユーザーにとって重要なことです。
重要なものをモニタリングする
オブザーバビリティで最も重要な考慮事項は、サーバー、ネットワーク、アプリケーション、顧客ではありません。 それは、あなた、ビジネス、プロジェクト、またはユーザーにとって重要なものです。
まずは成功基準から始めましょう。例えば、e コマースアプリケーションを運営している場合、成功の指標は過去 1 時間の購入数かもしれません。非営利団体の場合は、月間目標に対する寄付金額かもしれません。決済プロセッサーは取引処理時間を監視し、大学は学生の出席率を測定したいかもしれません。
成功指標は人それぞれ異なります。ここでは e コマースアプリケーションを例として使用していますが、プロジェクトによって測定方法は大きく異なる可能性があります。それでも、アドバイスは同じです。良い状態がどのようなものかを把握し、それを測定してください。
アプリケーションに関係なく、まず主要なメトリクスを特定する必要があります。次に、そこから逆算して1、アプリケーションまたはインフラストラクチャの観 点から何が影響を与えるかを確認します。たとえば、Web サーバーの高い CPU 使用率が顧客満足度を脅かし、ひいては売上に影響を与える場合、CPU 使用率の監視が重要になります。
目標を把握し、測定しましょう!
重要なトップレベル KPI を特定したら、次の作業は、それらを追跡および測定する自動化された方法を用意することです。重要な成功要因は、ワークロードの運用を監視するのと同じシステムでこれを行うことです。e コマースワークロードの例では、次のことを意味する場合があります。
- 販売データを時系列に公開
- この同じシステムでユーザー登録を追跡
- 顧客が Web ページに滞在する時間を測定し、(再び) このデータを時系列にプッシュ
ほとんどの顧客は、オブザーバビリティの観点から必ずしも適切な場所にあるわけではありませんが、このデータをすでに持っています。売上データは通常、リレーショナルデータベースやビジネスインテリジェンスレポートシステムに、ユーザー登録と共に見つけることができます。また、訪問期間のデータは、ログまたはReal User Monitoringから抽出できます。
メトリクスデータの元の場所や形式に関係なく、時系列として維持する必要があります。ビジネス、個人、学術、またはその他の目的を問わず、最も重要なすべての主要メトリクスは、他のオブザーバビリティデータ (シグナルまたはテレメトリとも呼ばれます) と関連付けるために、時系列形式である必要があります。
図 1: 時系列の例
コンテキストの伝播とツールの選択
ツールの選択は重要であり、問題の運用と修復の方法に大きな違いをもたらします。しかし、最適でないツールを選択するよりも悪いのは、すべての基本的なシグナルタイプに対応するツールがないことです。たとえば、ワークロードから基本的なログを収集しているものの、トランザクショントレースが欠けている場合、ギャップが生じます。その結果、アプリケーション全体のエクスペリエンスの一貫性のないビューになります。オブザーバビリティに対するすべての最新のアプローチは、アプリケーショントレースで「点と点を結ぶ」ことに依存しています。
ヘルスと運用の全体像を把握するには、ログ、メトリクス、トレースを収集し、相関分析、異常検出、ダッシュボード、アラームなどを実行するツールが必要です。
一部のオブザーバビリティソリューションには上記のすべてが含まれていない場合がありますが、既存のシステムを補強、拡張、または付加価値を与えることを目的としています。すべてのケースにおいて、ツールの相互運用性と拡張性は、オブザーバビリティプロジェクトを開始する際の重要な考慮事項です。