ハイブリッドクラウドとマルチクラウドのベストプラクティス
はじめに
マルチクラウドとは、複数のクラウドサービスプロバイダーを同時に使用してワークロードを運用することを指し、ハイブリッドとは、オンプレミスとクラウド環境の両方にワークロードを拡張することを指します。 ハイブリッドおよびマルチクラウド環境におけるオブザーバビリティは、ツールの多様性、レイテンシー、異種ワークロードにより、大きな複雑さを伴う可能性がありま す。 それにもかかわらず、これは開発者とビジネスユーザーの両方にとって共通の目標であり続けています。 この目標を達成するために、豊富な製品とサービスのエコシステムが存在します。
しかし、クラウドネイティブなワークロードに対するオブザーバビリティツールの有用性は、大きく異なる場合があります。 コンテナ化されたバッチ処理ワークロードと、サーバーレスフレームワークを使用するリアルタイムバンキングアプリケーションのモニタリング要件の違いを考えてみましょう。 両者ともログ、メトリクス、トレースを持っていますが、それらを観察するためのツールチェーンは、クラウドネイティブ、オープンソース、ISV 製品など、さまざまな選択肢があります。 Prometheus のようなオープンソースツールが一方に適している一方で、マネージドサービスとして提供されるクラウドネイティブツールが要件をより良く満たす場合もあります。
これにマルチクラウドとハイブリッドの複雑さが加わると、アプリケーションからの洞察を得ることはさらに困難になります。
これらの追加された次元に対処し、オブザーバビリティへのアプローチを容易にするため、お客様は統一されたインターフェースを持つ単一のツールチェーンに投資する傾向があります。 結局のところ、シグナルとノイズの比率を下げることは通常良いことです! しかし、単一のアプローチがすべてのユースケースに適用できるわけではなく、さまざまなプラットフォームの運用モデルが混乱を招く可能性があります。 私たちの目標は、お客様のニーズを補完し、問題が発生した際の平均修復時間を短縮するための情報に基づいた決定を支援することです。 以下は、あらゆる規模、すべての業界のお客様との協業を通じて学んだベストプラクティスです。
これらのベストプラクティスは、エンタープライズアーキテクト、開発者、DevOps など、幅広い役割を対象としています。 組織のビジネスニーズと、分散環境におけるオブザーバビリティがどれだけの価値を提供できるかという観点から、これらを評価することをお勧めします。
ツールに判断を左右されないようにする
アプリケーション、ツール、プロセスは、売上や顧客満足度の向上などのビジネス成果を達成するために存在します。 適切な技術戦略とは、これらのビジネス目標の達成を可能な限り支援するものです。 しかし、目標達成を支援するものは単なるツールであり、戦略を支援するためのものであって、戦略そのものではありません。 たとえば、家を建てる必要がある場合、ツールに設計や建築方法を尋ねることはしません。 むしろ、ツールは目的を達成するための手段なのです。
単一の同質な環境では、ツールに関する判断は比較的容易です。 結局のところ、1 つの環境で単一のアプリケーションを実行する場合、ツールは全体で同じものを簡単に使用できます。 しかし、ハイブリッドおよびマルチクラウド環境では状況はより複雑になり、ビジネス成果と、これらの環境全体でワークロードを監視することによって得られる価値に注目することが重要です。 各クラウドサービスプロバイダー (CSP) には独自のネイティブなオブザーバビリティソリューションがあり、利用可能なパートナーや独立系ソフトウェアベンダー (ISV) も豊富に存在します。
複数の環境で運用しているからといって、すべてのワークロードに単一のツールを使用することが推奨されるわけではありません。 これは、ワークロードを監視するために複数のサービス、フレームワーク、またはプロバイダーを使用する可能性があることを意味します。 運用モデルがニーズを反映する必要がある方法の詳細については、以下の「ワークロードのコンテキストの方が単一の管理画面よりも重要」を参照してください。 いずれにせよ、ツールを実装する際は、将来オブザーバビリティソリューショ ンを進化させることができるように「Two-way doors」を作成することを忘れないでください。
以下は、避けるべき「ツール優先」の結果の例です:
- 将来のアップグレードや新しいソリューションへの移行のための Two-way door なしに単一のツールの実装に焦点を当てると、回避可能な技術的負債が生じる可能性があります。 これは、ツールがソリューションとなり、いつの日か解決が必要な問題となる可能性があるときに発生します。
- ボリュームディスカウントにより単一のツールを使用する企業標準は、有益な機能を得られない可能性があります。 これは「品質よりもコスト」となり、意図せずモノリシックなアンチパターンを生み出す可能性があります。 ボリュームしきい値以下を維持するためにテレメトリの収集を抑制し、結果としてオブザーバビリティツールの使用を妨げる可能性があります。
- ログとメトリクスのコレクターは充実しているものの、既存のトレース収集インフラストラクチャがないためにテレメトリの種類全体(通常はトレース)を収集しないことは、不完全なオブザーバビリティソリューションにつながる可能性があります。
- 労働コストとトレーニングコストを削減したいという理由で、サポートスタッフが単一のツールチェーンのみのトレーニングを受けることで、他のオブザーバビリティパターンの潜在的な価値が低下する可能性があります。
ツールがオブザーバビリティ戦略を決定している場合は、アプローチを逆転させる必要があります。 ツールはオブザーバビリティを実現し、強化するためのものであり、選択肢を制限するものではありません。
ツールの乱立は企業が苦労している実際の問題ですが、単一のツールチェーンへの急激な移行も同様にオブザーバビリティソリューションの有用性を低下させる可能性があります。 ハイブリッドおよびマルチクラウドのワークロードには、各プラットフォーム固有のテクノロジーがあり、各 CSP の高度なサービスは有用です。 ただし、単一ソース製品を使用することのトレードオフには、価値に基づく分析が必要です。 これらのリスクの一部を軽減するアプローチについては、「OpenTelemetry への投資」を参照してください。