EKS Observability : 重要なメトリクス

現状

モニタリングとは、インフラストラクチャとアプリケーションの所有者が、定義されたメトリクスまたはログの収集に焦点を当てて、システムの履歴および現在の状態を確認し理解する方法を提供するソリューションとして定義されます。

モニタリングは長年にわたって進化してきました。デバッグやダンプログを使用して問題をデバッグおよびトラブルシューティングすることから始まり、syslogs、top などのコマンドラインツールを使用した基本的なモニタリングへと進化し、さらにダッシュボードでそれらを可視化できるようになりました。クラウドの出現と規模の拡大により、現在ではこれまで以上に多くのものを追跡しています。業界はオブザーバビリティへとシフトしており、これはインフラストラクチャとアプリケーションの所有者がシステムを積極的にトラブルシューティングおよびデバッグできるようにするソリューションとして定義されています。オブザーバビリティは、メトリクスから導き出されたパターンを見ることに重点を置いています。

メトリクス、なぜ重要なのか？

メトリクスは、作成された時刻とともに順序付けられた一連の数値です。環境内のサーバー数、ディスク使用量、1 秒あたりに処理するリクエスト数、またはこれらのリクエストの完了にかかるレイテンシーなど、あらゆるものを追跡するために使用されます。メトリクスは、システムのパフォーマンスを示すデータです。小規模または大規模なクラスターを実行している場合でも、システムの健全性とパフォーマンスに関する洞察を得ることで、改善すべき領域を特定し、問題のトラブルシューティングとトレースを行い、ワークロード全体のパフォーマンスと効率を向上させることができます。これらの変更は、クラスターに費やす時間とリソースの量に影響を与える可能性があり、それはコストに直接反映されます。

メトリクスの収集

EKS クラスターからメトリクスを収集するには、3 つのコンポーネントが必要です。

ソース: このガイドに記載されているようなメトリクスの送信元です。
エージェント: EKS 環境で実行されるアプリケーションで、多くの場合エージェントと呼ばれ、メトリクス監視データを収集し、このデータを 2 番目のコンポーネントにプッシュします。このコンポーネントの例としては、AWS Distro for OpenTelemetry (ADOT) や CloudWatch Agent があります。
送信先: 監視データのストレージおよび分析ソリューションで、このコンポーネントは通常、時系列形式のデータに最適化されたデータサービスです。このコンポーネントの例としては、Amazon Managed Service for Prometheus や AWS Cloudwatch があります。

注意: このセクションでは、設定例は AWS Observability Accelerator の関連セクションへのリンクです。これは、EKS メトリクス収集の実装に関する最新のガイダンスと例を確実に入手できるようにするためです。

マネージド型オープンソースソリューション

AWS Distro for OpenTelemetry (ADOT) は、OpenTelemetry プロジェクトのサポート対象バージョンであり、ユーザーが相関するメトリクスとトレースを Amazon Managed Service for Prometheus や AWS Cloudwatch などのさまざまな監視データ収集ソリューションに送信できるようにします。ADOT は、EKS Managed Add-ons を通じて EKS クラスターにインストールし、メトリクス (このページに記載されているものなど) とワークロードトレースを収集するように設定できます。AWS は、ADOT アドオンが Amazon EKS と互換性があることを検証しており、最新のバグ修正とセキュリティパッチで定期的に更新されています。ADOT のベストプラクティスと詳細情報。

ADOT + AMP

AWS Distro for OpenTelemetry (ADOT)、Amazon Managed Service for Prometheus (AMP)、Amazon Managed Service for Grafana (AMG) を最も迅速に起動して実行する方法は、AWS Observability Accelerator のインフラストラクチャモニタリングの例を利用することです。このアクセラレータの例では、すぐに使えるメトリクス収集、アラートルール、Grafana ダッシュボードを備えたツールとサービスを環境にデプロイします。

インストール、設定、および EKS Managed Add-on for ADOT の操作に関する追加情報については、AWS ドキュメントを参照してください。

ソース

EKS メトリクスは、ソリューション全体のさまざまなレイヤーの複数の場所から作成されます。これは、必須メトリクスセクションで示されているメトリクスソースをまとめた表です。

レイヤー	ソース	ツール	インストールと詳細情報	Helm チャート
コントロールプレーン	api server endpoint/metrics	該当なし - api server はメトリクスを Prometheus 形式で直接公開します	https://docs.aws.amazon.com/eks/latest/userguide/prometheus.html	該当なし
クラスター状態	kube-state-metrics-http-endpoint:8080/metrics	kube-state-metrics	https://github.com/kubernetes/kube-state-metrics#overview	https://github.com/kubernetes/kube-state-metrics#helm-chart
Kube プロキシ	kube-proxy-http:10249/metrics	該当なし - kube proxy はメトリクスを Prometheus 形式で直接公開します	https://kubernetes.io/docs/reference/command-line-tools-reference/kube-proxy/	該当なし
VPC CNI	vpc-cni-metrics-helper/metrics	cni-metrics-helper	https://github.com/aws/amazon-vpc-cni-k8s/blob/master/cmd/cni-metrics-helper/README.md	https://github.com/aws/amazon-vpc-cni-k8s/tree/master/charts/cni-metrics-helper
CoreDNS	core-dns:9153/metrics	該当なし - core DNS はメトリクスを Prometheus 形式で直接公開します	https://github.com/coredns/coredns/tree/master/plugin/metrics	該当なし
ノード	prom-node-exporter-http:9100/metrics	prom-node-exporter	https://github.com/prometheus/node_exporter
https://prometheus.io/docs/guides/node-exporter/#node-exporter-metrics	https://github.com/prometheus-community/helm-charts/tree/main/charts/prometheus-node-exporter
Kubelet/Pod	kubelet/metrics/cadvisor	kubelet または api server 経由でプロキシ	https://kubernetes.io/docs/concepts/cluster-administration/system-metrics/	該当なし

エージェント：AWS Distro for OpenTelemetry

AWS では、EKS クラスター上での ADOT のインストール、設定、運用には、AWS EKS ADOT マネージド型アドオンの使用を推奨しています。このアドオンは、ADOT オペレーター/コレクターのカスタムリソースモデルを利用しており、クラスター上で複数の ADOT コレクターをデプロイ、設定、管理できます。このアドオンのインストール、高度な設定、運用に関する詳細情報については、このドキュメントを参照してください。

注意: AWS EKS ADOT マネージド型アドオン Web コンソールは、ADOT アドオンの高度な設定に使用できます。

ADOT コレクター設定には 2 つのコンポーネントがあります。

コレクター設定。コレクターのデプロイモード (deployment、daemonset など) が含まれます。
OpenTelemetry パイプライン設定。メトリクス収集に必要なレシーバー、プロセッサー、エクスポーターが含まれます。設定スニペットの例:

config: |
    extensions:
      sigv4auth:
        region: <YOUR_AWS_REGION>
        service: "aps"

    receivers:
      #
      # Scrape configuration for the Prometheus Receiver
      # This is the same configuration used when Prometheus is installed using the community Helm chart
      #  
      prometheus:
        config:
          global:
            scrape_interval: 60s
            scrape_timeout: 10s

          scrape_configs:
          - job_name: kubernetes-apiservers
            bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
            kubernetes_sd_configs:
            - role: endpoints
            relabel_configs:
            - action: keep
              regex: default;kubernetes;https
              source_labels:
              - __meta_kubernetes_namespace
              - __meta_kubernetes_service_name
              - __meta_kubernetes_endpoint_port_name
            scheme: https
            tls_config:
              ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
              insecure_skip_verify: true

              ...
              ...

    exporters:
      prometheusremotewrite:
        endpoint: <YOUR AMP WRITE ENDPOINT URL>
        auth:
          authenticator: sigv4auth
      logging:
        loglevel: warn
    extensions:
      sigv4auth:
        region: <YOUR_AWS_REGION>
        service: aps
      health_check:
      pprof:
        endpoint: :1888
      zpages:
        endpoint: :55679
    processors:
      batch/metrics:
        timeout: 30s
        send_batch_size: 500
    service:
      extensions: [pprof, zpages, health_check, sigv4auth]
      pipelines:
        metrics:
          receivers: [prometheus]
          processors: [batch/metrics]
          exporters: [logging, prometheusremotewrite]

ベストプラクティスのコレクター設定、ADOT パイプライン設定、Prometheus スクレイプ設定の完全な例は、Observability Accelerator の Helm Chart として提供されています。

送信先: Amazon Managed Service for Prometheus

ADOT コレクターパイプラインは、Prometheus Remote Write 機能を利用して AMP インスタンスにメトリクスをエクスポートします。設定例のスニペットです。AMP WRITE ENDPOINT URL に注意してください。

    exporters:
      prometheusremotewrite:
        endpoint: <YOUR AMP WRITE ENDPOINT URL>
        auth:
          authenticator: sigv4auth
      logging:
        loglevel: warn

AMP の設定と使用に関するベストプラクティスはこちらをご覧ください。

関連するメトリクスは何ですか？

利用可能なメトリクスがほとんどなかった時代は終わり、今日ではその逆で、何百ものメトリクスが利用可能です。関連性のあるメトリクスを判断できることは、オブザーバビリティファーストの考え方でシステムを構築する上で重要です。

このガイドでは、利用可能なメトリクスのさまざまなグループについて概説し、インフラストラクチャとアプリケーションにオブザーバビリティを構築する際に注目すべきメトリクスについて説明します。以下のメトリクスのリストは、ベストプラクティスに基づいて監視することを推奨するメトリクスのリストです。

以下のセクションに記載されているメトリクスは、AWS Observability Accelerator Grafana Dashboards および Kube Prometheus Stack Dashboards で強調表示されているメトリクスに加えて提供されるものです。

コントロールプレーンメトリクス

Amazon EKS コントロールプレーンは AWS によって管理され、AWS が管理するアカウントで実行されます。これは、etcd や Kubernetes API サーバーなどの Kubernetes コンポーネントを実行するコントロールプレーンノードで構成されています。Kubernetes は、Pod、デプロイメント、名前空間などのスピンアップやティアダウンなど、クラスター内のアクティビティをユーザーに通知するために、さまざまなイベントを発行します。Amazon EKS コントロールプレーンは、コアコンポーネントが適切に機能し、クラスターに必要な基本的なアクティビティを実行できるようにするために追跡する必要がある重要なコンポーネントです。

Control Plane API Server は数千のメトリクスを公開しますが、以下の表は監視を推奨する重要な Control Plane メトリクスを示しています。

名前	メトリクス	説明	理由
API サーバーの要求の合計	apiserver_request_total	動詞、ドライラン値、グループ、バージョン、リソース、スコープ、コンポーネント、HTTP レスポンスコードごとに分割された apiserver 要求のカウンターです。
API サーバーのレイテンシー	apiserver_request_duration_seconds	動詞、ドライラン値、グループ、バージョン、リソース、サブリソース、スコープ、コンポーネントごとのレスポンス待ち時間の分布(秒単位)です。
要求待ち時間	rest_client_request_duration_seconds	リクエストの待ち時間(秒単位)です。動詞と URL ごとに分割されます。
要求の合計	rest_client_requests_total	ステータスコード、メソッド、ホストごとに分割された HTTP リクエストの数です。
API サーバーの要求期間	apiserver_request_duration_seconds_bucket	Kubernetes API サーバーへの各リクエストの待ち時間を秒単位で測定します
API サーバーの要求待ち時間の合計	apiserver_request_latencies_sum	K8 API サーバーがリクエストの処理に要した合計時間を追跡する累積カウンターです
API サーバーに登録されたウォッチャー	apiserver_registered_watchers	特定のリソースに対して現在登録されているウォッチャーの数です
API サーバーのオブジェクト数	apiserver_storage_object	前回のチェック時に保存されていたオブジェクトの数を種類別に分割したものです。
アドミッションコントローラーの待ち時間	apiserver_admission_controller_admission_duration_seconds	アドミッションコントローラーの待ち時間ヒストグラム(秒単位)です。名前で識別され、操作、API リソース、タイプ(validate または admit)ごとに分割されます。
Etcd の待ち時間	etcd_request_duration_seconds	操作とオブジェクトタイプごとの Etcd リクエストの待ち時間(秒単位)です。
Etcd DB サイズ	apiserver_storage_db_total_size_in_bytes	Etcd データベースのサイズです。	これにより、etcd データベースの使用状況を事前に監視し、制限を超過することを回避できます。

Cluster State メトリクス

Cluster State Metrics は次によって生成されます kube-state-metrics (KSM)。KSM はクラスター内のポッドとして実行されるユーティリティで、Kubernetes API Server をリッスンし、クラスターの状態とクラスター内の Kubernetes オブジェクトに関する洞察を Prometheus メトリクスとして提供します。これらのメトリクスを利用できるようにするには、KSM をインストールする必要があります。これらのメトリクスは、Kubernetes がポッドのスケジューリングを効果的に行うために使用され、デプロイメント、レプリカセット、ノード、ポッドなど、内部のさまざまなオブジェクトの健全性に焦点を当てています。クラスター状態メトリクスは、ステータス、容量、可用性に関するポッド情報を公開します。クラスターがスケジューリングタスクをどのように実行しているかを追跡することは、パフォーマンスを把握し、問題を未然に防ぎ、クラスターの健全性を監視するために不可欠です。公開されているクラスター状態メトリクスは約 X 個あり、以下の表は追跡すべき重要なメトリクスを示しています。

名前	メトリクス	説明
ノードステータス	kube_node_status_condition	ノードの現在の健全性ステータスです。ノード条件のセットと、それぞれに対する `true`、`false`、または `unknown` を返します
目標 Pod 数	kube_deployment_spec_replicas or kube_daemonset_status_desired_number_scheduled	Deployment または DaemonSet に指定された Pod の数
現在の Pod 数	kube_deployment_status_replicas or kube_daemonset_status_current_number_scheduled	Deployment または DaemonSet で現在実行中の Pod の数
Pod 容量	kube_node_status_capacity_pods	ノードで許可される最大 Pod 数
利用可能な Pod 数	kube_deployment_status_replicas_available or kube_daemonset_status_number_available	Deployment または DaemonSet で現在利用可能な Pod の数
利用不可能な Pod 数	kube_deployment_status_replicas_unavailable or kube_daemonset_status_number_unavailable	Deployment または DaemonSet で現在利用できない Pod の数
Pod のレディネス	kube_pod_status_ready	Pod がクライアントリクエストに対応できる状態かどうか
Pod のステータス	kube_pod_status_phase	Pod の現在のステータス。値は pending/running/succeeded/failed/unknown のいずれかになります
Pod の待機理由	kube_pod_container_status_waiting_reason	コンテナが待機状態にある理由
Pod の終了ステータス	kube_pod_container_status_terminated	コンテナが現在終了状態にあるかどうか
スケジューリング待ちの Pod	pending_pods	ノード割り当てを待機している Pod の数
Pod スケジューリング試行回数	pod_scheduling_attempts	Pod のスケジューリングが試行された回数

クラスターアドオンメトリクス

クラスターアドオンは、Kubernetes アプリケーションに運用サポート機能を提供するソフトウェアです。これには、オブザーバビリティエージェントや、クラスターがネットワーキング、コンピューティング、ストレージのために基盤となる AWS リソースと対話できるようにする Kubernetes ドライバーなどのソフトウェアが含まれます。アドオンソフトウェアは通常、Kubernetes コミュニティ、AWS などのクラウドプロバイダー、またはサードパーティベンダーによって構築および保守されています。Amazon EKS は、Amazon VPC CNI plugin for Kubernetes などの自己管理型アドオンを自動的にインストールします。 kube-proxy、および各クラスターの CoreDNS が含まれます。

これらの Cluster アドオンは、ネットワーキング、ドメイン名解決など、さまざまな領域で運用サポートを提供します。重要なサポートインフラストラクチャとコンポーネントがどのように動作しているかについての洞察を提供します。アドオンメトリクスを追跡することは、クラスターの運用状態を理解するために重要です。

以下は、重要なメトリクスとともに監視を検討すべき必須のアドオンです。

Amazon VPC CNI プラグイン

Amazon EKS は、Amazon VPC Container Network Interface (VPC CNI) プラグインを通じてクラスターネットワーキングを実装します。CNI プラグインにより、Kubernetes Pod は VPC ネットワーク上と同じ IP アドレスを持つことができます。より具体的には、Pod 内のすべてのコンテナはネットワーク名前空間を共有し、ローカルポートを使用して相互に通信できます。VPC CNI アドオンを使用すると、Amazon EKS クラスターのセキュリティと安定性を継続的に確保し、アドオンのインストール、設定、更新に必要な労力を削減できます。

VPC CNI アドオンメトリクスは、CNI Metrics Helper によって公開されます。IP アドレス割り当てを監視することは、クラスターの健全性を確保し、IP 枯渇の問題を回避するために不可欠です。収集および監視すべき最新のネットワーキングベストプラクティスと VPC CNI メトリクスについては、こちらを参照してください。

CoreDNS メトリクス

CoreDNS は、Kubernetes クラスター DNS として機能できる柔軟で拡張可能な DNS サーバーです。CoreDNS Pod は、クラスター内のすべての Pod に名前解決を提供します。DNS 集約型ワークロードを実行すると、DNS スロットリングにより断続的な CoreDNS 障害が発生することがあり、これがアプリケーションに影響を与える可能性があります。

主要な CoreDNS パフォーマンスメトリクスの追跡に関する最新のベストプラクティスはこちらと DNS スロットリング問題に関する CoreDNS トラフィックの監視をご確認ください。

Pod/Container メトリクス

アプリケーションのすべてのレイヤーにわたる使用状況を追跡することは重要です。これには、クラスター内で実行されているノードと Pod を詳しく調べることが含まれます。Pod ディメンションで利用可能なすべてのメトリクスの中で、このメトリクスのリストは、クラスター上で実行されているワークロードの状態を理解するために実用的です。CPU、メモリ、ネットワークの使用状況を追跡することで、アプリケーション関連の問題を診断およびトラブルシューティングできます。ワークロードメトリクスを追跡することで、リソース使用率に関する洞察が得られ、EKS 上で実行されているワークロードを適切なサイズに調整できます。

メトリクス	PromQL クエリの例	ディメンション
名前空間ごとの実行中の Pod 数	count by(namespace) (kube_pod_info)	クラスターごとの名前空間別
Pod ごとのコンテナごとの CPU 使用率	sum(rate(container_cpu_usage_seconds_total{container!=""}[5m])) by (namespace, pod)	クラスターごとの名前空間別 Pod 別
Pod ごとのメモリ使用率	sum(container_memory_usage_bytes{container!=""}) by (namespace, pod)	クラスターごとの名前空間別 Pod 別
Pod ごとのネットワーク受信バイト数	sum by(pod) (rate(container_network_receive_bytes_total[5m]))	クラスターごとの名前空間別 Pod 別
Pod ごとのネットワーク送信バイト数	sum by(pod) (rate(container_network_transmit_bytes_total[5m]))	クラスターごとの名前空間別 Pod 別
コンテナごとのコンテナ再起動回数	increase(kube_pod_container_status_restarts_total[15m]) > 3	クラスターごとの名前空間別 Pod 別

ノードメトリクス

Kube State Metrics と Prometheus node exporter は、クラスター内のノードに関するメトリクス統計を収集します。ノードのステータス、CPU 使用率、メモリ、ファイルシステム、トラフィックを追跡することは、ノードの使用率を理解する上で重要です。ノードリソースがどのように使用されているかを理解することは、クラスターで実行する予定のワークロードのタイプに効果的に対応するために、インスタンスタイプとストレージを適切に選択する上で重要です。以下のメトリクスは、追跡すべき重要なメトリクスの一部です。

メトリクス	PromQL クエリの例	ディメンション
ノード CPU 使用率	sum(rate(container_cpu_usage_seconds_total{container!=""}[5m])) by (node)	クラスターごとのノード別
ノードメモリ使用率	sum(container_memory_usage_bytes{container!=""}) by (node)	クラスターごとのノード別
ノードネットワーク合計バイト数	sum by (instance) (rate(node_network_receive_bytes_total[3m]))+sum by (instance) (rate(node_network_transmit_bytes_total[3m]))	クラスターごとのノード別
ノード CPU 予約容量	sum(kube_node_status_capacity{cluster!=""}) by (node)	クラスターごとのノード別
ノードごとの実行中の Pod 数	sum(kubelet_running_pods) by (instance)	クラスターごとのノード別
クラスター CPU 使用率	sum(rate(node_cpu_seconds_total{mode!="idle",mode!="iowait",mode!="steal"}[5m]))	クラスターごと
クラスターメモリ使用率	1 - sum(:node_memory_MemAvailable_bytes:sum{cluster=""}) / sum(node_memory_MemTotal_bytes\job="node-exporter",cluster=""})	クラスターごと
クラスターネットワーク合計バイト数	sum(rate(node_network_receive_bytes_total[3m]))+sum(rate(node_network_transmit_bytes_total[3m]))	クラスターごと
実行中の Pod 数	sum(kubelet_running_pod_count{cluster=""})	クラスターごと
実行中のコンテナ数	sum(kubelet_running_container_count{cluster=""})	クラスターごと
クラスター CPU 制限	sum(kube_node_status_allocatable{resource="cpu"})	クラスターごと
クラスターメモリ制限	sum(kube_node_status_allocatable{resource="memory"})	クラスターごと
クラスターノード数	count(kube_node_info) OR sum(kubelet_node_name{cluster=""})	クラスターごと