Live:CloudOps Webinars & Hands-on Workshops ·Register ↗
본문으로 건너뛰기

Observability란?

Observability란 무엇인가

Observability는 운영 중인 시스템에서 발생하는 신호(Signal)를 바탕으로, 실행 가능한 인사이트를 지속적으로 생성하고 발견할 수 있는 능력을 말합니다. 쉽게 말해, 시스템의 외부 출력만으로도 내부 상태를 파악하고 적절한 조치를 취할 수 있게 해주는 것이 Observability입니다.

Observability가 해결하는 문제

컴퓨터 시스템은 CPU 사용률, 메모리, 디스크 공간 같은 수준의(low-level) 신호와, API 응답 시간, 오류율, 초당 트랜잭션 수(TPS) 같은 고수준(high-level) 비즈니스 신호를 통해 측정됩니다.

시스템의 Observability 수준은 운영 비용과 개발 비용에 큰 영향을 미칩니다. Observability가 잘 갖춰진 시스템은 운영자에게 의미 있고 조치 가능한 데이터를 제공하며, 이를 통해 장애 대응 속도를 높이고, 개발 생산성을 향상시키며, 불필요한 수작업과 서비스 중단을 줄일 수 있습니다.

Observability가 도움이 되는 이유

정보가 많다고 해서 반드시 Observability가 좋아지는 것은 아닙니다. 오히려 시스템이 생성하는 정보량이 너무 많으면, 노이즈 속에서 정작 중요한 상태 신호를 찾기가 더 어려워질 수 있습니다. 진정한 Observability란, 적절한 시점에 적절한 소비자(사람 또는 소프트웨어)에게 적절한 데이터를 제공하여 올바른 의사결정을 내릴 수 있게 하는 것입니다.

이 사이트에서 다루는 내용

이 사이트에는 Observability에 관한 모범 사례가 정리되어 있습니다 — 무엇을 해야 하고, 무엇을 피해야 하며, 어떻게 구현하는지에 대한 레시피를 제공합니다. 대부분의 내용은 특정 벤더에 종속되지 않으며, 우수한 Observability 솔루션이라면 공통으로 갖춰야 할 사항들을 다룹니다.

Observability는 '제품'이 아니라 '솔루션'으로 바라보는 것이 중요합니다. Observability는 여러분의 실천에서 비롯되며, 강력한 개발 문화와 DevOps 리더십의 핵심 요소입니다. 잘 관찰(Observe)되는 애플리케이션이란, 보안을 프로젝트 설계 초기부터 고려하듯이 Observability를 운영의 핵심 원칙으로 두는 것을 의미합니다. 나중에 Observability를 "덧붙이는" 방식은 안티패턴이며 좋은 결과로 이어지기 어렵습니다.

이 사이트는 다음 여덟가지 카테고리로 구성되어 있습니다:

  1. 솔루션별 모범 사례 — 대시보드, 애플리케이션 성능 모니터링(APM), 컨테이너 등
  2. 데이터 유형별 모범 사례 — 로그, 트레이스 등
  3. AWS 도구 활용 모범 사례 (다른 벤더 제품에도 대부분 적용 가능)
  4. AWS 환경에서의 Observability 레시피 모음
  5. AIOps and Ops for AI
  6. 실제 실습형 Observability 패턴
  7. 역할별 모범 사례 및 권장 사항
  8. 유용한 정보
정보

이 사이트의 내용은 AWS와 고객이 실제로 경험하고 해결한 사례를 기반으로 합니다.

Observability는 현대 애플리케이션 개발의 핵심이며, 마이크로서비스나 외부 연동이 많은 복잡한 애플리케이션 같은 분산 시스템을 운영할 때 반드시 고려해야 할 요소입니다. 우리는 Observability를 워크로드 건강 상태를 가늠하는 선행 지표로 여기며, 이곳에서 그 경험을 여러분과 나누고자 합니다!