관측 가능성 스택 (Observability Stack)
메트릭, 대시보드, 로그, 알림을 아우르는 관측 가능성 (Observability) 워크플로우를 구축하는 챌린지 전용 코스에서 모니터링, 시각화 및 중앙 집중식 로깅 기술을 적용해 보세요. 이 프로젝트는 운영자가 복잡한 시스템을 가시화하고 실행 가능한 상태로 만드는 방법을 종합적으로 검토하는 과정입니다.
왜 중요한가요?
팀이 메트릭, 대시보드, 로그, 알림을 하나의 유용한 워크플로우로 연결하지 못한다면 텔레메트리 (telemetry) 데이터를 수집하는 것만으로는 충분하지 않습니다. 진정한 관측 가능성을 확보하려면 문제를 감지하고, 신속하게 조사하며, 시스템 상태를 명확하게 소통할 수 있도록 돕는 통합된 도구가 필요합니다. 이 프로젝트는 단계별 가이드 없이 스스로 통합 과정을 연습할 수 있도록 돕습니다.
학습 내용
- 관측 가능성의 정량적 기반으로서 메트릭을 수집하고 검증합니다.
- 원시 텔레메트리 데이터를 운영 가시성으로 전환하는 대시보드를 구축합니다.
- 심층적인 조사를 지원하기 위해 로그를 중앙에서 집계하고 쿼리합니다.
- 의미 있는 운영 상태를 반영하는 알림 (alerting) 을 구성합니다.
- 여러 관측 가능성 도구를 순차적으로 연결하는 챌린지 전용 과제를 수행합니다.
- Prometheus, Grafana, Loki 및 알림 워크플로우를 하나의 스택으로 통합합니다.
코스 로드맵
이 프로젝트는 Prometheus 메트릭 수집을 시작으로 관측 가능성 스택의 메트릭 계층을 구축합니다. 이후 Grafana 대시보드 설정으로 넘어가 이러한 신호를 공유 가능한 운영 뷰로 전환합니다.
다음으로, 시스템 전반의 이벤트를 중앙에서 검색할 수 있도록 로그 집계 파이프라인을 구축합니다. 마지막으로 Alertmanager 구성을 통해 수집된 텔레메트리를 실행 가능한 알림 및 사고 대응 워크플로우와 연결하며 프로젝트를 마무리합니다.
수강 대상
이 코스는 모니터링, 대시보드 구축, 중앙 집중식 로깅 모듈을 완료하고, 전체 관측 가능성 스택에 대한 사고력을 테스트할 수 있는 챌린지 중심의 복습을 원하는 학습자를 위한 과정입니다.
학습 성과
이 코스를 마치면 메트릭, 대시보드, 로그, 알림을 보다 완벽한 관측 가능성 워크플로우로 연결할 수 있게 되며, 이러한 계층들이 실제 사고 감지 및 조사를 어떻게 지원하는지 논리적으로 이해할 수 있게 됩니다.




