可观测性技术栈 (Observability Stack)
通过这个纯挑战性质的课程,运用你在监控、可视化和集中式日志记录方面的技能,构建一套涵盖指标、仪表盘、日志和告警的可观测性工作流。本项目旨在综合考察运维人员如何让复杂系统变得透明且可操作。
为什么这很重要
如果团队无法将指标、仪表盘、日志和告警整合进一个可用的工作流中,仅仅收集遥测数据是远远不够的。真正的可观测性工作需要协同工具的配合,以帮助人们发现问题、快速排查并清晰地传达系统状态。本项目将帮助你在没有分步指导的情况下,练习这种整合能力。
你将学到什么
- 收集并验证指标,作为可观测性的量化基础。
- 构建仪表盘,将原始遥测数据转化为运维可视化视图。
- 集中聚合和查询日志,以支持更深入的调查。
- 配置能够反映实际运维状况的告警。
- 通过纯挑战任务,将多个可观测性工具串联起来。
- 将 Prometheus、Grafana、Loki 和告警工作流集成到一个完整的技术栈中。
课程路线图
本项目从 Prometheus 指标收集开始,建立可观测性技术栈的指标层。随后进入 Grafana 仪表盘设置阶段,将这些信号转化为共享的运维视图。
接下来,你将构建一个日志聚合管道,以便在系统间进行集中式事件搜索。项目最后是 Alertmanager 配置,将收集到的遥测数据与可操作的通知及事件响应工作流连接起来。
适合人群
本课程适合已经完成了监控、仪表盘和集中式日志记录模块,并希望通过纯挑战形式来检验自身全栈可观测性思维的学习者。
学习成果
完成本课程后,你将能够把指标、仪表盘、日志和告警连接成一个更完整的工作流,并能够深入理解这些层级如何支持实际的事件检测与调查。




