可观测性堆栈

高级

将黑盒系统转变为可观测的基础设施。您将部署 Prometheus 用于指标收集、Grafana 用于可视化,以及 Loki 用于日志聚合,从而深入了解系统性能。

devops-engineerdevopslinux

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

可观测性技术栈 (Observability Stack)

通过这个纯挑战性质的课程,运用你在监控、可视化和集中式日志记录方面的技能,构建一套涵盖指标、仪表盘、日志和告警的可观测性工作流。本项目旨在综合考察运维人员如何让复杂系统变得透明且可操作。

为什么这很重要

如果团队无法将指标、仪表盘、日志和告警整合进一个可用的工作流中,仅仅收集遥测数据是远远不够的。真正的可观测性工作需要协同工具的配合,以帮助人们发现问题、快速排查并清晰地传达系统状态。本项目将帮助你在没有分步指导的情况下,练习这种整合能力。

你将学到什么

  • 收集并验证指标,作为可观测性的量化基础。
  • 构建仪表盘,将原始遥测数据转化为运维可视化视图。
  • 集中聚合和查询日志,以支持更深入的调查。
  • 配置能够反映实际运维状况的告警。
  • 通过纯挑战任务,将多个可观测性工具串联起来。
  • 将 Prometheus、Grafana、Loki 和告警工作流集成到一个完整的技术栈中。

课程路线图

本项目从 Prometheus 指标收集开始,建立可观测性技术栈的指标层。随后进入 Grafana 仪表盘设置阶段,将这些信号转化为共享的运维视图。

接下来,你将构建一个日志聚合管道,以便在系统间进行集中式事件搜索。项目最后是 Alertmanager 配置,将收集到的遥测数据与可操作的通知及事件响应工作流连接起来。

适合人群

本课程适合已经完成了监控、仪表盘和集中式日志记录模块,并希望通过纯挑战形式来检验自身全栈可观测性思维的学习者。

学习成果

完成本课程后,你将能够把指标、仪表盘、日志和告警连接成一个更完整的工作流,并能够深入理解这些层级如何支持实际的事件检测与调查。

教师

labby
Labby
Labby is the LabEx teacher.