Prometheus 监控

中级

学习 Prometheus 监控。本模块涵盖安装 Prometheus、使用 Node Exporter 监控 Linux、基本 PromQL 查询、设置告警、Alertmanager 基础知识。您将通过实践操作和真实世界的挑战掌握这些必要的 Linux 技能。

devops-engineerdevopslinux

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

Prometheus 监控

学习如何部署 Prometheus,使用 Node Exporter 采集主机指标,通过 PromQL 查询时间序列数据,并配置 Prometheus 和 Alertmanager 进行告警。本课程将为你构建现代 Linux 及基础设施环境下的监控实践基础。

为什么学习本课程

优秀的运维工作依赖于对系统行为的可量化分析,而非仅仅是事后的被动排查。Prometheus 已成为基础设施和云原生环境下的标准监控平台,因为它能够采集指标、支持告警,并能直观地展示运维趋势。掌握其核心工作流程是现代可观测性实践的关键。

你将学到什么

  • 安装并验证 Prometheus 监控服务器。
  • 使用 Node Exporter 采集 Linux 主机指标。
  • 使用基础的 PromQL 表达式查询指标。
  • 配置告警规则以检测关键状态。
  • 使用 Alertmanager 更高效地处理和路由告警。
  • 在自定义监控解决方案挑战中应用这些技能。

课程路线图

课程从 Prometheus 的安装开始,帮助你搭建起监控服务器。随后进入 Node Exporter 的学习,它提供主机层面的指标,使 Linux 资源行为对 Prometheus 可见。

接下来,课程将介绍基础的 PromQL,让你能够查询并解读采集到的时间序列数据。在此之后,你将定义告警规则,并深入了解 Alertmanager 的基础知识,从而将告警处理从简单的阈值检测提升到更高水平。

课程最后是「自定义监控解决方案」挑战,你将把指标采集、查询、告警以及运维逻辑整合到一个更完整的可观测性工作流中。

适合人群

本课程适合 Linux 学习者、SRE 初学者以及 DevOps 从业者,旨在帮助他们掌握基于指标的监控方法,摆脱仅依赖临时系统检查的局限。

学习成果

学完本课程后,你将能够部署基础的 Prometheus 技术栈,采集并查询系统指标,定义实用的告警规则,并理解现代基础设施监控背后的核心工作流程。

教师

labby
Labby
Labby is the LabEx teacher.