课程 在 DevOps 技能树

DevOps 监控与日志管理

初级

掌握 DevOps 环境下监控与日志管理的核心要点。本综合课程涵盖使用 Prometheus 进行指标收集,Grafana 进行可视化,以及 Loki 进行日志聚合。通过实践操作,您将学会搭建监控基础设施、配置 exporter、创建仪表盘、编写告警规则以及分析系统日志——这些都是维护可靠且可观测系统的关键技能。

devops

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

欢迎来到「DevOps 监控与日志管理」课程!在当今快节奏的 DevOps 世界中,了解如何监控和记录你的系统对于维护可靠、可观测且高性能的应用程序至关重要。本综合课程将带你了解 DevOps 专业人员用来保持系统健康和有效解决问题的必备工具和实践。

无论你是 DevOps 新手,还是希望加强你的监控技能,本课程都将为你提供一次亲手实践的监控与日志管理之旅。你将使用行业标准的工具,如 Prometheus、Grafana 和 Loki,学习从基本安装到高级配置和告警的全部内容。

通过 9 个实践 Lab,你将构建一个完整的监控堆栈,能够跟踪系统指标、可视化数据、聚合日志并对潜在问题发出告警。每个 Lab 都建立在前一个 Lab 的基础上,让你真实地了解这些工具在 DevOps 环境中是如何协同工作的。

你将学到什么

在本课程结束时,你将能够:

  • 安装和配置 Prometheus:设置 Prometheus 进行指标收集,理解配置文件,并管理服务生命周期
  • 部署 Node Exporter:监控系统级指标,如 CPU、内存、磁盘和网络使用情况
  • 精通 PromQL:编写查询以从你的指标数据中提取有意义的见解
  • 安装和配置 Grafana:创建精美的仪表盘来可视化你的监控数据
  • 设置 Loki:部署一个日志聚合系统以实现集中式日志记录
  • 配置 Promtail:从各种来源收集日志并将其发送到 Loki
  • 构建监控仪表盘:使用 PromQL 查询在 Grafana 中创建自定义可视化
  • 实现告警:在 Prometheus 中编写告警规则,以便在系统出现问题时收到通知
  • 使用 LogQL 查询日志:使用 Loki 的查询语言搜索和分析日志

为什么这门课程非常适合你

  • 实践学习:9 个实践 Lab,从零开始构建真实的监控基础设施
  • 行业标准工具:学习 Prometheus、Grafana 和 Loki——大公司也在使用的工具
  • 循序渐进的难度:从基本安装开始,逐步深入到高级配置
  • 基于 Docker:所有 Lab 都在 Docker 容器中运行——无需复杂的设置
  • 即时反馈:在你一步步构建的过程中,亲眼看到你的监控堆栈焕发生机
  • 真实的 DevOps 技能:学习在生产环境中使用的完全相同的监控实践
  • 全面的堆栈覆盖:从指标收集到日志聚合再到可视化
  • 故障排除重点:了解如何诊断和解决常见的系统问题
  • 为职业生涯做好准备:这些技能对于 DevOps、SRE 和基础设施岗位需求旺盛

教师

labby
Labby
Labby is the LabEx teacher.