集中式日志管理
学习如何利用 Loki、Promtail、LogQL 以及从日志中提取的指标,构建一套集中式的日志工作流。本课程将介绍收集多系统日志、进行集中查询,并将日志数据转化为更有价值的运维信号所需的实用技能。
为什么这很重要
当日志能够跨服务进行聚合、搜索和关联时,其价值将大幅提升。集中式日志管理有助于运维人员更快地调查事故、发现单台主机上难以察觉的模式,并将应用程序事件与更广泛的运维行为联系起来。这是现代可观测性实践的核心组成部分。
你将学到什么
- 搭建 Loki 作为集中式日志存储与查询服务。
- 使用 Promtail 将日志从源系统传输到日志堆栈中。
- 使用 LogQL 查询日志,以隔离特定事件和模式。
- 从日志中派生指标,用于更广泛的运维分析。
- 通过优化标签策略提高日志的实用性。
- 在「错误激增检测」挑战中应用这些技能。
课程路线图
课程首先从搭建 Loki 开始,为你建立一个日志的集中存储目的地。随后进入 Promtail 的学习,它负责处理从源系统到聚合管道的日志传输。
接下来,课程将介绍用于查询和过滤集中式日志的 LogQL。之后,你将学习如何处理从日志中派生的指标,这将有助于弥合原始事件数据与高层级运维信号之间的鸿沟。
最后的实验重点在于更智能的标签管理,以确保日志在大规模环境下依然具备可搜索性和意义。课程最后是「错误激增检测」挑战,你将在一个真实的观测场景中综合运用日志摄取、查询、标签化和信号提取等技能。
课程目标人群
本课程适合 Linux 学习者和可观测性从业者,旨在帮助他们从主机本地的日志检查转向集中式分析和跨系统调查。
学习成果
完成本课程后,你将能够构建基于 Loki 的基础日志管道,更精确地查询集中式日志,从日志流中派生指标,并组织日志标签以实现更好的长期运维应用。




