云栈社区»论坛 › 技术文档「 Note & Doc 」 › Linux日志排查实战：awk、tail、grep、sed组合命令详解 ...

发回帖发新帖

3564 积分	0 好友	488 主题

发消息

Linux日志排查实战：awk、tail、grep、sed组合命令详解

发表于 2025-12-25 18:33:07 | 查看: 91| 回复: 0

在生产环境排查问题时，高效分析日志是后端开发工程师的必备技能。面对动辄数GB的日志文件，掌握正确的命令行工具组合能极大提升定位问题的效率。本文将围绕 tail、less、grep、sed、awk 这几个核心命令，结合典型业务场景，展示一套高效的日志查询与分析方法。

tail：实时监控日志动态

直接使用 cat 命令查看大日志文件容易导致终端刷屏甚至卡死。tail 命令更适合实时监控日志尾部的新增内容。

场景一：服务启动监控
在服务发布重启后，需要确认Spring Boot应用是否成功启动或有无初始化错误。

# -f 参数用于实时追踪文件尾部新增内容
tail -f logs/application.log

场景二：配合测试复现Bug
当测试人员操作并需要你即时查看后台输出时，可以限定查看的行数以避免历史日志干扰。

# 仅显示最后200行，并保持实时刷新
tail -n 200 -f logs/application.log

less：高效回溯与搜索

如果需要查看或搜索历史日志，less 是比 vim 更优的选择。它采用流式加载，打开超大文件时内存占用极低，并支持强大的向前/向后搜索功能。

场景：追溯特定订单日志
例如，需要查找订单号 ORD12345678 在约10点左右的支付失败记录。

less logs/application.log

进入 less 界面后的操作流程：

按下 Shift + G 直接跳转到文件末尾（最新日志）。
输入 ?ORD12345678 进行向上（反向）搜索。
按 n 键继续向上查找上一个匹配项。
若需查看最新日志，可按 Shift + F 进入实时追踪模式（类似 tail -f），按 Ctrl + C 退出该模式。

grep：精准内容过滤与统计

grep 是最常用的文本搜索工具，结合其丰富的参数可以应对复杂场景。

场景一：还原完整错误现场
仅看到异常类型（如 NullPointerException）往往不够，需要查看错误发生前后的上下文信息。

# -C 参数显示匹配行前后指定行数的内容
grep -C 20 "NullPointerException" logs/application.log

场景二：跨日志文件追踪请求
在微服务架构中，通过 TraceId 串联全链路日志。当日志按日期或大小滚动成多个文件时，需跨文件搜索。

# 搜索 logs 目录下所有以 app.log 开头的文件
grep "TraceId-20251219001" logs/app.log*

场景三：统计异常发生频率
快速统计特定异常在日志中出现的次数，以评估问题严重性。

# -c 参数用于计数
grep -c "RedisConnectionException" logs/application.log

场景四：排除干扰信息
过滤掉无关的 INFO 级别日志或健康检查等噪音信息，让关键错误更突出。

# -v 参数反选，即显示不包含指定关键词的行
grep -v "HealthCheck" logs/application.log

sed：按时间窗口提取日志

当需要分析事故时间段的日志，而原始日志文件过大时，可以使用 sed 精确提取特定时间范围的日志，保存为小文件。

场景：导出事故时间窗口日志
假设需要分析 2025-12-19 14:00 至 14:05 之间的日志。

# -n 与 p 命令结合，仅打印匹配模式之间的行
# 时间格式须与日志中的记录完全一致
sed -n '/2025-12-19 14:00/,/2025-12-19 14:05/p' logs/application.log > error_segment.log

执行后，error_segment.log 文件将只包含指定时间段的日志，便于下载到本地进行深度分析。

awk：结构化日志分析与统计

awk 擅长处理按列组织的结构化文本，是分析Nginx访问日志、统计接口性能的利器。

场景一：分析Nginx日志找出可疑IP
当服务疑似遭受CC攻击或恶意爬虫时，需要快速找出访问量最高的IP地址。假设日志中IP位于第一列。

# 1. 提取第一列(IP)
# 2. 排序，使相同IP相邻
# 3. 去重并计数(-c)
# 4. 按计数倒序排序(-nr)
# 5. 取前10条
awk '{print $1}' access.log | sort | uniq -c | sort -nr | head -n 10

场景二：找出慢响应接口
假设Nginx日志的最后一列($NF)记录了请求响应时间，需要找出响应时间超过1秒的请求及其URL（假设URL在第7列）。

# 判断最后一列值大于1，则打印第7列(URL)和最后一列(响应时间)
awk '$NF > 1.000 {print $7, $NF}' access.log

总结

熟练掌握 tail、less、grep、sed、awk 这组Linux运维命令的组合使用，能帮助开发者从容应对生产环境中的各种日志分析需求。从实时监控、历史回溯、精准搜索、切片提取到数据统计，每个命令都在特定场景下发挥着不可替代的作用。建议结合实际工作场景多加练习，将其内化为解决问题的肌肉记忆。

上一篇：Rust加速Python性能实战：利用PyO3编写高性能扩展模块
下一篇：舞蹈链算法实现：用C语言编写PostgreSQL UDF毫秒级求解数独

Linux, 日志分析, grep, awk, sed