Kafka Producer 的所有问题,其根源在于四个核心机制。

简单来说,遇到 Kafka Producer 故障,本质上是系统在 可靠性、吞吐量和缓冲能力 三者之间寻求平衡时出现的失衡问题。
一、一张 Kafka Producer 故障排查决策图
当你遇到问题时,可以遵循以下流程图进行快速定位和解决。
① 消息丢失?

② 消息重复?

③ TPS 上不去?

④ Producer 卡死 / send 阻塞?

⑤ 延迟突然升高?

二、一句话记住 Producer 排查逻辑
为了便于记忆,你可以将核心问题与关键配置直接关联:
- 丢消息 → 检查并调整
acks 参数
- 重复消息 → 检查并启用
idempotence (幂等性)
- TPS低 → 优化
batch.size 和 linger.ms
- 卡死 → 检查并增大
buffer.memory
掌握这套排查逻辑,能帮助你在复杂的 分布式系统 故障面前快速定位问题根源。如果你希望更系统地学习这类性能调优和故障排查的经验,可以到 云栈社区 的 运维 & 测试 板块,与其他开发者交流更多实战案例。
|