找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2693

积分

0

好友

381

主题
发表于 9 小时前 | 查看: 1| 回复: 0

那天晚上23点47分,监控告警突然爆了。

核心交换机CPU 100%。
ARP表暴涨。
广播流量飙升。
业务系统集体超时。
5分钟后,全公司断网。

当时的现象非常典型:

  • Ping延迟从1ms飙到3000ms
  • 交换机MAC表每秒刷新
  • 广播流量占比超过80%
  • 核心交换机风扇狂转
  • 所有业务系统不可用

二层环路示意图

运维群里一句话:

“是不是黑客攻击?”

但老网工都知道,这种现象只有一种可能:

二层环路。

网工的“第六感”

第一反应:看广播流量

show interface counters

结果:

  • 广播包数量异常
  • 某接入交换机端口流量异常

第二步:看MAC地址漂移

show mac-address

现象:

  • 同一个MAC地址在不同端口之间跳动
  • MAC表刷新频率极高

这几乎可以确定:

二层环路已经形成。

一根“多余的网线”

排查到接入层时,发现一个诡异现象:

某个办公区交换机,有两个端口互相连接。

也就是说:

一根网线,把交换机自己“绕”成了一个环。

交换机端口环路连接图

事情的真相是:

  • 某同事觉得网络不稳定
  • 自己插了一根网线“增强网络”
  • 结果制造了一个二层环路

拔掉那根网线的瞬间:

全网恢复。

整个过程不到3秒。

为什么一根网线能让全网崩溃?

因为二层网络有一个致命缺陷:

没有TTL。

广播帧会:

  • 在环路中无限循环
  • 不断复制
  • 指数级增长

用一句话形容:

二层环路 = 网络版“核爆”。

如果没有防环机制,会发生什么?

假设没有任何防环技术:

时间 网络状态
0 秒 环路出现
1 秒 广播流量激增
3 秒 MAC表震荡
5 秒 CPU 100%
10 秒 全网瘫痪

环路出现拓扑图

广播流量激增示意图

MAC表震荡示意图

CPU利用率100%图表

全网瘫痪拓扑图

这就是为什么:

二层环路是网络事故里最危险的一类。

为什么防环没生效?

你可能会问:

不是有STP吗?为什么还会环路?

答案很现实:

STP被关闭了

很多接入层交换机:

  • 为了“减少延迟”
  • 或“避免误阻塞”
  • 直接关闭STP

STP配置不一致

  • VLAN没有加入MSTP
  • PVST / MSTP区域配置错误
  • Root Bridge规划混乱

非标准拓扑

  • 临时交换机
  • 私接交换机
  • 桌面交换机

这些设备通常不支持STP。

二层防环技术,到底有哪些?

从网工角度看,防环技术分为3类。

基础防环:生成树(STP / RSTP / MSTP)

特点:

  • 标准协议
  • 多厂商互通
  • 支持任意拓扑

适合场景:

  • 企业园区网络

高性能防环:RRPP / ERPS

特点:

  • 收敛 < 50ms
  • 专为环网设计
  • 工业级可靠性

适合场景:

  • 工业网络
  • 城域网
  • 运营商网络

兜底防环:Loop Detection

特点:

  • 发现环路 → 强制处理
  • 适合复杂二层场景

适合场景:

  • VXLAN
  • VPLS
  • L2VPN

防环技术对比表

防环技术对比表


经历过几次环路事故后,你会发现:

防环不是“有没有STP”,而是“你有没有体系”。

一个成熟的二层防环体系通常是:

二层防环体系架构图


二层环路之所以危险,是因为它看起来很简单。

但真正的网络事故,往往不是复杂架构造成的,而是:

一根不起眼的网线。

当你理解了二层防环,你就会明白:网络稳定性,90%取决于二层设计。

想了解更多网络运维实战经验?欢迎来云栈社区交流讨论。




上一篇:通往ChatGPT:基于Transformer的关键技术演进与大模型训练方法
下一篇:Spring Boot定时任务多实例部署难题:ShedLock方案详解
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-1-27 18:15 , Processed in 0.271784 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表