找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3470

积分

0

好友

476

主题
发表于 10 小时前 | 查看: 3| 回复: 0

2026年3月1日,伊朗无人机击中了AWS位于阿联酋与巴林的数据中心。这很可能是公开报道中,首次有大型云厂商的数据中心因军事打击而瘫痪。曾经,很多人觉得战争离软件工程很遥远,如今看来,这层隔膜可能只是一扇脆弱的机柜门。

到底发生了什么?

时间回到2026年3月1日,中东冲突升级之际,伊朗对阿联酋和巴林境内的多个目标实施了无人机与导弹打击,作为对美国资产的报复行动的一部分。

在这波打击中,AWS位于上述两国的数据中心被无人机直接命中。这次的情况并非我们熟知的断电、光缆被挖或空调故障,而是 无人机物理命中了数据中心建筑本身,由此引发了火灾和结构性损坏。

AWS数据中心遭无人机袭击后起火场景示意图

这很可能成为 公开报道中第一次超大规模云服务商的数据中心因军事行动而物理瘫痪 的案例。

事件发生后,AWS在官方状态页上的措辞起初颇为遮掩,仅提到“有 不明物体 撞击数据中心,产生火花和火焰”。直到3月3日凌晨,AWS才正式确认:袭击来自无人机打击(drone strikes)。

打击面有多广?

首先,我们看看AWS在中东地区的“家底”。彼时,AWS在中东共有3个投入运营的 Region,总计 9个可用区

AWS中东地区可用区分布情况表格

那么,这次打击具体造成了何种影响?

AWS中东地区受打击可用区详情表

结果是,9个AZ中有3个陷入瘫痪,这意味着中东地区 33%的可用区 失效。其中阿联酋区域损失最为惨重,3个AZ中2个失能,精心设计的跨AZ高可用架构在无人机面前近乎失效。以色列区域则在公开通报中未见直接影响。

服务影响有多深?

  • 阿联酋区域38项AWS服务 受到影响,核心服务如EC2、Lambda、EKS、VPC、RDS、CloudFormation、S3等几乎全线中断。
  • 巴林区域:情况更为严峻,46项AWS服务 出现故障,主要原因是电力和网络连接中断。

综合两个区域的受损情况,影响可大致分级如下:

AWS服务受影响程度分级统计表

(注:上表分级统计口径存在重叠,数据不能简单相加。)

区域内的客户首当其冲。已有报道指出,Snowflake在中东的部署因此次AWS故障而中断,部分本地企业也报告了业务中断问题。

而AWS官方的应对建议则显得史无前例——他们建议受影响客户“立即从远程备份恢复到其他AWS区域,理想情况下是欧洲区域”。这种近乎“赶紧撤离”的建议,相当于官方承认:短期内恢复已无指望。

截至3月3日,被无人机直接命中的 mec1-az2 可用区依然处于 物理离线 状态。由于消防和安全部门尚未批准工程师重新进入建筑,修复工作无从谈起。

AWS服务故障排查文档截图

AWS巴林区域多项服务故障分析架构图

AI 服务全线波动?

就在AWS中东数据中心遇袭的同一个周末,全球主要的AI服务几乎都出现了不同程度的波动:

  • Claude / Claude Code 在3月2日出现全球性大面积故障,用户频繁遇到“Claude will return soon”提示和HTTP 529过载错误。Anthropic状态页显示故障涉及登录/会话路径及部分API异常。
    • 现有公开信息不足以直接证明此故障由AWS中东事件导致。
  • Gemini / GPT 同期也出现服务波动。虽然现有信息无法确定其与AWS事件的直接因果,但推断可能是由Claude故障引发的级联影响。

总而言之,对于依赖AI服务的开发者和用户而言,那个周末并不平静。

云计算的阿喀琉斯之踵

回顾整起事件,技术层面的讨论空间其实不大——面对物理层面的毁灭性打击,任何软件架构都无能为力。多AZ、多Region、自动故障转移,在导弹和无人机面前都显得脆弱不堪。

这件事真正值得我们深思的,是另一个维度:数据中心的选址,从此多了一个全新的、沉重的评估变量——它是否会成为军事打击的目标。 以往云厂商选址,考量的是电价、网络、气候、政策与人才。如今,“地缘政治风险”与“军事打击概率”恐怕要正式写入选址评估报告了。

值得一提的是,AWS的多Region架构在此次事件中的表现基本符合预期——区域间的故障隔离确实发挥了作用。全局控制平面(如IAM、CloudFront、Route 53)均部署在美国本土,中东Region并未承载这些全局服务。因此,尽管中东区域遭受重创,但全球其他地区的AWS客户几乎未受影响。

这恰恰揭示了一个朴素的道理:真正的业务容灾,不应止步于同城双活或同Region跨AZ,而必须考虑跨Region、甚至跨云的方案。 如果你的业务深度依赖某个特定Region,那么当该Region因任何原因(无论是自然灾害、人为失误还是军事打击)宕机时,业务将面临巨大风险。对于依赖中东AWS区域的企业而言,这次事件无疑是一次代价高昂的教训。

尾声

过去几十年,科技行业存在一个隐含的默认假设:数据中心属于“民用关键基础设施”,不会成为军事打击的标的。这个假设在2026年3月1日,被无人机的爆炸彻底粉碎。

未来的云架构评审会上,可能会多出这样一个看似荒诞却无比现实的灵魂拷问:

“如果托管这个服务的整个Region被炸了,我们的业务怎么办?”

请不要觉得可笑,这已经不再是一个假想问题。毕竟,现实中的无人机,就是瞄准了AWS的数据中心飞去的。有时候,自己租用小IDC的几台服务器反而更“安全”——谁会特意去炸它呢?这起事件也引发了 云栈社区 内关于基础设施云原生/IaaS架构韧性以及运维团队如何应对极端场景的热烈讨论。在追求云计算便利与效率的同时,如何平衡其固有的集中性风险,成为了每个技术决策者必须面对的课题。

参考文献

[1] AWS Health Dashboard Status: https://status.aws.amazon.com/
[2] AWS Health Dashboard RSS: https://status.aws.amazon.com/rss/all.rss
[3] AWS says drones hit two of its datacenters in UAE - The Register: _https://www.theregister.com/2026/03/02/amazon_outages_middle_east/_
[4] Two AWS Middle East availability zones down - Computing.co.uk: https://www.computing.co.uk/news/2026/two-aws-middle-east-availability-zones-down-after-datacentre-impacted-by-objects
[5] AWS UAE suffers AZ outage - Data Center Dynamics: https://www.datacenterdynamics.com/en/news/aws-uae-outage-after-objects-struck-the-data-center-cause-fire-amid-iran-attacks/
[6] AWS Middle East Outage - Data Center Knowledge: https://www.datacenterknowledge.com/outages/aws-middle-east-outage-after-data-center-hit-by-unidentified-objects
[7] Anthropic Status: https://status.claude.com/
[8] OpenAI Status: https://status.openai.com/




上一篇:PostgreSQL数据库技术文章合辑:行业洞察、国产替代与PG生态全解析
下一篇:Claude全球服务中断技术复盘:流量洪峰还是中东导弹袭击?
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-4 20:53 , Processed in 0.390695 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表