2026年3月第三周(3月17日至23日),可能是今年AI行业信息密度最高的一周。从万亿美元硬件订单到硅谷产品的“套壳”风波,再到中国模型的匿名霸榜,十余条重磅新闻接连引爆。一个清晰的信号浮出水面:AI正在从“聊天工具”全面切换到“自主Agent”。

一周大事件时间线
先通过一张总览图,快速定位本周的核心事件:

信息量巨大,下面我们逐一拆解。
NVIDIA GTC 2026:构建万亿美元的AI硬件帝国
Vera Rubin 平台发布
3月16日,GTC 2026在圣何塞开幕。黄仁勋的主题演讲再次刷新了行业对AI基础设施规模的认知。
Vera Rubin是Blackwell之后的下一代AI计算平台,核心是 NVL72机架 ——一个集成了72颗Rubin GPU、36颗Vera CPU(ARM架构)和超过130万个组件的系统,通过NVLink 6高速互联。完整的Vera Rubin POD由40个这样的机架组成,共1152颗GPU,总算力达60 exaFLOPS。
关键性能指标:
- 训练性能较Blackwell提升 14倍
- 每瓦推理性能提升 110倍
- 预计2026年下半年通过Azure和Google Cloud交付
黄仁勋同时将Blackwell + Vera Rubin的合计采购订单预期从5000亿美元大幅上调至 1万亿美元。
Groq 3 LPU:专用推理芯片首秀
另一个重头戏是 Groq 3 LPU —— NVIDIA在2025年底收购Groq后的首款芯片。这是一颗基于SRAM的推理加速器:
- 每颗芯片512MB片上SRAM
- 内存带宽150 TB/s
- 三星4nm工艺
- LPX机架可容纳256颗LPU
核心卖点:与NVL72配合使用时,每光瓦推理吞吐量提升135倍。这是NVIDIA首次在其平台中加入专用推理硬件,信号明确——推理(inference)已经和训练(training)同等重要。
软件生态:NemoClaw与Nemotron联盟
硬件之外,软件生态布局同样关键:
NemoClaw:面向企业的OpenClaw安全部署栈。黄仁勋称OpenClaw为“个人AI的操作系统”,NemoClaw则让企业能安全地大规模部署它。
Nemotron Coalition:由Mistral AI、Perplexity、Cursor、LangChain等参与的开放模型联盟,将在DGX Cloud上共同开发开源前沿模型。
Nemotron 3 Super:1200亿参数、120亿活跃的混合Mamba-Transformer MoE模型,在SWE-Bench Verified上达到60.47%——开源模型第一。

看法:NVIDIA的战略已从“卖GPU”进化为“卖AI全栈平台”。Groq 3 LPU的加入补齐了推理拼图,而Nemotron Coalition则将生态伙伴深度绑定在DGX Cloud上,软硬件闭环愈发紧密。
OpenAI:GPT-5.4轻量家族与收购Astral
GPT-5.4 mini 和 nano
3月17日,OpenAI发布了GPT-5.4系列的两款轻量模型:
GPT-5.4 mini:面向免费和Go用户通过“Thinking”模式提供,在SWE-Bench Pro等基准上接近完整版GPT-5.4的95%水平,速度快2倍以上。
GPT-5.4 nano:最小最便宜的版本,API定价1.25美元/百万输出token,面向高吞吐场景。
同时,ChatGPT的模型选择器被简化为三层:Instant(快速日常)、Thinking(推理优先)、Pro(最强能力),并支持自动路由。
收购Astral:掌控Python基础设施
3月19日,OpenAI宣布收购Astral,这是本周更具战略意义的动作。
Astral开发了Python社区最受欢迎的三个工具:包管理器 uv、代码检查器 Ruff、类型检查器 Ty。这三个工具基本是2025–2026年Python开发者的标配。Astral团队将加入OpenAI的 Codex团队。
背景数据:Codex周活跃用户超200万,自2026年1月以来用户增长3倍、使用量增长5倍。
OpenAI承诺继续维护这些开源工具,但社区反应复杂。知名开发者Simon Willison发表长文分析担忧点,核心是:当一家AI公司控制了编程语言的核心工具链,开源社区的独立性如何保证?
IPO准备与规模扩张
本周还有多条关于OpenAI扩张的消息:
- 最新估值 8400亿美元(融资1100亿:亚马逊500亿、软银300亿、NVIDIA 300亿)
- ChatGPT周活跃用户超 9亿,付费订阅 5000万
- 计划年底前员工从4500人扩至 8000人
- 预计2026年Q4启动IPO
看法:收购Astral是OpenAI从“AI模型公司”向“AI开发者平台”转型的关键一步。深度整合到开发者工作流中,比任何API定价战都更具战略价值。不过,社区对Python生态中立性的担忧确实值得关注。
Anthropic:Claude Code Channels与五角大楼伦理之争
Claude Code Channels:将AI编程融入聊天应用
3月20日,Anthropic发布了 Claude Code Channels —— 这可能是本周最具想象力的产品。
核心思路很简单:把Claude Code连接到Discord和Telegram。用户可以在手机上通过聊天应用直接发送编程指令,实现异步自主编程。无需打开IDE,你在地铁上发条消息,到公司时代码可能已经写好了。
技术上,它基于MCP(Model Context Protocol)协议构建,通过 --channels 标志启动后,Claude Code作为轮询服务运行在持久化服务器上。VentureBeat直接称其为“OpenClaw杀手”。
此外,Claude Code在3月还更新了:
- 按键说话语音模式(
/voice,支持15+语言)
/loop 循环监控命令
- 100万token上下文窗口 全面开放
- 新的MCP引导交互功能
对阵五角大楼:AI伦理红线之争
另一条战线是Anthropic与美国国防部的法律对峙。
五角大楼将Anthropic列为“供应链风险”——原因是公司拒绝让Claude被不受限制地用于自主武器和大规模监控。3月18日国防部提交反驳文件,3月20日Anthropic回击,声称政府的论据基于“技术误解”。
有趣的是,微软、Google和OpenAI的员工(包括Google首席科学家Jeff Dean)都提交了支持Anthropic的法庭简报。CNN报道这场争端反而提升了Anthropic的品牌形象——员工留存率80%、offer接受率88%。
听证会定于3月24日在旧金山举行。
看法:Claude Code Channels验证了“AI编程不一定要发生在IDE里”这个假设。五角大楼事件则可能成为AI行业安全伦理的标志性案例,其走向值得所有开发者和从业者关注。
小米MiMo-V2:手机厂商的万亿参数“猎人”
匿名测试,意外霸榜
本周中国AI最引人注目的新闻来自小米。
3月11日,一个名为“Hunter Alpha”的匿名模型出现在OpenRouter平台,一周内消耗超1万亿token,多日霸榜第一。全球开发者都在猜测——这是DeepSeek V4吗?
3月18日至19日,路透社确认:不是DeepSeek V4,而是 小米MiMo-V2-Pro。
核心参数与市场定位
MiMo-V2-Pro的参数相当亮眼:
- 总参数 1万亿,每次推理激活 420亿
- MoE架构 + Hybrid Attention(7:1比率)+ 多Token预测
- 100万token上下文窗口
- 全球排名 第8,中国排名 第2(仅次于智谱GLM-5)
- 编程/Agent能力接近Claude Opus 4.6,整体超过Claude Sonnet 4.6
- 定价3美元/百万输出token——约为Claude Opus 4.6的五分之一
同期还发布了MiMo-V2-Omni(全模态Agent模型)和MiMo-V2-TTS(支持粤语、四川话等方言的语音合成)。
该项目由前DeepSeek核心研究员 罗福莉 领衔。雷军宣布小米2026年AI研发与资本开支将超过 1600亿元人民币。
看法:小米这波操作颇为聪明——匿名测试先让市场验证产品力,再揭面收获最大关注度。“被误认为DeepSeek V4”本身就是最好的背书。更深层的信号是:中国AI竞争已不只是互联网公司的游戏,硬件厂商正凭借资金和工程能力强势入场。
Cursor“套壳”Kimi K2.5:中国模型的硅谷征途
事件始末与戏剧性反转
这是本周最具戏剧性的故事。
3月20日,估值293亿美元的AI编程工具Cursor发布“Composer 2”,宣称采用自研模型。数小时内,开发者@fynnso发现模型ID写着 kimi-k2p5-rl-0317-s515-fast——直指月之暗面的Kimi K2.5。
Elon Musk亲自评论确认了这一点。月之暗面预训练负责人杜玉伦公开指控Cursor违反许可协议(帖子后来删除)。
事情很快反转:
- Kimi官方发布祝贺声明,确认Cursor通过 Fireworks AI的授权商业协议 获取K2.5
- Cursor承认K2.5是基础(约占25%算力),75%来自自行的继续预训练+强化学习
- Composer 2在内部评测中得分 61.3,超过Claude Opus 4.6的58.2
更深层的行业意义
Kimi K2.5于1月27日发布,20天内收入即超过2025全年。Stripe数据显示其订阅量环比增长 8280%。目前月之暗面正以1800亿美元估值进行100亿美元新融资,阿里和腾讯均参与。
Kimi团队本周还发表了“Attention Residuals”论文——提出替代Transformer残差连接的方案,训练效率提升约25%。论文联合作者中包括一名 17岁的深圳高中生。Andrej Karpathy和前OpenAI VP Jerry Tworek均给予高度评价。
看法:中国开源模型正在成为硅谷产品的底层基础设施。 这句话放在一年前可能令人难以置信,但Kimi K2.5驱动着全球最火的AI编程工具——这个事实比任何基准测试都更有说服力。同时,模型供应链的透明度正成为新的行业议题。
腾讯AI重组:AI Lab解散,27岁首席科学家接棒
3月20日,腾讯正式解散运营10年的AI Lab,全部人员并入 混元(Hunyuan)团队。新团队由27岁的前OpenAI研究员 姚顺雨 领导,直接向总裁刘炽平汇报。
几个关键数字:
- 2025年总收入 7518亿元(+14%)
- 2025年混元+元宝AI投入约1800亿元
- 2026年AI投入承诺 翻倍至3600亿以上
- 资本开支792亿元、研发费用857.5亿元均创新高
- 元宝App月活超 1亿
- 混元3.0确认将于4月发布
另外,DeepSeek核心成员郭大亚据报已离开,加入字节跳动Seed团队。
看法:腾讯这次重组力度很大。将独立的AI Lab并入产品线(混元),说明腾讯要的不是论文产出,而是AI产品的快速落地。27岁的首席科学家也打破了传统——AI行业的竞争已经快到不能单纯依靠论资排辈了。
全球AI生态速览:Mistral、Midjourney与白宫立法
Mistral Small 4:高效的MoE新标杆
Mistral AI在GTC期间发布了 Mistral Small 4:
- 128个专家、每token激活4个的MoE架构
- 总参数1190亿,活跃参数仅 60亿
- 25.6万token上下文窗口
- 首次统一了推理(Magistral)、多模态(Pixtral)和Agent编程(Devstral)三大能力
- 延迟降低40%,每秒请求量提升3倍
- Apache 2.0 开源
同时发布的 Mistral Forge 是一个企业定制平台,支持在私有数据上进行预训练、微调和强化学习。
Midjourney V8 Alpha:性能大幅跃升
Midjourney V8 Alpha是V5以来最大的升级:
- 生成速度 提升15倍
- 原生 2K分辨率 输出
- 文字渲染准确度大幅提升
- 复杂构图的空间、光照、纹理遵循度显著增强
- 新增
--q 4 质量模式
- 采用全新代码库和GPU基础设施
目前仅在 alpha.midjourney.com 可用。
白宫发布AI立法框架
3月20日,白宫发布 国家AI立法框架,七大支柱包括保护儿童、社区安全、知识产权、反审查、创新、劳动力、以及联邦法律取代各州AI法律。
核心立场:反对设定开放式AI责任,反对创建新的联邦AI监管机构,主张行业自律。该框架已遭50多位共和党议员和AI监管组织反对。
同期,欧盟理事会同意将AI法案高风险系统规则推迟最多16个月执行。美国司法部指控三人涉嫌将AI GPU服务器非法转运至中国。
开发者生态变局:MCP协议与AI IDE竞争
MCP协议成为事实标准
MCP(Model Context Protocol)由Anthropic于2024年11月创建,2025年12月捐赠给Linux基金会的Agentic AI Foundation。
截至2026年3月:
- SDK月下载量超 9700万次
- 活跃公共MCP服务器超 1万个
- 被ChatGPT、Cursor、Claude Code、Windsurf、Codex CLI、VS Code全部支持
- 配套A2A协议形成三层架构:MCP(工具层)→ A2A(Agent层)→ WebMCP(Web访问层)
AI IDE竞争格局更新
2026年3月AI IDE排名:
- Windsurf:Arena Mode + 5路并行Agent
- Google Antigravity:免费Agent优先IDE
- Cursor 2.0:Composer模型4倍加速、8路并行
- Claude Code:终端优先、SWE-bench 80.9%
- OpenAI Codex:重返前五
一个惊人的数字:92%的美国开发者 每日使用AI编程工具,41–46%的代码 现在由AI生成。
OpenClaw生态持续膨胀
OpenClaw的GitHub Star数突破 21万,成为GitHub史上增长最快的项目。它支持WhatsApp、Telegram、Slack等全渠道,社区已构建5700+技能。创始人Peter Steinberger已加入OpenAI,项目正在向开源基金会过渡。
竞争格局一览

其他值得关注的动态
- 字节豆包 内测AI购物功能(App内直接浏览下单),2月MAU 3.15亿(+87%),位居中国第一。
- 阿里通义 App 2月MAU从3100万暴增至 2.03亿(+553%),阿里成立ATH事业群将其提升至一级BU。
- MiniMax 发布全球首份大模型公司财报:2025年收入7900万美元(+159%),2月ARR突破1.5亿美元。
- DeepSeek V4 截至3月23日仍未正式发布,多个预期窗口已过。
- 行业交易:Meta与Nebius签署270亿美元AI基础设施协议、IBM完成收购Confluent、Accenture收购Faculty。
- AI安全融资:Xbow获1.2亿美元融资(估值超10亿)、Oasis Security获1.2亿美元、AMI Labs获10.3亿美元种子轮(欧洲史上最大)。
总结:Agent时代全面到来
回顾这一周,一个共同主线清晰而明确:AI正在从“回答问题”全面转向“执行任务”。
每一家主要公司的核心发布都围绕Agent能力展开——NVIDIA的NemoClaw、OpenAI的Codex与Astral整合、Anthropic的Claude Code Channels、小米的MiMo Agent评测领先。行业基准也在从传统的MMLU、HumanEval转向Agent导向的PinchBench、ClawEval。
中国AI力量本周展现了前所未有的影响力:小米以万亿参数模型和高性价比强势入场,Kimi K2.5成为硅谷顶级编程工具的底层,腾讯抛出3600亿AI投入承诺。中美顶级模型性能差距已从7个月缩短至约3个月,而在成本效率上中国模型已全面领先。
对开发者而言,现在面对的不再是“是否使用AI”的选择,而是“如何在多模型、多Agent、多协议的生态中构建最优工作流”。MCP+A2A协议栈的标准化、AI IDE的激烈竞争、Agent框架的快速迭代——这些正在重塑软件开发的每一个环节。
这是新范式确立的关键一周。