云栈社区»论坛 › 开发者广场「Dev Plaza」 › 2026年3月第三周AI行业盘点：万亿美元订单与Agent时代全面到来 ...

5826 积分	0 好友	768 主题

发消息

2026年3月第三周AI行业盘点：万亿美元订单与Agent时代全面到来

发表于 2026-3-24 08:39:32 | 查看: 135| 回复: 0

2026年3月第三周（3月17日至23日），可能是今年AI行业信息密度最高的一周。从万亿美元硬件订单到硅谷产品的“套壳”风波，再到中国模型的匿名霸榜，十余条重磅新闻接连引爆。一个清晰的信号浮出水面：AI正在从“聊天工具”全面切换到“自主Agent”。

2026年3月第三周AI行业热点速览

一周大事件时间线

先通过一张总览图，快速定位本周的核心事件：

2026年3月AI大事件时间线图表

信息量巨大，下面我们逐一拆解。

NVIDIA GTC 2026：构建万亿美元的AI硬件帝国

Vera Rubin 平台发布

3月16日，GTC 2026在圣何塞开幕。黄仁勋的主题演讲再次刷新了行业对AI基础设施规模的认知。

Vera Rubin是Blackwell之后的下一代AI计算平台，核心是 NVL72机架 ——一个集成了72颗Rubin GPU、36颗Vera CPU（ARM架构）和超过130万个组件的系统，通过NVLink 6高速互联。完整的Vera Rubin POD由40个这样的机架组成，共1152颗GPU，总算力达60 exaFLOPS。

关键性能指标：

训练性能较Blackwell提升 14倍
每瓦推理性能提升 110倍
预计2026年下半年通过Azure和Google Cloud交付

黄仁勋同时将Blackwell + Vera Rubin的合计采购订单预期从5000亿美元大幅上调至 1万亿美元。

Groq 3 LPU：专用推理芯片首秀

另一个重头戏是 Groq 3 LPU —— NVIDIA在2025年底收购Groq后的首款芯片。这是一颗基于SRAM的推理加速器：

每颗芯片512MB片上SRAM
内存带宽150 TB/s
三星4nm工艺
LPX机架可容纳256颗LPU

核心卖点：与NVL72配合使用时，每光瓦推理吞吐量提升135倍。这是NVIDIA首次在其平台中加入专用推理硬件，信号明确——推理（inference）已经和训练（training）同等重要。

软件生态：NemoClaw与Nemotron联盟

硬件之外，软件生态布局同样关键：

NemoClaw：面向企业的OpenClaw安全部署栈。黄仁勋称OpenClaw为“个人AI的操作系统”，NemoClaw则让企业能安全地大规模部署它。

Nemotron Coalition：由Mistral AI、Perplexity、Cursor、LangChain等参与的开放模型联盟，将在DGX Cloud上共同开发开源前沿模型。

Nemotron 3 Super：1200亿参数、120亿活跃的混合Mamba-Transformer MoE模型，在SWE-Bench Verified上达到60.47%——开源模型第一。

NVIDIA Vera Rubin平台与Groq 3 LPU架构全景图

看法：NVIDIA的战略已从“卖GPU”进化为“卖AI全栈平台”。Groq 3 LPU的加入补齐了推理拼图，而Nemotron Coalition则将生态伙伴深度绑定在DGX Cloud上，软硬件闭环愈发紧密。

OpenAI：GPT-5.4轻量家族与收购Astral

GPT-5.4 mini 和 nano

3月17日，OpenAI发布了GPT-5.4系列的两款轻量模型：

GPT-5.4 mini：面向免费和Go用户通过“Thinking”模式提供，在SWE-Bench Pro等基准上接近完整版GPT-5.4的95%水平，速度快2倍以上。

GPT-5.4 nano：最小最便宜的版本，API定价1.25美元/百万输出token，面向高吞吐场景。

同时，ChatGPT的模型选择器被简化为三层：Instant（快速日常）、Thinking（推理优先）、Pro（最强能力），并支持自动路由。

收购Astral：掌控Python基础设施

3月19日，OpenAI宣布收购Astral，这是本周更具战略意义的动作。

Astral开发了Python社区最受欢迎的三个工具：包管理器 uv、代码检查器 Ruff、类型检查器 Ty。这三个工具基本是2025–2026年Python开发者的标配。Astral团队将加入OpenAI的 Codex团队。

背景数据：Codex周活跃用户超200万，自2026年1月以来用户增长3倍、使用量增长5倍。

OpenAI承诺继续维护这些开源工具，但社区反应复杂。知名开发者Simon Willison发表长文分析担忧点，核心是：当一家AI公司控制了编程语言的核心工具链，开源社区的独立性如何保证？

IPO准备与规模扩张

本周还有多条关于OpenAI扩张的消息：

最新估值 8400亿美元（融资1100亿：亚马逊500亿、软银300亿、NVIDIA 300亿）
ChatGPT周活跃用户超 9亿，付费订阅 5000万
计划年底前员工从4500人扩至 8000人
预计2026年Q4启动IPO

看法：收购Astral是OpenAI从“AI模型公司”向“AI开发者平台”转型的关键一步。深度整合到开发者工作流中，比任何API定价战都更具战略价值。不过，社区对Python生态中立性的担忧确实值得关注。

Anthropic：Claude Code Channels与五角大楼伦理之争

Claude Code Channels：将AI编程融入聊天应用

3月20日，Anthropic发布了 Claude Code Channels —— 这可能是本周最具想象力的产品。

核心思路很简单：把Claude Code连接到Discord和Telegram。用户可以在手机上通过聊天应用直接发送编程指令，实现异步自主编程。无需打开IDE，你在地铁上发条消息，到公司时代码可能已经写好了。

技术上，它基于MCP（Model Context Protocol）协议构建，通过 --channels 标志启动后，Claude Code作为轮询服务运行在持久化服务器上。VentureBeat直接称其为“OpenClaw杀手”。

此外，Claude Code在3月还更新了：

按键说话语音模式（/voice，支持15+语言）
/loop 循环监控命令
100万token上下文窗口 全面开放
新的MCP引导交互功能

对阵五角大楼：AI伦理红线之争

另一条战线是Anthropic与美国国防部的法律对峙。

五角大楼将Anthropic列为“供应链风险”——原因是公司拒绝让Claude被不受限制地用于自主武器和大规模监控。3月18日国防部提交反驳文件，3月20日Anthropic回击，声称政府的论据基于“技术误解”。

有趣的是，微软、Google和OpenAI的员工（包括Google首席科学家Jeff Dean）都提交了支持Anthropic的法庭简报。CNN报道这场争端反而提升了Anthropic的品牌形象——员工留存率80%、offer接受率88%。

听证会定于3月24日在旧金山举行。

看法：Claude Code Channels验证了“AI编程不一定要发生在IDE里”这个假设。五角大楼事件则可能成为AI行业安全伦理的标志性案例，其走向值得所有开发者和从业者关注。

小米MiMo-V2：手机厂商的万亿参数“猎人”

匿名测试，意外霸榜

本周中国AI最引人注目的新闻来自小米。

3月11日，一个名为“Hunter Alpha”的匿名模型出现在OpenRouter平台，一周内消耗超1万亿token，多日霸榜第一。全球开发者都在猜测——这是DeepSeek V4吗？

3月18日至19日，路透社确认：不是DeepSeek V4，而是 小米MiMo-V2-Pro。

核心参数与市场定位

MiMo-V2-Pro的参数相当亮眼：

总参数 1万亿，每次推理激活 420亿
MoE架构 + Hybrid Attention（7:1比率）+ 多Token预测
100万token上下文窗口
全球排名第8，中国排名第2（仅次于智谱GLM-5）
编程/Agent能力接近Claude Opus 4.6，整体超过Claude Sonnet 4.6
定价3美元/百万输出token——约为Claude Opus 4.6的五分之一

同期还发布了MiMo-V2-Omni（全模态Agent模型）和MiMo-V2-TTS（支持粤语、四川话等方言的语音合成）。

该项目由前DeepSeek核心研究员 罗福莉 领衔。雷军宣布小米2026年AI研发与资本开支将超过 1600亿元人民币。

看法：小米这波操作颇为聪明——匿名测试先让市场验证产品力，再揭面收获最大关注度。“被误认为DeepSeek V4”本身就是最好的背书。更深层的信号是：中国AI竞争已不只是互联网公司的游戏，硬件厂商正凭借资金和工程能力强势入场。

Cursor“套壳”Kimi K2.5：中国模型的硅谷征途

事件始末与戏剧性反转

这是本周最具戏剧性的故事。

3月20日，估值293亿美元的AI编程工具Cursor发布“Composer 2”，宣称采用自研模型。数小时内，开发者@fynnso发现模型ID写着 kimi-k2p5-rl-0317-s515-fast——直指月之暗面的Kimi K2.5。

Elon Musk亲自评论确认了这一点。月之暗面预训练负责人杜玉伦公开指控Cursor违反许可协议（帖子后来删除）。

事情很快反转：

Kimi官方发布祝贺声明，确认Cursor通过 Fireworks AI的授权商业协议 获取K2.5
Cursor承认K2.5是基础（约占25%算力），75%来自自行的继续预训练+强化学习
Composer 2在内部评测中得分 61.3，超过Claude Opus 4.6的58.2

更深层的行业意义

Kimi K2.5于1月27日发布，20天内收入即超过2025全年。Stripe数据显示其订阅量环比增长 8280%。目前月之暗面正以1800亿美元估值进行100亿美元新融资，阿里和腾讯均参与。

Kimi团队本周还发表了“Attention Residuals”论文——提出替代Transformer残差连接的方案，训练效率提升约25%。论文联合作者中包括一名 17岁的深圳高中生。Andrej Karpathy和前OpenAI VP Jerry Tworek均给予高度评价。

看法：中国开源模型正在成为硅谷产品的底层基础设施。 这句话放在一年前可能令人难以置信，但Kimi K2.5驱动着全球最火的AI编程工具——这个事实比任何基准测试都更有说服力。同时，模型供应链的透明度正成为新的行业议题。

腾讯AI重组：AI Lab解散，27岁首席科学家接棒

3月20日，腾讯正式解散运营10年的AI Lab，全部人员并入 混元（Hunyuan）团队。新团队由27岁的前OpenAI研究员 姚顺雨 领导，直接向总裁刘炽平汇报。

几个关键数字：

2025年总收入 7518亿元（+14%）
2025年混元+元宝AI投入约1800亿元
2026年AI投入承诺 翻倍至3600亿以上
资本开支792亿元、研发费用857.5亿元均创新高
元宝App月活超 1亿
混元3.0确认将于4月发布

另外，DeepSeek核心成员郭大亚据报已离开，加入字节跳动Seed团队。

看法：腾讯这次重组力度很大。将独立的AI Lab并入产品线（混元），说明腾讯要的不是论文产出，而是AI产品的快速落地。27岁的首席科学家也打破了传统——AI行业的竞争已经快到不能单纯依靠论资排辈了。

全球AI生态速览：Mistral、Midjourney与白宫立法

Mistral Small 4：高效的MoE新标杆

Mistral AI在GTC期间发布了 Mistral Small 4：

128个专家、每token激活4个的MoE架构
总参数1190亿，活跃参数仅 60亿
25.6万token上下文窗口
首次统一了推理（Magistral）、多模态（Pixtral）和Agent编程（Devstral）三大能力
延迟降低40%，每秒请求量提升3倍
Apache 2.0 开源

同时发布的 Mistral Forge 是一个企业定制平台，支持在私有数据上进行预训练、微调和强化学习。

Midjourney V8 Alpha：性能大幅跃升

Midjourney V8 Alpha是V5以来最大的升级：

生成速度 提升15倍
原生 2K分辨率 输出
文字渲染准确度大幅提升
复杂构图的空间、光照、纹理遵循度显著增强
新增 --q 4 质量模式
采用全新代码库和GPU基础设施

目前仅在 alpha.midjourney.com 可用。

白宫发布AI立法框架

3月20日，白宫发布 国家AI立法框架，七大支柱包括保护儿童、社区安全、知识产权、反审查、创新、劳动力、以及联邦法律取代各州AI法律。

核心立场：反对设定开放式AI责任，反对创建新的联邦AI监管机构，主张行业自律。该框架已遭50多位共和党议员和AI监管组织反对。

同期，欧盟理事会同意将AI法案高风险系统规则推迟最多16个月执行。美国司法部指控三人涉嫌将AI GPU服务器非法转运至中国。

开发者生态变局：MCP协议与AI IDE竞争

MCP协议成为事实标准

MCP（Model Context Protocol）由Anthropic于2024年11月创建，2025年12月捐赠给Linux基金会的Agentic AI Foundation。

截至2026年3月：

SDK月下载量超 9700万次
活跃公共MCP服务器超 1万个
被ChatGPT、Cursor、Claude Code、Windsurf、Codex CLI、VS Code全部支持
配套A2A协议形成三层架构：MCP（工具层）→ A2A（Agent层）→ WebMCP（Web访问层）

AI IDE竞争格局更新

2026年3月AI IDE排名：

Windsurf：Arena Mode + 5路并行Agent
Google Antigravity：免费Agent优先IDE
Cursor 2.0：Composer模型4倍加速、8路并行
Claude Code：终端优先、SWE-bench 80.9%
OpenAI Codex：重返前五

一个惊人的数字：92%的美国开发者 每日使用AI编程工具，41–46%的代码 现在由AI生成。

OpenClaw生态持续膨胀

OpenClaw的GitHub Star数突破 21万，成为GitHub史上增长最快的项目。它支持WhatsApp、Telegram、Slack等全渠道，社区已构建5700+技能。创始人Peter Steinberger已加入OpenAI，项目正在向开源基金会过渡。

竞争格局一览

2026年3月第三周中美AI模型竞争格局对比图

其他值得关注的动态

字节豆包 内测AI购物功能（App内直接浏览下单），2月MAU 3.15亿（+87%），位居中国第一。
阿里通义 App 2月MAU从3100万暴增至 2.03亿（+553%），阿里成立ATH事业群将其提升至一级BU。
MiniMax 发布全球首份大模型公司财报：2025年收入7900万美元（+159%），2月ARR突破1.5亿美元。
DeepSeek V4 截至3月23日仍未正式发布，多个预期窗口已过。
行业交易：Meta与Nebius签署270亿美元AI基础设施协议、IBM完成收购Confluent、Accenture收购Faculty。
AI安全融资：Xbow获1.2亿美元融资（估值超10亿）、Oasis Security获1.2亿美元、AMI Labs获10.3亿美元种子轮（欧洲史上最大）。

总结：Agent时代全面到来

回顾这一周，一个共同主线清晰而明确：AI正在从“回答问题”全面转向“执行任务”。

每一家主要公司的核心发布都围绕Agent能力展开——NVIDIA的NemoClaw、OpenAI的Codex与Astral整合、Anthropic的Claude Code Channels、小米的MiMo Agent评测领先。行业基准也在从传统的MMLU、HumanEval转向Agent导向的PinchBench、ClawEval。

中国AI力量本周展现了前所未有的影响力：小米以万亿参数模型和高性价比强势入场，Kimi K2.5成为硅谷顶级编程工具的底层，腾讯抛出3600亿AI投入承诺。中美顶级模型性能差距已从7个月缩短至约3个月，而在成本效率上中国模型已全面领先。

对开发者而言，现在面对的不再是“是否使用AI”的选择，而是“如何在多模型、多Agent、多协议的生态中构建最优工作流”。MCP+A2A协议栈的标准化、AI IDE的激烈竞争、Agent框架的快速迭代——这些正在重塑软件开发的每一个环节。

这是新范式确立的关键一周。

上一篇：揭秘AI推理拐点：专访英伟达&Google科学家，拆解硬件架构演进
下一篇：深度维度Softmax注意力：Kimi Attention Residuals如何替代残差连接并在48B MoE模型上实现GPQA-Diamond +7.5

NVIDIA, 大语言模型, 人工智能代理, 小米, 人工智能行业