云栈社区»论坛 › 回收站「 Recycle Bin 」 › AI简报 | 林俊旸谈智能体革命，OpenAI砍掉Sora，小马智行Robotax ...

发回帖发新帖

5016 积分	0 好友	713 主题

发消息

AI简报 | 林俊旸谈智能体革命，OpenAI砍掉Sora，小马智行Robotaxi用户破百万

发表于 2026-3-28 05:43:12 | 查看: 161| 回复: 0

Key Points

林俊旸称接下来AI研究重心是让模型自主行动、学会反思；
OpenAI停止视频生成服务Sora，ChatGPT电商业务定位从成交转向推荐；
Google新压缩算法导致内存股大跌5%；
月之暗面考虑香港上市；
中芯国际大幅提升产能利用率；
小马智行Robotaxi深圳单日最高车均收入达394元。

林俊旸Qwen离职后首次发声，接下来的研究重心是让模型自主行动、学会反思

3月26日，阿里巴巴Qwen技术团队前负责人林俊旸在离职后首发长文，陈述了他对接下来AI发展方向的判断：从「单纯的逻辑推演」向「为了行动而思考」转变，他将其称为「智能体式思考」（agentic thinking）。

文章核心可归纳为五个要点。

从预训练转向推理后训练： 过去AI变聪明主要靠预训练，逻辑能力更像是附带的产物。OpenAI o1和DeepSeek R1的成功证明了推理能力是可以通过后训练强化的核心本领，算力重心正向推理侧后训练偏移；
强「思考」模型与强「指令」模型之间存在数据矛盾： 前者消耗更多Token追求深度，后者追求简洁、低延迟的回复，当下的挑战在于如何让模型根据任务难度实现自适应的思考预算调节；
推理链并非越长越好： 盲目拉长推理链是浪费算力，思考应该由目标任务来塑造，即从训练单纯的模型转向训练具备目标感的智能体；
智能体式思考的本质是闭环交互： 它要求模型跳出静态逻辑推演，自主决定行动时机、处理模糊观测，并在挫败后动态修正计划；
强化学习极度依赖实时环境（如沙箱、浏览器）的反馈： 未来的竞争优势将来自于环境设计的真实度、训练与推理的深度集成，以及针对「奖励作弊」等复杂风险的防御能力，从而实现更具可用性的AI。

参考链接
https://x.com/justinlin610/status/2037116325210829168?s=46

OpenAI停止视频生成服务Sora，ChatGPT电商业务定位从成交转向推荐

3月24日，OpenAI宣布全面关停旗下视频生成应用Sora及开发者API，此前其与迪士尼拟定的10亿美元授权与投资协议也随之宣告终止。此次战略调整主要源于Sora高昂的算力消耗严重挤压了其他业务线资源。面对与Google Gemini的激烈竞争，管理层决定削减算力密集的支线任务，将研发重心与计算资源集中于Codex及即将推出的ChatGPT桌面「超级应用」等核心产品上。

同日，OpenAI宣布调整ChatGPT的电子商务战略，正式剥离前期推出的「即时结账」（Instant Checkout）独立功能，将购物功能的定位转型为「商品发现」。

由于直接购买功能的灵活性与转化率未达预期，升级后的ChatGPT将基于与Stripe合作的代理商业协议（ACP），专注于为用户提供直观的商品多维比价、视觉浏览与信息检索服务。消费者完成购买决策后，实际支付环节将路由至商家自有平台完成。目前，Shopify等平台已完成目录数据的接入，沃尔玛等零售巨头也正在推出支持账户链接与支付的ChatGPT定制应用。

据CNBC报道，OpenAI首席财务官莎拉·弗莱尔（Sarah Friar）透露，OpenAI正在准备潜在的IPO，公司在2月的1100亿美元融资的基础上，近期又额外筹集了100亿美元。

参考链接
https://www.theverge.com/ai-artificial-intelligence/899850/openai-sora-ai-chatgpt
https://openai.com/index/powering-product-discovery-in-chatgpt/

Google新压缩算法让动态内存占用降低至1/6

3月25日，Google推出了一项名为TurboQuant的AI内存压缩算法，该算法旨在解决大模型在处理长文本时「短期记忆」大量消耗显存的痛点，降低模型部署成本。

像Gemini、ChatGPT这样的大型语言模型在生成长篇对话时，需要不断把之前的聊天记录存入一个名为「KV缓存」（键值缓存）的短期记忆库中。随着上下文的增加，这个记忆库会成倍膨胀，迅速消耗昂贵的GPU显存。

传统的压缩方法存在一个两难： 它要么会导致整体失真度过高，要么会干扰大模型在计算词与词之间关联度时的核心运算，从而导致AI丢失上下文。

TurboQuant通过「两阶段」策略尝试解决。第一步， 它先让数据分布变得均匀且有规律，然后再压缩，确保整体失真率降到最低。第二步， 算法提取第一部分的计算误差并对其进行二次补偿。实验证明，TurboQuant能在不损失准确率的前提下，将内存占用量压缩到原来的1/6。

该研究在资本市场引发了剧烈震荡，截至目前，全球第二大存储芯片制造商SK海力士股价下跌5.7%，三星电子下跌5.9%，美光科技（Micron）下跌5.1%，闪迪（SanDisk）下跌9.8%。

不过多位行业专家认为市场的抛售是对技术的严重误读。TurboQuant仅针对存储上下文的动态消耗，无法压缩模型本身的静态权重。因此，数据中心对高带宽内存（HBM）等存储硬件的刚性需求依然稳固。

参考链接
https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/

月之暗面考虑在香港上市

3月26日有消息称，月之暗面正考虑在香港启动IPO，目前已与中金公司、高盛就相关事宜展开初步洽谈。因相关信息未公开，具体上市时间尚未确定，审批流程仍在推进中。针对上述消息，月之暗面与高盛均未予置评，中金公司则未回应。

月之暗面的资方背景中，互联网巨头与顶级VC占资方的绝大多数，包括阿里巴巴、腾讯、美团、小红书，以及红杉、IDG、真格等等。

自去年下半年以来，公司加快了融资节奏。2025年年底完成5亿美元C轮融资，今年2月再获超7亿美元融资，目前正洽谈新一轮10亿美元融资，届时估值将达到180亿美元。

参考链接
https://www.bloomberg.com/news/articles/2026-03-26/moonshot-is-said-to-consider-hong-kong-ipo-as-ai-stocks-flourish

中芯国际大幅提升产能利用率，对冲折旧压力，实现毛利率不降反增

3月26日，中芯国际发布2025年年度财报。财报显示：2025全年营业收入673.23亿元，同比增长16.5%；归母净利润50.41亿元，同比增长36.3%；扣非净利润41.24亿元，同比增长55.9%。在折旧大幅增加的背景下，公司毛利率依然增长了3%，为21.0%。按销售额计，中芯国际位居全球纯晶圆代工第二、中国内地第一。

公司营收增长主要源于晶圆销量提升，全年晶圆销售量（按8英寸计）达969.7万片，同比增长20.9%；平均售价6476元，同比略降2.5%。产能方面，晶圆月产能提升至105.9万片，产能利用率达93.5%，同比提升8个百分点。

从应用领域看， 智能手机、电脑与平板、消费电子、互联与可穿戴、工业与汽车的收入占比，分别为23%、15%、43%、8%、11%，其中消费电子占比最高，但工业与汽车增长最快，超60%，智能手机、电脑与平板等传统终端业务的占比有所下滑。

从晶圆尺寸看， 多用于成熟工艺的8英寸晶圆的收入占23%，通常承载更先进制程的12英寸晶圆的收入占比达77%。

在2月的业绩说明会上，中芯国际联席CEO赵海军表示，2025年全年实际新增了约5万片/月的12英寸产能，并预计到2026年年底新增4万片/月的12英寸产能，以承接旺盛的AI芯片需求。

参考链接
http://www.sse.com.cn/disclosure/listedinfo/announcement/c/new/2026-03-27/688981_20260327_VVHL.pdf
https://www.smics.com/site/news_read/3714

小马智行Robotaxi深圳单日最高车均收入达394元

3月26日，小马智行发布未经审计的2025年第四季度及全年财报。公司全年总收入6.29亿元，同比增长20%；第四季度净利润达5.28亿元，首次实现季度盈利。

分业务看：

Robotaxi业务 全年收入1.16亿元，同比增长128.6%，其中乘客车费收入增长近400%。广州、深圳实现单车盈利转正，深圳单日最高车均收入达394元。
自动驾驶卡车服务（Robotruck） 全年收入2.84亿元，同比增长0.6%。第四代自动驾驶重卡自动驾驶套件的成本较前代下降70%，设计寿命达100万公里，已实现多场景技术验证。
技术授权与应用 全年收入2.29亿元，同比增长19.7%。其中自动驾驶域控制器（ADC）全年出货量同比增长超500%，在低速无人配送、物流、人形机器人等领域需求激增。

目前，Robotaxi已成为小马智行增长核心。截至2026年3月25日，Robotaxi量产达1446辆；用户端，Robotaxi用户突破100万，规模跃升至去年同期近3倍。公司表示，计划到2026年年底将Robotaxi运营版图拓展至全球超20座城市，车队规模扩大至3000辆以上。

参考链接
https://mp.weixin.qq.com/s/B2KKY4Rilf5QJAUXNqgjzw

以上是近期人工智能与科技领域的重要动态简报。想了解更多类似的行业讯息和技术杂谈，可以持续关注我们云栈社区的更新。

-END-

上一篇：告别写代码：从Token经济学到AI Agent协作下的职场新焦虑
下一篇：OpenClaw 智能体记忆优化：使用 qmd 本地检索节省 90% Token 消耗

人工智能, 大语言模型, 自动驾驶, 芯片制造, 内存压缩