近期人工智能领域风起云涌,从基础设施到应用模型,大事件频发。为了帮助开发者与爱好者快速把握前沿动态,我们梳理了过去一周(参考时间2026年2月)内几项值得关注的重大进展与行业资讯。
一、谷歌Chrome发布WebMCP协议,AI智能体可直连网站内核
- 谷歌Chrome团队发布了WebMCP(Web模型上下文协议)。这项协议旨在让AI智能体跳过传统的人类用户界面,通过一个名为
navigator.modelContext 的新API,直接与网站的内核逻辑进行交互。
- 此举解决了传统AI智能体通过截屏识别UI元素时存在的高成本、低稳定性问题,实现了从“视觉模拟”到“逻辑直连”的技术跃迁,因此也被业界形象地称为“UI里的API”。
- 该标准由谷歌与微软联手推进。有分析认为,未来的互联网可能会分化为供人类使用的UI层和供AI智能体使用的工具层,这或许预示着“Agentic UI”时代的正式到来。
相关阅读:https://mp.weixin.qq.com/s/yHuSLujKxCWBeCsZO7kJHw
二、Runway获3.15亿美元融资,英伟达AMD联手押注世界模型
- 视频生成领域的独角兽公司Runway完成了3.15亿美元的E轮融资,公司估值达到53亿美元。此轮融资的参投方包括英伟达、AMD、Adobe等行业巨头,使其累计融资额达到8.15亿美元。
- 在最新的AI文生视频模型排行榜中,Runway的Gen-4.5位列第三,表现超越了谷歌的Veo 3、OpenAI的Sora 2 Pro等强劲对手。
- 新募集的资金将主要用于训练下一代世界模型。目前,Runway已经推出了通用世界模型GWM-1,该模型涵盖了可探索环境、对话角色和机器人操作三个变体。
相关阅读:https://mp.weixin.qq.com/s/3WMkA-RIIbvB4jp0DjHdfw
三、xAI再失两位联合创始人,创始团队过半离场
- xAI(埃隆·马斯克旗下的人工智能公司)的联合创始人Jimmy Ba和吴宇怀在48小时内相继宣布离职。至此,该公司最初的12人创始团队中已有6人离开,其中5人是在过去一年内离职的。
- 据悉,在离职前,两人的职责已被拆分并交由其他联合创始人负责。SpaceX对xAI的收购已经完成,其IPO计划预计将在未来几个月内推进。
- 近期,xAI的旗舰产品Grok频频出现怪异行为,其图像生成工具的调整也意外导致了深度伪造色情内容的泛滥。核心人才的持续流失,无疑给即将到来的IPO带来了新的挑战。
相关阅读:https://mp.weixin.qq.com/s/luO64jcekqUxhe6D9_FmeQ
四、DeepSeek或已悄悄上新模型,支持1M超长上下文窗口
- 有迹象表明,DeepSeek可能已悄悄上线了其最新模型。该模型支持高达1M token的超长上下文窗口,知识截止日期更新至2025年5月,足以一次性处理像《三体》三部曲这样体量的长篇内容。
- 目前该模型仍为纯文本模型,虽然不能直接“看懂”图片,但可以读取图片和文档中嵌入的文字信息。此外,其在 Agentic Coding(智能体编码)方面的能力据称有所提升。
- 行业风向正从单纯的大语言模型(LLM)推理向 Agentic 推理转变。Anthropic和OpenAI的最新模型都预示着,未来人类可能扮演总架构师的角色,指挥由多个AI智能体组成的“团队”来协作构建复杂软件。
相关阅读:https://mp.weixin.qq.com/s/xlFW21E2cQdZ_D2JMR-oTg
五、智谱确认Pony Alpha为GLM-5,编程能力达开源SOTA
- 智谱AI正式确认,此前在OpenRouter平台热度榜首的神秘模型“Pony Alpha”正是其新一代模型GLM-5。该模型在编程(Coding)与智能体(Agent)能力上取得了开源模型的SOTA(当前最优)表现。
- 根据社区反馈,GLM-5在真实编程场景下的使用体验已逼近Claude Opus4.5。它尤其擅长复杂的系统工程与长程智能体任务,工具调用的准确率极高。
- 有开发者实测,使用该模型配合Claude Code运行一个项目,在大约2小时内生成了约170KB的纯JavaScript代码。目前,该模型已在智谱的chat.z.ai平台上线。
相关阅读:https://mp.weixin.qq.com/s/xxsUATPSlefAKaOIYODknw
六、蚂蚁开源全模态模型,首创人声配乐音效一次生成
- 蚂蚁集团开源了其全模态大模型Ming-flash-omni 2.0。这是业界首个能够实现在同一音轨中,同时生成语音、环境音效与背景音乐的全场景音频统一生成模型。
- 该模型在视觉语言理解、语音可控生成、图像编辑等多个方面表现突出。据称,其多项核心能力超越了Gemini 2.5 Pro和Qwen3-Omni-30B-A3B-Instruct等知名模型。
- 模型采用统一架构实现了多模态的深度融合,支持零样本语音克隆和精细的属性控制。目前,该模型已在 HuggingFace 等平台开源,供社区研究和应用。
相关阅读:https://mp.weixin.qq.com/s/od9p0I7Pr428Dn5L7ty4bQ
七、讯飞发布星火X2大模型,基于全国产算力训练对标前沿
- 科大讯飞发布了基于全国产算力集群训练而成的星火X2大模型。官方表示,其整体能力已实现对国际顶尖水平的对标,在数学、推理、智能体等核心能力上可媲美国际最优模型。
- 星火X2采用了2930亿参数的MoE稀疏架构,推理性能相比前代X1.5提升了50%。其支持130多种多语言能力持续提升,尤其在拉美、东盟等重点语种上保持业界领先。
- 在行业应用方面,其医疗能力已率先通过权威评测;教育场景实现了错因贯穿的个性化学习;汽车座舱的模糊意图交互能力也从“不可用”提升至“基本好用”水平。
相关阅读:https://mp.weixin.qq.com/s/C8pezir4IRX46OSy29p_Sg
八、美团龙猫发布深度研究智能体,量身定制吃喝玩乐攻略
- 美团旗下的AI助手“龙猫LongCat”发布了全新的“深度研究”功能。该功能在BrowseComp评测中达到了73.1分,逼近顶级闭源模型水平,并支持最多400轮交互与256K上下文。
- 该能力依托美团丰富的本地生活原生数据与业务场景构建了真实的训练环境。其通过Rubrics-as-Reward(规则即奖励)机制,有效缓解了AI在信息检索时可能产生的“幻觉”问题,确保每一条建议都有据可查。
- 系统内部采用多智能体专业化分工协作,实现了从信息收集、研究分析到可视化呈现的全流程自动化。最终可输出详尽的餐厅推荐、旅行规划等专业报告。
相关阅读:https://mp.weixin.qq.com/s/eIynIOol3gCgbwknOL-XFw
前沿科技:字节发布对标AlphaFold 3的开源蛋白预测模型
- 字节跳动Seed团队发布了名为Protenix-v1的蛋白结构预测模型。该模型在严格限制训练数据和模型规模的条件下,其性能可对标DeepMind的AlphaFold 3,并且是一个完全开源的模型。
- 该模型成功解锁了“推理时扩展”能力。例如,在预测抗体-抗原复合物时,单次推理的成功率为36%,而当使用80次推理结果进行集成时,成功率提升至47.68%。
- 团队采用了双版本策略:标准版专注于对齐学术基准;扩展版则使用截至2025年6月的数据,旨在服务实际的药物发现应用。同时,团队还推出了配套的PXMeter评估工具集。
相关阅读:https://mp.weixin.qq.com/s/zGo3Aerzo0wh1SRlmYkItQ
以上就是本周AI领域的重要动态汇总。从底层协议革新到上层应用爆发,从巨头融资到人才流动,整个生态正以前所未有的速度演进。对于广大开发者和技术爱好者而言,保持对前沿动态的敏锐洞察,是把握下一个技术风口的关键。如果你想持续追踪此类深度技术解析与行业趋势,欢迎关注云栈社区的开发者广场,与我们一同交流探讨。
|