找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3019

积分

0

好友

405

主题
发表于 3 小时前 | 查看: 3| 回复: 0

多智能体赛道正在爆发,而“驾驭”(Harness)技术被视为破局的关键,资本也在加速布局。

一家成立仅四个多月的AI初创公司明日新程(Nextie),刚刚宣布连续完成两轮融资。团队透露,当前的资金储备已足够支持未来三到五年的持续创新。

幕后掌舵人是被称为“小冰之父”的李笛,以及与他并肩多年的微软小冰创始核心班底。

李笛在奇绩创坛2025秋季路演日上介绍Harness与群体智能

在当前一级市场整体降温、投资机构出手愈发审慎的背景下,一家成立不到半年的公司能连续完成两轮融资,并吸引了李开复、陆奇等AI圈顶级投资人的同步押注,这本身就是一个强烈的市场信号,体现了资本对其团队能力、技术方向与赛道前景的多重认可。

那么,这笔资金将投向何方?团队的答案非常明确,核心方向只有一个:Harness群体多智能体

当下,无论是持续引发热议的OpenClaw,还是近期备受关注的Hermes Agent,AI Agent正以前所未有的热度席卷整个行业。随着实践的不断深入,Harness的价值逐渐清晰。包括OpenAI、Anthropic在内,越来越多的顶尖团队已经意识到,Harness是智能体实现稳定、可靠落地的核心工程支撑

有趣的是,对于这个趋势的判断,李笛及其团队在去年就已经提出。在2025年12月的奇绩创坛Demo Day上,李笛压轴登场,系统性地阐述了群体智能理论,并对Harness的趋势做出了预判和布局。

Harness为何成为行业共识?

OpenClaw的火爆无疑为智能体赛道按下了加速键,让行业第一次真切看到了智能体主动执行复杂任务的潜力。然而,当人们开始尝试将其当作“正式员工”来使用时,各种问题也随之暴露。

最具代表性的事件来自Meta的安全对齐总监Summer Yue,她的邮箱曾被OpenClaw在一夜之间清空。无独有偶,OpenClaw还发生过未经授权擅自行动,将敏感数据泄露给无权限员工长达近两小时的事故。

社交媒体上关于OpenClaw失控删除邮件的讨论截图

究其根源,问题在于这类框架在工程实现上尚处于早期阶段,缺乏成熟的Harness级别技术来“驾驭”智能体的行为。在处理超过24小时的长程复杂任务时,不仅Token消耗巨大,效果不稳定,在安全性与可控性方面也存在显著短板。

李笛对此的比喻很形象:任何一个超级智能个体,无论其能力多强,都必然存在认知盲区,且无法自我纠偏。当它处理长周期任务时,微小的错误会随着时间被指数级放大,最终导致灾难性后果。

因此,Harness(原意为“马具”)在AI领域的核心价值日益凸显。它本质上是连接“模型(马匹)”与“人类需求(骑手)”的框架体系。它不直接参与任务执行,而是通过一套明确的约束、规范与协同机制,引导多智能体进行高效、安全的协作,其核心哲学是“用约束换取更高程度的自主”。

今年2月,OpenAI发布了官方博客《Harness Engineering: Leveraging Codex in an Agent-First World》,通过实验证明AI可以成为独立完成全流程开发的执行主体,但必须有一套框架来驾驭它。报告显示,通过Harness Engineering,一个3人工程师小组在5个月时间里,就能利用Agent构建出百万行代码规模的产品。

OpenAI官方博客关于Harness Engineering的文章截图

无独有偶,Anthropic近期发布的新Agent架构“Managed Agents”,在其技术文档中也反复强调了“Agent Harness”的概念。

Anthropic Claude官网介绍Managed Agents与Agent Harness

Nextie的“Harness群体多智能体”有何不同?

明日新程(Nextie)在这条技术路径上,走得更为专注和深入。团队所布局的“Harness群体多智能体”,并非简单的“多智能体+约束规则”,而是一个将Harness工程化理念与原生群体智能深度融合的全新体系。

该体系以原生群体智能与认知模型为核心,让众多具备不同认知能力和功能定位的Agent,能够按照明确的规则进行协同工作、互相校验与迭代优化。

李笛解释,Nextie的Harness核心包含三个关键组件:上下文管理、参与其中的多智能体、以及多智能体协同方法。其中,协同方法最为关键,团队内部称之为“认知碰撞”,即通过辩论、挑战、反思、同行评审、投票等方式,让多智能体实现真正的思辨与互补,而非流于表面的“表演式一致”。

这种体系设计,既能解决OpenClaw等框架在长程协同中的稳定性痛点,又能通过群体思辨机制打破单一Agent的认知盲区,输出经过充分权衡的最优解,真正实现“1+1>2”的群体智能效应。

“协同”的思考,始于小冰时代

李笛团队对多智能体协同的探索并非一时兴起。“自2022年以来,我们一直在为这个时刻做准备”,李笛将这段蛰伏期拆解为几个关键节点。

第一个节点在2022年底。彼时,Transformer架构的颠覆性潜力已被广泛认知。团队当时手头有一套基于上一代技术的框架,虽然能感知到框架的潜力,但受限于旧技术。看到新技术出现时,团队意识到很多过去棘手的难题有了破解的可能。

然而,一个更根本的问题也随之浮现:有些障碍,并非单靠模型能力变强就能解决。这个问题的种子,早在打造“小冰”的时代就已埋下。团队最初的目标就不止于创造一个“小冰”,而是构建成千上万个能精准匹配用户需求、且能彼此默契配合的AI个体。

但在实践中他们发现,单个Agent再聪明,一旦放入多智能体场景,协作就容易失控。要么是“表演式一致”,表面和谐实则缺乏深度思考;要么互相冲突内耗,整体效率反而不如单干。完全依赖模型自身来驱动协同,是远远不够的。

于是,团队开辟了一条新的研究方向:多智能体之间,究竟应该如何协作?他们给出的答案是:唯一的参考蓝本,就是人类社会本身

2023年初,团队提出思维链(CoT)是关键,并自研了“小冰链(X-CoTA)”,验证了思考过程透明化的核心价值。在团队的构想中,真正高效的协同不能只共享结论,更要同步思考过程。这就像人与人之间的深度协作,只有了解对方的推导逻辑,才能实现超越表层的配合。

经过长期的积累与等待,技术条件、市场环境与团队状态终于在2025年底迎来同频共振。李笛带领核心团队成立明日新程(Nextie),并将核心方向锁定为原生群体智能与认知模型。

产品落地:“团子”与“卫士虾”

今年2月,团队打造的首个原生群体智能平台——“团子(tuanzi.ai)” 发布内测版。

团子(tuanzi.ai)原生群体智能平台界面

在该平台上,用户提出问题后,数十个Agent会“围坐一桌”,各抒己见、互相补充、辩论交锋,甚至引入投票表决、同行评审等专业环节。

团子平台内关于特定话题的群体智能讨论记录

根据团队设计的评测指标,Nextie在视角完备性、辩证深度、落地实操性等维度的综合表现显著优于竞品。不仅超越了包括ChatGPT-5.2 Thinking在内的单一大模型,在达到同等思考深度的情况下,整体计算消耗(Token)可降低约50%。

Nextie与Gemini 3、ChatGPT 5.2等模型的Intelligence Depth Index对比图

此外,前段时间引发关注的“卫士虾(TuanziGuardianClaw)”,则是其群体智能能力的又一次实战验证。这只专门用于防范OpenClaw安全漏洞的Agent,完全由“团子”平台上的群体智能体自主协同设计而成。

由群体智能体自主设计的安全Agent“卫士虾”形象

未来展望:“小冰岛”将以新形态重现

谈及近期产品规划,李笛透露团队正在全力打造一款形态接近“小冰岛”的全新产品。它不再局限于简单的情感陪伴,而是能够协同完成各类复杂、长期的任务,真正帮用户解决问题、陪伴用户成长,并在持续交互中与用户建立深度、个性化的绑定关系。

李笛表示,新产品最大的延续在于“小冰岛”最初的设计理念:观察并围绕每一个独立的个体,配备一群最适配其需求的Agent。而最核心的升级,则来自于技术层面的全面迭代,深度融入了“团子”的Harness群体智能能力。

“以前在小冰岛上,你告诉一个AI‘我失恋了’,这个AI无法智能判断是否该把这个信息传递给其它AI,”李笛举例说,“现在,Agent群体会通过智能判断,做出最合理的反应,你的每一次交互,都会在Agent群体中产生智能、合理的涟漪。”

未来,用户可以拥有一组像OpenClaw一样能自主工作的Agent,但它们会根据你的独特需求进行灵活调整与协同。这意味着,这群Agent从诞生之初,就是为你一人而存在的专属智能团队。这也为多智能体打开了全新的、高度个性化的应用场景。

据透露,这款新版“小冰岛”产品预计将在本月底推出。随着资本的注入和技术的持续突破,明日新程(Nextie)能否在Harness群体多智能体这条赛道上持续领跑,值得业界与开发者社区的共同关注。




上一篇:北航 & 字节SAGE-RL:激活大模型与生俱来的高效数学推理能力
下一篇:斯坦福2026 AI指数报告核心结论:中美顶尖大模型性能差距已基本消除
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-15 05:02 , Processed in 0.629663 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表