找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1964

积分

0

好友

258

主题
发表于 3 小时前 | 查看: 3| 回复: 0

最近我一直在思考一个关键问题:大模型的能力日新月异,我们追踪了那么多技术,尝试了那么多产品,今天看来,很多当时觉得有用的东西可能很快过时,甚至不少努力纯属白费。那我们到底应该学习什么、构建什么,才能在大模型浪潮中找准自己的位置,不被轻易替代?人类与AI协作的边界,究竟在哪里?

一个最近在我交流群里被频繁提及的观点,或许能带来一些启发。

关于学习管理学与AI的聊天截图

将视线从人类历史中抽离出来看,似乎只有管理学、经济学这类知识能够真正跨越技术周期。我们或许需要从过去痴迷于模型的“补全能力”和“具体微操”中跳脱出来,将注意力转向如何系统地“构建”和“管理”智能。

从Claude Code等一系列AI产品近期的迭代来看,这一趋势已经初现端倪。一个新概念正浮出水面,它很可能成为继VibeCoding、Agent Engineering之后,在2026年前后引发广泛讨论的技术热词:Harness Engineering(马具工程学)。

关于Harness Engineering定义的聊天截图

这个概念我之前在文章中提过,但一直没能找到一个非常贴切的比喻来阐述它到底是什么。直到最近看到LangChain工程师viv撰写的一篇文章,它提出了一个简洁而有力的心智模型,获得了广泛的共鸣:

Agent = Model + Harness

如果把强大的AI模型比作一匹充满力量的骏马,那么Harness(马具)就是骑手手中那套缰绳、马鞍与脚蹬。这个比喻精准地捕捉到了“管理”与“驾驭”的精髓。马怎么奔跑是它的事,骑手需要关注的是如何引导它跑向正确的方向,控制节奏,该停则停,该走则走。试图自己扛着马跑,显然是错误且徒劳的。

任何不是模型本身的东西,基本都可以归入“缰绳”的范畴。这套“缰绳”包含了所有让一个原始模型转变为一个有用工作引擎的代码、配置、工具集以及执行逻辑。

Agent架构图:Model与Harness的交互关系

为什么需要Harness?

因为模型本身只是一个“思考者”。它擅长处理文本、图像等数据并输出文本,但它无法自主维持状态、执行代码、访问实时知识,也无法持久化工作。这些能力,都需要Harness来提供。

这篇文章从“我们期望智能体具备什么行为”出发,反向推导出了Harness必须构建的核心功能模块。

期望的Agent行为与Harness能力对应关系图

核心Harness组件

  • 文件系统:这是最基础的Harness原语。它为智能体提供了一个持久化的工作空间,使得工作可以增量式进行,状态可以跨会话保持,同时也成为多智能体协作的天然接口。
  • 代码执行能力:让智能体能够自主编写代码来解决问题,而不是受限于预先定义好的、有限的一套工具。给模型一个Bash工具,相当于给了它一整台可以操作的计算机。
  • 沙盒环境:确保了代码执行的安全性和可扩展性。一个好的环境还会配备默认的工具链(如截图、日志、测试框架),帮助智能体观察和验证自己的工作,形成一个自我检查与修正的循环。
  • 记忆与搜索:通过文件系统和上下文注入,智能体可以实现持续学习。Web搜索等工具则帮助模型突破了其知识截止日期的限制,访问实时信息。
  • 上下文管理:这是为了对抗“上下文腐化”——即模型性能随着上下文窗口被填满而逐渐下降的问题。压缩、将工具调用卸载到外部、技能渐进式披露等都是有效的策略。
  • 长期自主执行:这需要前面所有能力的复合。文件系统和Git用于跨会话跟踪工作进度;Ralph循环(一种规划-执行-验证循环)可以强制智能体继续未完成的任务;而规划和自我验证则确保工作不会偏离预定轨道。

模型训练与Harness设计的耦合

今天我们看到的一些成熟智能体产品,如Claude Code,其背后的模型训练过程已经与Harness的设计紧密耦合。有用的Harness原语被团队发现、标准化,然后被用于训练下一代模型。

这种“共同进化”带来了一个有趣的现象:改变工具逻辑有时反而会导致模型性能下降。因为模型在它被训练时所处的那个特定Harness环境中表现最好,但这并不意味着那就是最适合你手头任务的Harness。这是一个需要权衡和工程判断的地方。

模型与Harness训练循环图

Harness工程的未来

随着模型能力不断增强,今天Harness中的部分功能未来可能会被模型原生地吸收。但正如提示工程至今依然充满价值一样,Harness工程很可能在构建优秀Agent方面持续扮演重要角色。

当你能够驾驭单一智能体之后,下一个重要课题自然就是:如何驾驭一个“智能体军团”?例如,有开发者提出一个关键维度:当并行运行数百个智能体时,Harness需要管理智能体身份和信任体系,每个智能体的输出“信誉”应成为基础设施的一部分。

另一个观点认为,未来的Harness可能会在运行时根据用户的具体提示动态组合而成,而不是预先进行静态配置,从而实现更通用、更灵活的模型能力引导。

文章最后也指出,Harness工程目前仍是一个活跃的研究前沿,涉及协调数百个智能体在共享代码库上并行工作、分析自身轨迹以识别和修复失败模式等诸多挑战。

小结一下:

Harness的外延和内涵都还在不断丰富之中。让我们跳脱纯技术视角来看:珍妮纺纱机、瓦特蒸汽机本身并未创造工业革命。真正点燃那场变革的,是英国当时将生产从‘个人手工作坊’强行拉向‘标准化公司工厂’的组织变革,并随之创造了股票、期权与有限责任制度等一系列金融与管理创新。

如果我们把AI看作一匹拥有无限潜力的马,那么技术实践是打造精良的马具,而金融、管理与社会实践,才是最终决定这匹马能否将潜力转化为现实生产力的缰绳与赛道。AI要真正驱动新一轮生产力革命,不仅需要模型能力的持续进化,更需要一种“Harness思维”的觉醒:从过去痴迷于模型本身的微操,跃迁到构建能够驾驭智能的工程体系与创新激励机制。

毕竟,无论是当年将手工业者组织进工厂,还是今天将Agent装入Harness,人类最核心的竞争力,从来都不是亲自去扛着马跑,而是通过构建高效的协作系统与资本系统,让那些强大的“智能”能够精准落地,创造价值。

模型即智能,而Harness是让这种智能变得有用的系统性工程,它甚至可能触发超越技术本身的、更深层次的变革。

本文部分观点及图表参考自 LangChain 工程师 viv 的文章,原文链接:https://mp.weixin.qq.com/s?__biz=MzA5MTIxNTY4MQ==&mid=2461155513&idx=1&sn=e96d6edc7c40c51fde0ada5f55de4e2c&scene=21#wechat_redirect。关于Harness工程与AI智能体开发的更多深度讨论,欢迎访问云栈社区与广大开发者一同交流。




上一篇:OpenClaw实战:40天构建具有长期记忆的AI Agent文件系统架构
下一篇:量化交易模型测评:牛津大学揭秘VLSTM与xLSTM在金融时序预测中的霸主地位
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-12 10:22 , Processed in 0.535918 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表