找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4988

积分

0

好友

696

主题
发表于 前天 05:43 | 查看: 27| 回复: 0

一、概念起源

1. 术语提出

  • Mitchell Hashimoto (HashiCorp 创始人): 2026年2月5日在技术分享中首次公开命名 Harness Engineering (驾驭工程),将其定义为「为 AI Agent 设计约束、工具与反馈环境,让其可靠完成复杂任务」的方法论。
  • OpenAI 实践: 同期 OpenAI 在内部 Codex 智能体项目中落地了类似理念,2026年2月11日发布内部实验报告,正式采用 Harness Engineering 方法论,提出「人类掌舵,代理执行」核心口号。
  • LangChain 视角LangChain CEO Harrison Chase 将 Harness 定义为「一个执行环境,让 AI 模型能够循环运行、调用工具并执行长时间任务」,社区广泛采用「Agent = Model + Harness」这一简化公式来理解其架构。

2. 核心思想

其核心思想非常明确:从传统的「调教提示词」转向工程化的「设计系统」。工程师不再需要逐行修正 AI 的输出结果,而是通过一套系统化的工程手段,为 AI 划定清晰的安全边界、提供可靠的工具集、并建立高效的反馈循环,从而让 AI 在预先设定的可控框架内自主、可靠地完成复杂任务。

二、核心规范与实践

1. 六大核心组件 (Agent Harness 通用规范)

组件 核心作用 关键实践
执行循环 (Loop) 定义 Agent 思考-行动-观察的迭代流程 固定 Think → Act → Observe 节奏,避免无意义发散
工具系统 (Tools) 提供可调用能力白名单 仅开放必要工具 (如文件读写、代码执行),禁止越权操作
上下文管理 (Context) 控制 Agent 可见信息范围 渐进式加载、主动压缩上下文,避免信息过载
持久化 (Persistence) 跨会话记忆与状态恢复 保存进度文件、Git 提交记录,支持任务中断后续跑
验证 (Verification) 自动校验输出正确性 集成测试、Lint 检查、行为契约校验,拦截不符合预期的结果
约束 (Constraints) 强制架构与安全边界 用机器规则 (如 Linter、CI) 替代人工审核,守住架构规范

2. OpenAI 三大支柱规范

  1. 上下文工程 (Context Engineering)
    • AGENTS.md 作为「Agent 宪法」,将团队隐性知识 (架构规则、编码规范) 注入系统 Prompt,作为跨会话持久约束。
    • 遵循「频繁有意压缩」原则:只给 Agent 当前步骤必需信息,避免全量上下文堆砌。
  2. 架构约束与强制执行
    • 用自动化工具 (Linter、静态检查) 强制架构边界,例如依赖方向必须 Types → Config → Repo → Service → Runtime → UI
    • 所有横切关注点 (认证、日志、错误处理) 必须通过统一 Provider 接口注入,禁止代码中硬编码。
  3. 熵管理 (Entropy Management)
    • 将技术债务视为「垃圾回收」:定期清理 AI 生成的冗余代码、过时依赖。
    • 每个 Git 工作树对应独立沙箱,避免任务间状态污染。

3. LangChain 生态 Harness 实践

  • Runnable 约束: 用 LangChain Runnable 接口封装 Agent 执行流,实现可观测、可重试、可中断。
  • 工具白名单: 通过 Toolkit 限定 Agent 可调用工具,结合 CallbackHandler 监控执行行为。
  • 反馈闭环: 将测试结果、错误日志注入 Agent 上下文,引导其自主修正,形成「执行-校验-迭代」循环。

三、关键设计原则

  1. 人类在循环之上 (Humans on the loop): 人类负责定义规则、架构与价值判断,AI 负责具体执行,不逐行审核代码。
  2. 最小权限原则: 仅给 Agent 完成当前任务必需的能力与信息,避免过度授权。
  3. 确定性优先: 用机器规则替代人工判断,确保 Agent 行为可预测、可复现。
  4. 渐进式治理: 从简单约束开始,随 Agent 犯错逐步完善规则库,而非一步到位。

四、代表实现

  • OpenAI Codex Harness: 内部用于大规模软件开发,支持从 Prompt 到 Merge 的全自治流水线。
  • Claude Code Auto Mode: Anthropic 实现的 Harness,通过权限分类器自动判断操作安全性,平衡效率与安全。
  • LangChain Agent Harness: 基于 AgentExecutor 与回调系统,为 LangChain Agent 提供执行约束与监控。

希望这篇关于 Harness Engineering 的解析,能帮助你更好地理解和设计可靠的 AI 智能体系统。如果你在实践中遇到了其他挑战或有独到见解,欢迎在 云栈社区 与更多开发者一同交流探讨。




上一篇:企业AI如何应对“数据清洁幻觉”?基于3DI的本体论证明真实而非假设
下一篇:Superpowers:GitHub 12万Star的Agent技能框架,重构AI软件开发方法论
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-7 17:27 , Processed in 0.573552 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表