找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3755

积分

0

好友

501

主题
发表于 1 小时前 | 查看: 3| 回复: 0

OpenClaw 之父 Peter Steinberger 和 Claude Code 之父 Boris 在同一天发出了同一个信号:Agent 自主运行数天的时代,手动编写 prompt 已经变成一种落后的做法了。
Boris 还分享了一套用好 Agent 的 5 个技巧,我把它拆解了一遍,附上可以直接套用的玩法。

先回想一个扎心的问题:
你最近是不是还在做这些?——调输入的 prompt、盯 Agent 的运行 trace、回头再给 Agent 加更多约束,跑偏就改,再跑偏再改……
这个方向,错了。

OpenClaw 之父今天发了条推,原话特别冲:  

这是每月一次的提醒:你不应该再手动为编码 Agent 编写提示词了。你应该设计能够提示智能体的循环。

Peter Steinberger推文截图

Boris Cherny,Claude Code 之父,今天分享了 5 个技巧,关于怎么让 Claude Opus 自己跑几小时、甚至几天不用你管

Boris Cherny分享Opus自主运行技巧截图

把这两条放在一起看就懂了:一个在说别再调 prompt 了,一个在演示:不调 prompt,那该调什么呢?

这让我想起上周四分享的内容:我用 Karpathy 的 Autoresearch 跑通 Agent harness 调优,任务通过率从 60% 飙到 80%。
我让模型自己给自己迭代一个上下文管理插件,去刷 SWE-bench。我没怎么调 prompt,是搭了一个让它自己写、自己测、自己分析、自己迭代 20 版的循环。
结果,任务通过率从 60% 干到了 80%,而最后那个最优解,只是一行不到 50 个字符的 hooks 注入。

实验结果:v19最佳方案配置与代码

一个很简单的实验,让我对“模型变,harness 就得跟着变”这句话认识更深刻了。
决定 Agent 上限的,不是起始的那段 prompt 写得多妙,是你给它搭的那个循环。

下面是 Boris 的 5 个技巧,我逐条解读一下。这可以说是 2026 年 6 月份最新用好 Claude Code 的 5 个好习惯了。

用自动模式处理权限。 不要让 Agent 每次都要请求审批,相信它的自动权限判断。一旦非要人守在那点“允许”,循环就断了,它就没法连跑几天。
Claude Code自动模式开启界面

用动态工作流,让它自己编排几百上千个子 Agent。 这特别适合复杂任务。给它一个任务,Claude 会自动分解成子任务,每个子任务再次分解,一次又一次地持续这个过程,直到每个任务足够小,让 Claude 可以轻松完成。
Agent动态工作流架构图

用 /goal 或 /loop 指令,推着它干到完成为止。 这是 Agent 最直白的形态:给一个终点,让它自己转圈逼近。
/goal指令使用截图

把 Claude Code 跑在云端,好合上电脑。 电脑不闭合,已经成了今年 vibe coding 的标准姿势了……
vibe coding风格笔记本照片

让它能端到端自己验收。 这条我觉得最关键——网页用 Chrome 插件校验,移动端用模拟器 MCP 校验,后端就真起一个服务去验。让 Agent 自己能判断自己干对没干对,才能持续迭代提升。

其实这 5 条传达的就是一个理念:搭一个能自己转、自己验、不用你守的 Agent 循环,让 Agent 自己可以提升。

但这里有个更狠的真相,没人愿意说。那是不是学会搭这套能让 Agent 循环的体系就行了?
可能也没那么简单。今天 VentureBeat 上一位硅谷 CTO 写了篇文章,泼了盆冷水,但我觉得他说到了根上:

VentureBeat文章截图

Agentic AI 解决了写代码,却暴露出了软件工程里所有别的问题。

原话我翻译一下:
写代码,从来就不是瓶颈。真正难的是定义需求、对接复杂系统、在真实环境里维护。AI 压缩了执行的时间,但它压缩不了模糊性、责任和运维复杂度。
当 Agent 把海量代码灌进一个组织,那个最难的部分——人去审、去验收、去背锅——反而成了新的、巨大的瓶颈。

这就接上了去年很多人质疑 Agent 的一个点:Agent 一天能改一百版,你一天审不完一版。
怎么让 Agent 任务完成得更好?现实变成了怎么让它自己跑、自己验、还不烧穿钱包、结果还持续提升

整体上,应该很多朋友已经这么玩很久了,包括我前几个月分享过一天烧几亿 token 也是这个模式。我觉得最难的,还是国产模型在这种模式下,任务遵循始终没有那么好。Claude、GPT 这些模型很聪明,但是烧起来太快,额度根本兜不住……
泪崩。

云栈社区将持续分享 Agent 自主循环的落地经验与工程化思考。




上一篇:Python Tkinter打造轻量级代码编辑器Porcupine:桌面APP开发学习实例
下一篇:MetaMask嵌入式钱包发布:支持邮箱登录与9种SDK快速集成
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-6-9 04:14 , Processed in 0.747795 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表