前段时间,整个 AI 圈子都被 Cursor 发布的一则消息所震动。
Cursor 宣称,他们让 GPT-5.2 驱动的编码智能体连续运行了整整 7 天(168 小时)。这些 AI技术 驱动的智能体竟然从零开始,编写出了一个包含超过 300 万行代码、功能堪比 Chrome 的浏览器。
这一说法极具诱惑力:随着计算资源日益普及,AI 似乎可以无限期地自我迭代,直至完成像构建操作系统、办公软件甚至游戏引擎这样的宏大目标。


然而,就在许多人还处于惊叹中时,技术社区的开发者们开始了他们的“审查”。他们仔细查看了 Cursor 开源的“FastRenderer”项目代码,发现了一个关键问题:这个所谓的“AI浏览器”项目,连最基本的编译都无法通过。

一篇技术博客犀利地指出,Cursor 所宣称的“突破性进展”,本质上是缺乏工程逻辑的“AI泔水”(AI Slop)。他们在宣传上制造了成功的假象,但实际上项目只是一堆无法运行的代码。

博客地址:https://embedding-shapes.github.io/cursor-implied-success-without-evidence/
GPT-5.2 七天造出浏览器?事实核查
Cursor 在 1 月 14 日发布了一篇题为《扩展长时间运行的自主编码能力》(Scaling long-running autonomous coding)的博客。

官方博客:https://cursor.com/blog/scaling-agents
文中提到,他们进行了让“编码智能体自主运行数周”的实验,目标是探索在通常需要人类团队数月才能完成的项目上,AI 驱动的编码能走多远。他们最终找到了一种方案,能够将智能体规模扩展到非常大的项目。
为了测试该系统,他们设定了一个雄心勃勃的目标:从零开始构建一个网络浏览器。智能体运行了近一周,在数千个文件中编写了超过 300 万行代码。同时,他们在 GitHub 上开源了代码。

GitHub 项目:https://github.com/wilsonzlin/fastrender
但问题在于:这个任务真的成功了吗?博客中声称“智能体可以理解庞大代码库并取得有意义的进展”,以及“数百个 worker 并发运行,冲突极少”,却从未明确指出这个浏览器能否实际运行。演示仅为一个简短的视频和截图,并配文“虽然这看起来像是一个简单的截图,但从零开始构建一个浏览器是非常困难的”,始终未给出“可运行且功能正常”的明确结论。
核心问题:代码无法编译,项目从未成功构建
如果你亲自克隆(clone)该仓库并尝试运行 cargo build 或 cargo check,问题会立刻暴露:
error: could not compile ‘fastrender’ (lib) due to 34 previous errors; 94 warnings emitted
技术博客的作者列举了多个证据:
- GitHub Actions 持续失败:主分支(main)上的近期工作流(workflow)运行全部失败,甚至包含 workflow 文件本身的错误。
- 独立构建报错:尝试独立构建会报出数十个编译器错误。
- 历史提交均不可用:回溯最近的 100 个提交,几乎找不到一个能干净编译的提交。这意味着该仓库从诞生起就从未处于“可构建”状态。
该仓库甚至包含一个记录构建失败提交的列表文件。

上下滑动查看
https://gist.github.com/embedding-shapes/f5d096dd10be44ff82b6e5ccdaf00b29
目前,该仓库中已经有一个关于构建失败的 GitHub Issue。作者指出,这根本不是真正的工程代码,而是典型的“AI泔水”——形式上模仿了功能,但缺乏连贯的工程意图,连最基本的标准都未达到。

Issue 地址:https://github.com/wilsonzlin/fastrender/issues/98
Cursor 的演示避谈了“如何运行”和“工作原理”,也没有提供任何可复现的演示或已知可用的版本标签(tag/release)来验证其截图。这种遗漏了工程界最看重的“可复现性”的做法,即便在字面上不算撒谎,也具有极强的误导性。
到目前为止,他们唯一证明的可能是:AI 智能体可以疯狂输出数百万 Token,但最终生成的代码依然是一堆无法运行的废料。 一个浏览器实验的最低标准应是在受支持的工具链上编译通过,并能渲染一个简单的 HTML 文件,但 Cursor 的项目未能满足这一标准。
开发者社区反应强烈
这种将“半成品”包装成“里程碑”的行为,迅速激怒了开发者社区。在 GitHub 的 Issue 区和 Hacker News 等 开发者社区热议 的平台上,批评声不断。
- “我也试了,根本跑不起来。”
- “代码逻辑混乱,持续集成(CI)全红也敢合并?我们是在对着截图膜拜吗?”
- “既然功能是假的,开源这个仓库有什么意义?为了证明 AI 能制造电子垃圾吗?”

在 Hacker News 上,相关讨论获得了近 200 条评论。网友 pavlov 指出,所谓的“从零开始”和“定制 JS 虚拟机”是误导。查看项目依赖(如 html5ever, cssparser, rquickjs)就能发现,它本质上是对 Mozilla 开发、现由 Igalia 维护的 Servo 浏览器引擎的封装。


网友 brabel 评论道:“他们居然觉得声称‘从零手搓’是步好棋?任何程序员上手第一件事就是查依赖。唯一的解释是,他们赌大多数人只会看标题就欢呼,不会去认真核实。”

事件背后:AI 编程的激进叙事与行业竞争
Cursor 虽然从未直接声明“该项目已准备好投入生产”,但却通过“从零构建”和“有意义的进展”等宏大叙事,配合精心挑选的截图,成功营造了“实验成功”的假象。大家并不指望它成为下一个 Chrome,但一个声称已构建的浏览器,至少应能演示编译并加载基本 HTML 文件。
这次事件也折射出当前 AI 编程领域的激烈竞争态势。近一个月,行业焦点很大程度上被 Anthropic 的 Claude Code 所吸引,其展现出的能力令许多资深开发者感到震惊。在这种背景下,一篇“编码智能体运行一周写出浏览器”的叙事,无疑非常吸引眼球。这或许导致了 Cursor 团队在验证不足的情况下,过于急切地发布了这一结果。
启示:从“氛围编程”到“开挂工程师”
这次事件虽然结果惨淡,但也意外揭示了 AI 协同编程的一些关键经验。Hyperbolic 联创兼 CTO Yuchen Jin 指出了 Cursor 实验中隐含的教训:
- 让大量智能体作为对等体自我协调是行不通的。
- 明确的角色分工(如规划者、执行者、评审者)更有效。
- 不同模型特性不同(如 GPT-5.2 更长于长期任务)。
- 增加过多“管理”智能体反而会降低效率,这与人类组织中的问题类似。

更深层的进化或许发生在人类工程师自身。一个名为“开挂工程师”(Cracked Engineer)的概念正在硅谷流行,它指的是那些拥有深厚技术功底,并能高效利用 AI 工具,以一人之力驱动整个项目进展的顶级开发者。
Cursor 的这次翻车,恰恰落入了所谓的“氛围编程”(Vibe Coding)陷阱——只享受 AI 生成代码的速度,却完全抛弃了工程严谨性,产出了无法运行的“电子泔水”。

真正的“开挂工程师”是这一现象的反面。他们深度使用 AI,但绝不盲信;他们拥有足够的技术判断力来审查和修正 AI 的输出。未来的软件开发,可能并非由数千个无序的 AI 智能体完成,而是由一名“开挂工程师”带领一个精干的 AI Agent 团队,精准高效地构建真正可用的产品。这次事件也提醒整个社区,在追逐 GitHub开源项目 和 AI 编程热点的同时,对代码质量和可复现性的基本要求不应被忽视。想了解更多前沿技术动态与深度讨论,欢迎访问 云栈社区。
参考资料:
https://embedding-shapes.github.io/cursor-implied-success-without-evidence/
https://www.theinformation.com/articles/forget-vibe-coders-cracked-engineers-rage-tech