
导读:Cursor 的 25 岁首席执行官 Michael Truell 与他的团队协调了数百个GPT-5.2 代理,从零开始构建了一个“功能齐全的网络浏览器”。
如果让一个人工智能代理“不间断”地连续工作一整周,结果会怎样?答案是:它可能会生成超过 300 万行代码,这些代码分布在数千个文件中。
这正是 Cursor 进行的实验,他们使用了 OpenAI 发布的 GPT-5.2 模型。这款于 2025 年 12 月发布的模型,因其强大的人工智能编码能力而备受赞誉。CEO Truell 认为,GPT-5.2 的特性正好符合他们项目的要求:它能够专注于任务、完整地实现功能,并能长时间自主工作。因此,他们设定了一个雄心勃勃的目标——构建一个全新的 Web 浏览器,拥有自己的渲染引擎和核心子系统。
2026年1月14日,Cursor 发布了一篇题为“扩展长时间运行的自主编码”的博客文章。文中,他们详细介绍了“让自主编码代理运行数周”的实验,其明确目标是:
了解我们将智能编码的边界推进到什么程度,从而完成那些通常需要人类团队花费数月时间才能完成的项目。
他们讨论了尝试过的一些方法、失败的原因以及如何解决遇到的困难。最终,他们声称找到了解决方案,“解决了我们的大部分协调问题,使得我们能够在没有任何单一代理主导的情况下扩展到非常大的项目”。为了测试这套系统,他们设定了以下目标:
为了测试这套系统,我们给它设定了一个雄心勃勃的目标:从零开始构建一个网页浏览器。代理程序运行了近一周,编写了超过100万行代码,分布在1000个文件中。
所有生成的代码都公开在 GitHub 上,欢迎查看。

这个名为 FastRender 的代码库包含了基本的浏览器组件,例如 HTML 解析、CSS 层叠和布局、文本塑形、绘制机制,甚至还有一个自定义的 JavaScript 虚拟机。
代码无法编译
然而,事情从这里开始变得扑朔迷离。
Cursor 在博客中声称“尽管代码库庞大,初级用户仍然可以理解,并取得实质性进展”,以及“数百个工作进程并发运行,向同一分支推送代码,冲突极少”。但是,他们从未明确说明这款软件是否真的能编译成功,是否能实际运行。
随后,Truell 在 X(原 Twitter)上发布了一张浏览器运行的截图,并配文解释道:“这勉强有效!”

他写道:“虽然这看起来像是一张简单的屏幕截图,但从头开始构建一个浏览器是非常困难的。” 但事实是,这款浏览器确实没有能够正常运行。任何尝试编译它的人都会遇到类似下面的错误:
错误:由于存在 34 个错误,无法编译“fastrender”(库);发出 94 个警告
总体而言,如果你尝试编译它,会发现它离成为一个功能齐全的浏览器还差得很远。多次的 GitHub Actions 运行记录显示主分支构建失败,独立的本地构建尝试也报告了数十个编译器错误。
从最近的提交回溯到上百次提交的 Git 历史记录中,人们甚至找不到一个可以干净编译的版本。令人疑惑的是,部署在这个代码库上的“AI代理”似乎从未运行过 cargo build 或 cargo check 命令,因为这两个命令会立即暴露出数十个错误(解决这些后,很可能还会出现更多)以及大约一百个警告。
如果编译错误还不足以说明问题,那么任何有经验的软件开发人员深入研究代码库后都会发现,这些代码的质量堪忧。它们通常被称为“AI垃圾代码”——虽然看起来结构完整,但背后缺乏精心的设计意图,甚至无法通过第一次编译。
Cursor 的博客除了提供代码仓库链接外,既没有提供可复现的演示,也没有提供任何已知的有效版本来验证其截图。无论其意图如何,这篇文章给人一种原型功能完备的错觉,却忽略了此类声明应有的基本可复现性。不过,他们也确实从未明确声称这个原型“完全有效”。
文章的最后写道:“核心问题,即我们能否通过投入更多智能体来扩展自主编码,其答案比我们预期的要乐观得多。”
但这引发了一个关键疑问:他们目前所证明的,似乎仅仅是 Agent 可以同时输出数百万个 Token(代码),但最终仍然无法得到真正可用的产品。
一个合理的评价标准是:这个“浏览器实验”无需与 Chrome 相媲美,但它至少应该能在受支持的工具链上编译,并且能够渲染一个简单的 HTML 文件。显然,Cursor 的成果并没有达到这个最低标准。
在 Hacker News 等开发者广场的讨论中,有开发者表示,在生成的代码中定位 JavaScript 引擎或 DOM 实现等核心组件非常困难。此外,整个项目的规划过程仍然离不开真正的开发人员参与。代理程序并非自发决定浏览器的设计方式,而是由人来定义目标、角色和工作流程。
突破与局限的双重启示
Cursor 的表述很巧妙,他们并未说过“这款浏览器已准备好投入生产环境”。但他们将其描述为“从零开始构建网络浏览器”和“取得了有意义的进展”,再配以屏幕截图和“极其困难”的说明,试图给人造成这项实验实际上取得了成功的印象。
他们最接近宣称成功的说法是:“数百个AI代理可以在同一代码库上协同工作数周,在雄心勃勃的项目上取得真正的进展。” 然而,这种说法目前缺乏坚实的证据支持。博文中既没有提供可用的提交版本,也没有提供清晰的构建说明。
虽然没人指望这款浏览器成为下一个 Chrome,但如果你声称自己开发了一款浏览器,那么它至少应该能够证明自己能够编译并加载一个基本的 HTML 文件。从目前的开源实战情况来看,这一点尚未实现。
尽管如此,Cursor 的这次实验仍然具有启示意义。虽然“浏览器实验”本身可能是个未知数,但他们验证的多智能体协调技术在某种程度上是成功的。也许,他们会将这项技术集成到其主要产品中,用于辅助更大规模的代码开发与协作。
作者:场长
相关阅读:
本文由云栈社区整理发布,聚焦前沿技术动态与开发者实践。