
通往AGI的最大瓶颈并非算力或模型架构,而是一个令人意外的人类弱点:我们打字的速度、懒惰以及想象力的匮乏;传统的 IDE 将被边缘化,而对 AI 的计划审查和自动化代码审查将成为新的核心技能。SaaS 并未消亡,但关系与记录是新的护城河。
这是OpenAI Codex的产品负责人Alexander Embiricos在最新访谈中分享的核心观点。他透露了OpenAI内部开发流程的根本性转变,工程师们如今基本上不再打开编辑器了,工作模式已从与 AI 结对编程全面转向任务委托。他还首次披露了OpenAI一个看似矛盾的商业策略——通过建立 agents.md 等开放标准,并将其最先进的模型提供给直接竞争对手,从而玩一场关于智能分发的更宏大游戏。

以下是这次访谈中一些你可能感兴趣的观点。
1. AI 会自动化编程吗?一个关于“Computer”词源的回答
当被问及是否同意马斯克“编程将是首批被大规模自动化的职业之一”的论断时,Embiricos 给予了肯定的答复,但附带了一个关键的历史注脚。

“我完全同意,编程是大型语言模型表现出色的首批领域之一,但编程被自动化究竟意味着什么?”
为了解释他的观点,他邀请听众进行一次思想实验,回到编程语言演进的早期。“例如,当我们不再编写汇编语言,转向更高级的语言时,我们说过编程被自动化了吗?并没有。”他指出,“我们只是能够编写多得多的代码,结果是对代码的需求反而激增,需要更多的软件工程师。”
他进一步追溯了“Computer”这个词的起源。在解码德国“恩尼格玛”密码机的布莱切利园,最初的“Computer”指的是一群从事计算工作的人类,他们手动打孔、操作机器、进行表格计算。同样,最早的电子表格软件的设计灵感,也来自于一个办公室里坐满员工,像网格一样排列,每个人完成自己的计算,再把结果递给下一个人。
“所有这些具体的任务都已经被自动化了,”Embiricos 总结道,“但每一次这样的自动化发生,对最终产出的需求都会迎来一次爆炸性增长。结果是你实际上需要更多的人来做这类工作,即使具体的任务内容已经改变。”
基于此,他给出了一个与直觉相反的预测:“我认为五年后我们会有更多的工程师,而不是更少。”
2. 人才栈的压缩:工程师、设计师与(或许不再需要的)PM 的未来
Embiricos 认为,未来的变化不仅在于工程师数量的增减,更在于工作角色的融合与定义。
“我们有时会改变词语的含义,就像‘Computer’这个词现在指代的是机器一样,”他说,“现在我们有了‘软件工程师’这个词,我坚信未来会有更多的‘构建者’。”
他观察到的一个核心趋势是“人才栈的压缩”。“在过去,你有很多分工明确的岗位,比如后端工程师和前端工程师。但现在,至少在我们的 Codex 团队里,这种情况已经少了很多,大家的工作都变得更加全栈。”
这种压缩意味着,未来的工程师可能是一个集设计、产品思维和编码能力于一身的超级个体。“当你提到工程师时,你可能想的是一个比以往任何时候都更加全能的人。”Embiricos 解释道。
而对于他自己所处的产品经理角色,他则半开玩笑地表达了悲观的看法。“我倾向于认为 PM 这个角色实际上是被明确地未定义的,你的目标就是适应团队或业务的任何需求。”他坦言,一个优秀的产品经理可以帮助团队退后几步,预见未来的风险,成为团队最棒的啦啦队长和质量把关人。“但所有这些我刚才描述的事情,一个强大的工程负责人或一个懂产品的设计师也完全可以做到。”
3. 通往 AGI 的真正瓶颈:人类的懒惰与想象力
谈话转向了一个更为宏大的话题:AGI 的瓶颈。Embiricos 抛出了一个观点:“人类的打字速度和验证工作是通往 AGI 的关键瓶颈,而不是模型算力或架构。”
为了证明这一点,他进行了一次简单的思想实验。“你今天大概会用多少次 AI?”答案是30多次。他紧接着追问:“那假设对你来说是零成本的,你认为 AI 每天能帮你多少次?”
答案显而易见:几乎是无限次,AI 可以全天候地在每一件事上运行。“我听到 OpenAI 内外的工程师说,‘我一直让 AI 运行着,如果开会时它没在工作,我就是在浪费时间。’”Embiricos 分享道,“这非常酷,但也需要大量精力去管理这些智能体。”
这就是问题的核心。“即使是我自己,我知道我应该在所有事情上使用 AI,但我太懒了,懒得去输入那么多提示词,我的创造力也有限,想不出所有 AI 能帮助我的方式。”他说,“我认为 AI 应该每天帮助我们成千上万次,但我们不应该期望大多数人为了从 AGI 中受益,而需要花费如此多的精力去学习如何使用这个工具。它应该是毫不费力的。”
他认为,理想的未来是,使用 AI 不再需要绞尽脑汁地想出完美的提示词,AI 应该能主动连接到你的上下文并适时地提供帮助。
4. 个体赋能 vs 企业级自动化
Embiricos 强调,实现 AI 普惠的最佳路径是为个体构建工具,而非自上而下的企业级自动化。
“如果你试图一步到位,实现某个宏大的工作流自动化系统,那你必然要处理所有安全和合规的障碍。”他承认道,“你需要现场实施工程师去打通所有数据系统。但我的观察是,当我们自上而下地做这些事时,最终会极大地低估 AI 帮助这家公司的潜力。”
他提倡一种双轨并行的策略。“你可以一边进行企业级的部署,但同时,你必须把 AI 交到那些真正在一线工作的人手中。”他解释说,如果员工个人也在使用 ChatGPT,他们会对 AI 的工作原理有更深的理解,更能引导自动化的方向,而不是感觉它像一个完全不可控的天外来物。
他进一步指出,所有企业软件最终都会汇集到个体用户的操作界面上。“无论如何,一切最终都会落到一个运行在你本地电脑上的智能体可以与之交互的界面上,比如你的浏览器或文件系统。”他随后透露了一个关键信息:“这就是为什么 OpenAI 正在构建我们自己的浏览器‘Atlas’。通过端到端地严格控制,我们可以为企业提供安全的、智能体化的浏览体验,这是一种在现场实施工程师尚未完成全面部署前,就能以智能体方式访问各种系统的途径。”
5. 智能体开发的三阶段
那么,如何跨越这个人类瓶颈?Embiricos 提出了一个三阶段发展路径。
第一阶段:精通软件工程。 “首先,让智能体在软件工程和编码领域表现出色,因为 LLMs 正好擅长这个。”这是当前正在发生的阶段,为智能体打下坚实的基础。
第二阶段:赋能探索者。 “接下来,我们要认识到,让一个智能体变得更通用,使用计算机是其核心能力,而编码是智能体使用计算机的最佳方式。”他解释说,这意味着要将为工程师打造的灵活工具,开放给任何愿意探索和修补的非编码人员。“这个阶段的核心是,不为特定工作流过度封装产品,而是提供一个开放的工具,让早期用户去创造性地发现它的用途。”
第三阶段:无缝产品化。 “最后,一旦我们看到哪些用法是有效的,我们就可以构建你所说的那种高度产品化的体验。”在这个阶段,AI 功能将被封装成针对特定场景、开箱即用的产品,普通用户无需任何学习成本就能直接受益。
“我认为,我们将在未来几个月内,以极快的速度跑完这整个一、二、三阶段的旅程。”他预测道。
6. GPT-5.2 Codex 如何改变了 OpenAI 的一切
Embiricos 详细描述了 OpenAI 内部工作流程的一次阶跃式变革,这次变革的催化剂是 GPT-5.2 Codex 的发布。
“在 GPT-5.2 Codex 之前,我们使用的 AI 编程功能主要是像 Tab 自动补全,或者与模型进行‘结对编程’。”他回忆道,“在那种模式下,你仍然需要坐在电脑前,手放在键盘上,AI 只是帮你处理一些小任务。”
然而,从去年 12 月的 GPT-5.2 Codex 开始,一切都变了。“我们突然切换到了一个全新的模式:我可以直接将整个任务完全委托给它。我会和它一起制定一个计划,确认好它要执行的规范,然后我就让它自己去烹饪了。”
这种工作方式的转变是颠覆性的。“这是一种截然不同的工作方式。所以我们开发了上周发布的 Codex 应用,就是为了创造一种在人体工程学上更适合委托任务的用户体验。”
他给出了一个内部数据:“我认识的大多数人基本上已经不再打开编辑器了。绝大多数代码是由 AI 编写的。人类现在可能只是去定义模块间的接口,或者与 AI 协作制定计划,但代码本身,已经不再由人类编写了。”
7. IDE 的终结?
既然工程师不再亲手编写代码,传统的集成开发环境的地位也变得岌岌可危。
“如果你说的 IDE 是指一个非常强大的编辑器,那么我们特意没有在 Codex 应用中内置编辑功能,因为我们想让它的使用方式非常明确。”Embiricos 解释道。新的工作重心不再是编辑代码,而是管理和审查。
他强调了两项正在变得越来越重要的技能:
计划审查: “在委托模式下,你想要做什么的规范或计划,变得比以往任何时候都重要。”他介绍,Codex 现在有一个突出的“计划模式”,智能体会先提出一个详细的执行方案,并向用户提问以确认关键决策。
自动化代码审查: 为了解决 AI 可能产生大量低质量代码的问题,OpenAI 内部形成了一个惯例:让 Codex 审查自己生成的代码。“Codex 在这方面做得非常好,我们特意训练模型擅长代码审查,它能提供信噪比极高的反馈。”如今,在 OpenAI,几乎所有的代码在提交时都会由 Codex 自动进行审查。
“一个有趣的现象是,”他补充道,“人们有时会通过让 Codex 去审查另一个模型生成的代码,来体会我们模型的强大之处。看完之后,他们通常会觉得,‘好吧,我应该直接用 Codex 来写代码。’”
8. 建立一个开放的护城河: agents.md 的悖论与公开竞争
在如今这个 AI 工具层出不穷、用户可以轻松切换的时代,如何建立产品的“护城河”?Embiricos 坦言,OpenAI 采取了一种反直觉的策略:主动拥抱开放。
他解释说,目前的编码任务大多是封闭的或片段式的,这意味着用户可以轻易地在不同工具间切换。然而,真正的粘性将来自未来。“当智能体开始与 Sentry、Google Docs 等其他系统交互时,它们会变得更有粘性。因为让企业信任并授权一个智能体去连接这些系统,是一个具有粘性的决策。”
尽管如此,OpenAI 的核心策略仍然是开放。“我们的 Codex 核心框架是开源的,我们一直在努力让用户更容易切换到其他工具。”他举例说,OpenAI 创立了一个名为 agents.md 的文件约定,用于存放给智能体的指令。“我们没有叫它 codex.md,就是希望所有智能体都能使用它。现在除了一个老熟人,几乎所有智能体都采纳了。”
这种策略对于传统的风险投资逻辑来说是难以理解的。
“我完全理解,”Embiricos 回应道,“OpenAI 是一个非常有趣和不寻常的工作场所。从我们的角度来看,我们的工作是‘智能的分发’。”
他解释了这种策略背后的逻辑:“我们把所有精力投入到训练这些模型中,然后我们把模型提供给我们的竞争对手。因为我们玩的是一个非常长期的游戏,如果竞争变得更激烈,我们也能从中学习,这对我们实际上是有帮助的。”
尽管如此,他依然充满自信:“我们拥有巨大的分发优势(ChatGPT)、模型能力优势和对新模型的优先使用权。我们在争取胜利,但同时也在玩一个更长远的游戏。”
9. 谁是工作的引力中心?
Embiricos 认为,未来的市场格局不会是百花齐放,而是少数几家巨头占据主导。
“我曾在 Dropbox 工作,在 Slack 崛起之前,我们曾思考,用户是应该在 Dropbox 里直接评论文档,还是去 Slack 里讨论文档?”他回忆道,“从最优的角度看,在视频的特定时间戳上或文档的特定段落旁评论,显然更高效。然而,我们看到的是,Slack 成为了人们交流的绝对‘引力中心’。没人想去文档里评论,我只想 Slack 你。即便效率更低,但巨大的引力把所有交互都拉向了 Slack。”
他预测,AI 智能体领域也将发生同样的故事。“我不认为一家公司会需要 12 种不同的智能体,让员工去搞清楚该和哪一个对话。那样他们永远无法形成使用习惯。”他断言,“未来会有一个你可以和它谈论任何事情的超级助理。它会成为工作的引力中心,人们会围绕它分享最佳实践,举办黑客松。最终,市场上只会剩下少数几个这样的平台。”
10. 给投资者的建议:SaaS 并未消亡,但关系与记录是新的护城河
对于“SaaS 已死,模型层将通吃一切”的论调,Embiricos 提出了自己的框架。
“我的问题是:这家 SaaS 公司是否与终端用户建立了关系?如果答案是肯定的,我认为它就不会消失。”他进一步补充,“或者,这家 SaaS 公司是否掌握了某个极其重要的记录系统?那它可能也不会消失。”
他认为,在这两种情况下,SaaS 公司的价值甚至比以往更重要。但他也发出了警告:“反过来说,如果这家 SaaS 公司只是一个胶水层,既不拥有用户关系,也不掌握核心记录系统,那我就会对它感到更担忧。”
他还指出,AI 时代对创始人的要求也发生了变化。“现在,构建好产品相对容易了,你必须回归本源,去投资那些真正思考过分发、拥有深厚领域知识、知道为特定客户构建什么的创始人。”
11. 快速问答
过去12个月,你改变最大的想法是什么?
“我曾以为我们会通过多模态(视频、音频)与 AI 交互。我完全错了。我意识到,基于代码让智能体操作电脑,才是当前正确的路径。这彻底改变了我对如何将 AI 带给普通人的思考。”
在 Codex 最艰难的产品决策是什么?
“最痛苦的决定是取消 Codex Cloud 的无限使用。当我们最终设定了合理的用量限制后,虽然只有极少数用户反对,但他们的负面声音在社交媒体上传播得很广。我学到的惨痛教训是:你不能让任何东西无限免费太久。”
5年后再看今天,工程或产品领域有哪些做法会显得很可笑?
“第一,手动编辑代码。第二,可能更有争议,是手动管理部署和监控。我认为很多创业公司会诞生于一个全新的、完全由 AI 管理的技术栈之上。未来,你创业的方式可能就是先雇佣一个智能体,让它去构建。”
智能体的护栏应该由谁提供?
“两者都会有。我们正在投入巨大努力构建护栏,比如我们是唯一关心编码智能体操作系统级沙盒的公司,并且正在开源我们为 Windows 构建的方案。但我们提供的方案不会是万能的,一定会有第三方为特定的企业需求提供定制化的护栏。”
参考:https://www.youtube.com/watch?v=S1rQngjpUdI
这次访谈揭示了AI正在如何深刻重塑软件开发乃至整个工作范式。对于更多关于AI前沿、开发者动态的讨论,欢迎关注云栈社区的开发者广场。