OpenAI 为其 Codex 桌面应用发布了一次重量级更新,官方将其定位为“几乎能处理一切的 Codex”,旨在将其打造成覆盖软件开发全周期的更强伙伴。本次更新一次性地引入了六项核心能力:
- Computer Use: 使其能够在你的 Mac 上自行操作其他应用程序。
- 内置浏览器: 可预览 Codex 生成的前端页面,并直接在页面上留下评论。
- 图像生成: 集成
gpt-image-1.5 模型,为页面生成配图。
- 90 多个新插件: 集成了从 Atlassian 到 Slack 的大量外部服务。
- 记忆: 记住你的个人偏好,无需重复说明。
- 自动化: 能够为自己安排跨天甚至跨周的后续任务。
根据官方数据,Codex 目前每周已有超过 300 万开发者 使用。Codex 负责人 Thibault Sottiaux 在媒体预发布会上还透露了另一个关键数据:50% 的用户已经开始使用 Codex 处理非编码任务。考虑到 OpenAI 近期完成 1220 亿美元融资并宣布转向“超级应用(Super App)”战略,此次 Codex 更新无疑是该战略在产品层面的第一步实质性落地。
用你的 Mac:Computer Use 能力
Codex 此次获得了 Computer Use 能力,意味着它可以模拟用户操作,在你的 Mac 上点击鼠标、敲击键盘、读取屏幕内容。这一过程在后台运行,不会抢夺光标控制权,因此你完全可以同时在另一个应用中处理其他工作。
官方文档列举了几个典型应用场景:测试一个 macOS 应用、在 iOS 模拟器中运行完整流程、使用浏览器验证 Web 服务、修改只能通过 GUI 调整的应用设置、复现仅在图形界面下出现的 Bug、跨多个应用程序执行一个复杂流程。
在官方演示中,Codex 在 Xcode 中编译并运行一个名为 CloudTicTacToe 的游戏。通过 UI 操作测试后,它发现人类玩家点击一次后,电脑会连续落下两子。随后,Codex 返回代码,修改 humanMove 分支的逻辑,并再次运行以验证修复结果。
演示视频:Codex 在 Xcode 中发现井字棋游戏的 Bug 并修改代码。
首批 Computer Use 功能仅面向 macOS 用户开放,且欧盟、英国、瑞士地区暂不支持。启用此功能需要先安装 Computer Use 插件,然后在 macOS 系统设置中为 Codex App 授予“屏幕录制”和“辅助功能”权限。每次 Codex 尝试操作一个新的应用程序时,都会向你请求许可,你可以勾选“始终允许”以便下次直接使用。
有趣的是,Anthropic 在今年 3 月也为 Claude 推出了 Computer Use(研究预览版),同样运行于 macOS,供 Pro 和 Max 订阅用户使用。但两家的路径截然不同:Anthropic 将 Computer Use 作为 Claude 的一个独立模式,而 OpenAI 则选择直接将其打包进 Codex,与其他五项能力一同发布。
内置浏览器:实时预览与评论
Codex 此版本内置了一个浏览器,目前主要面向本地开发,可以打开你在 localhost 启动的前端页面或其他无需登录的公开页面。这样一来,开发者可以直接预览 Codex 刚生成的页面效果,甚至在页面上点击并留下评论,Codex 读取评论后会继续优化代码。
演示视频:内置浏览器打开一个乐高收藏品展示页面,右上角“Commenting”即为评论入口。
OpenAI 在博客中表示,未来计划将浏览器的能力扩展到整个万维网。届时,Codex 将能够直接在开发机上自动打开网站、登录账户、截图以及按步骤执行用户流程。目前的版本能力还仅限于 localhost。
自己画图:集成 gpt-image-1.5
Codex 此次接入了 gpt-image-1.5,这是 OpenAI 在去年 12 月发布的图像生成模型。你可以直接让 Codex 为你的页面生成配图。生成完成后,Codex 会自动将图片插入项目,并顺手调整相关的 CSS 样式以适配。
应用场景可以覆盖产品概念图、前端 Mockup、游戏素材等。OpenAI 的现场演示并非生成单张图片,而是为一整套汉堡店网站生成了风格统一的系列素材。这超越了单点图片生成,更像是让 Codex 完成一套具有固定风格的设计素材包。
演示视频:Codex 为一家费城汉堡店生成 Hero 图,使其与页面的暖色调酒吧风格相匹配。
90+ 新插件:构建工作流枢纽
在 Codex 的体系中,插件(plugin)是三类元素的组合:一组技能(赋予 Codex 的任务说明)、一组应用集成(操作权限和 API 接口)以及一组 MCP 服务器(后端数据和工具源)。
此次更新一次性增加了 90 多个 新插件。OpenAI 在博客中点名提及的包括 Atlassian Rovo(管理 JIRA)、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、Neon by Databricks、Remotion、Render、Superpowers 等。
一个典型的演示场景是给出这样一条指令:“Can you check Slack, Gmail, Google Calendar, and Notion and tell me what needs my attention?” 一条命令横跨四个插件,本质上将 Codex 变成了每日站会的智能助理。
演示视频:Codex 输入框中提示正在使用 @CircleCI Diagnose 插件。
插件库中存在默认的执行优先级顺序。当你要求 Codex 执行一项涉及多个工具的任务时,它会根据排序自动选择首先调用哪个插件。生态位的竞争,正悄然发生在这个排序机制之中。
增强的开发者工作流
本次更新还引入了一系列提升开发效率的新特性:
- PR 评审:Codex 能够识别 GitHub PR 上同事写的 review comments,并逐条进行处理。
- 多终端标签:可以在 Codex 内开启多个终端并行执行任务。
- SSH 连接远程开发机:可以将 Codex 挂载到一台远程开发主机上(Alpha 阶段功能)。
- 侧栏文件富预览:PDF、表格、PPT、文档等文件可以直接在侧栏展开预览,无需打开外部应用。
- Summary Pane:展开可详细查看 AI Agent 的执行计划、使用了哪些源代码、产出了哪些交付物。
官方特别强调了文件预览功能的重要性。这意味着 Codex 开始处理“面向非开发者的产品交付物”:运行一个 Agent 生成一份 Excel 表格或一份 PDF 报告后,可以直接在界面内打开、截图并发送给相关人员。
演示视频:Codex 将 GitHub issue 按主题分类并导出为 .xlsx 文件,直接在侧栏预览。
记忆与自动化:向个人助理演进
两项相辅相成的新能力被一同推出。一项是 Memory,Codex 会记住你的偏好、修改历史,以及上一次花了很长时间才解释清楚的背景信息,下次无需重复。另一项是 Automations,这个概念并非全新,但此次有所进化:自动化任务可以复用之前已运行过的对话线程,将完整的上文带入后续执行。
一个自动化任务可以为自己安排几天后的下一次触发,也能够执行跨周的任务。在演示的 Pinned threads(置顶线程)中,有人用“PR babysitter”来监控团队未合并的 PR,也有人用“Customer feedback monitor”来盯紧 Slack、Gmail、Notion 中的客户反馈。

Automations 面板管理多个长期任务,左侧 Pinned threads 中钉着 PR babysitter 等任务。
Memory 和主动建议功能将首先面向美国用户推出,欧盟、英国、教育版和企业版将稍后跟进。伴随 Memory 一同到来的是主动建议功能:Codex 会根据你连接的插件、当前项目以及积累的记忆,在启动时就为你推荐几条值得今天开工的任务线索。
值得留意的战略信号
当被问及为何选择 Codex 而非 ChatGPT 来承载“超级应用”战略时,Sottiaux 的原话值得玩味:
“Codex 是我们最能打的智能体(agent),它本来就运行在你的电脑上,我们正沿着这条路继续扩展它的能力。”
另一个细节是,曾开发出热门开源本地 Agent 框架 OpenClaw 的作者 Peter Steinberger 已于今年 2 月加入 OpenAI,并负责领导个人智能体方向。OpenClaw 项目因其高度实用的设计在今年初迅速走红。而 Codex 此次更新中的主动建议、记忆、以及跨 Slack、Gmail、Notion 的开工提示等功能,其演进路径与 OpenClaw 的设计理念高度一致。
这清晰地表明:OpenAI 最强的智能体在哪里,其“超级应用”的战场就在哪里。
对于中文开发者而言,目前可以立即体验的是新增的插件、图像生成和多终端功能。Computer Use 短期内仅限美国地区 macOS 用户,但国内用户可以先安装应用等待区域扩展。Memory 功能的开放节奏也类似。
Codex 桌面应用的新版本已于发布当日向所有 ChatGPT 登录用户推送更新。Mac 用户可通过以下地址下载:
persistent.oaistatic.com/codex-app-prod/Codex.dmg
如果你对 AI 驱动的开发工具与智能体(Agent)的演进感兴趣,想了解更多前沿实践与深度讨论,欢迎来 云栈社区 的人工智能板块交流,这里汇聚了大量关注 Transformer 模型、RAG 应用与 AI 工程化的开发者。本次 Codex 集成的 gpt-image-1.5 等图像生成模型,也属于该领域的热点之一。
参考材料