5 月 7 日,OpenAI 给 Codex 正式推出了 Chrome 扩展。
坦白说,刚看到这条消息,我并没觉得有多兴奋。可真的上手用了一段时间后,才发现这玩意儿确实好使。Codex 这个 OpenAI 旗下的编码 Agent,去年底就已经问世了。经过 5.5 版本迭代后,不论是生成速度还是代码质量都提升明显,尤其是它的 Computer Use 功能,一口气帮我处理了好多繁琐的操作步骤。
话说回来,Chrome 扩展这个形态,市面上的 AI 浏览器插件早就一抓一大把了。有意思的是,当 AI 编码 Agent 也开始干这个,味道就完全变了。

一个被忽略的数字
先说个数据,方便建立坐标。
Codex 现在的周活跃用户是 400 万。而年初这个数字大概只有 50 万——也就是说,5 个月涨了整整 8 倍。
这个增长速度本身就足够吓人了。但 OpenAI 这次推出 Chrome 扩展,背后折射出的产品判断才更值得琢磨:他们不打算在 IDE 里继续内卷了。
回看 Codex 的入口演进路线:最早是终端,然后到 IDE 插件,再扩展至 Web 云端版本。今年 2 月推出 macOS app,5 月初上线 Computer Use 让 Codex 直接操控整台电脑,5 月 7 日接着就是这次的 Chrome 扩展。

每一步都在朝用户实际工作的地方逼近。
OpenAI 自己在产品文档里给出了一个关键的观察结论:推出 Computer Use 后他们发现,绝大多数日常工作流其实都发生在浏览器里,而不是 IDE。
这话乍听像废话,但仔细一想——过去两年所有押注“AI 编码 Agent 主场是 IDE”的产品,其实都站在一个正在缩小的池塘里。

它具体能在 Chrome 里干什么
按照 OpenAI 官方文档的描述,Codex Chrome 扩展能够利用你已经登录的 Chrome 会话执行任务。比如,打开 Salesforce 根据通话记录更新账号信息、刷 Gmail 提取关键数据、登录公司内部工具——这些它都能干。
它还可以在多个标签页后台并行工作,不占用你正在使用的浏览器界面。它能借助 Chrome DevTools 测试 Web 应用,能跨标签页收集上下文信息进行综合判断,也能向网页上传文件。
最让我有体感的就是“后台并行”这一点。
你在 Codex 里派个任务,它会自己开几个标签页去干活,而且所有相关标签页会自动归到同一个 Chrome 标签组里。你这边可以继续看 YouTube,它就在那个标签组里独立跑。
这跟以前的 AI 浏览器插件完全不是一个路子。以前的插件要么直接抢你的鼠标键盘,要么彻底霸占整个浏览器,你只能干瞪眼等它完事。而 Codex 这次的设计理念是——“我干我的,你忙你的,互不打扰”。
这是产品哲学的差异,不是单纯的技术细节。

权限给得还算克制
我比较关注的另一个点是权限管控。让 AI 直接操作我已经登录的 Chrome 浏览器,这事的潜在风险有多大,不用我多说。
OpenAI 这次的处置算得上克制。默认情况下,每遇到一个新域名,它都会先弹窗询问你一次。你可以选择“仅此次允许”,或者勾选“始终允许”。想拉黑某个网站?在设置里单独管理就行。
还有一个叫“始终允许浏览器内容”的全局开关,开启后 Codex 无需询问就能访问任何网站。但官方文档主动给这个开关标注了“风险更高”的警示。


最后这点我认为是见水平的地方。浏览历史是隐私级别最高的数据,OpenAI 主动把一键放权的风险敞口给堵上了。
这个扩展的权限范围里,包含了 debugger 访问、标签组管理、书签和下载管理。把这些权限合在一起,它理论上能做的事远远超出了“帮你写代码”。
5 个入口怎么分工
到目前为止,Codex 共有 5 个入口。
| 入口 |
干什么的 |
| Chrome 扩展(新) |
已登录的真实网站任务 |
| In-app browser |
本地开发服务器、文件预览、公开页面 |
| IDE 插件 |
编辑器内代码 |
| CLI |
命令行自动化 |
| Web 云端 |
浏览器内的 Codex |
普通用户最容易犯迷糊的就是前两个——Chrome 扩展和 In-app browser。OpenAI 文档里说得很明白:Chrome 负责“需要登录态的真实网站”,In-app browser 负责“本地开发环境和公开页面”。二者边界划得干净利落。


OpenAI 在下一盘什么棋
如果只盯着 Chrome 扩展这一个产品看,它无非就是个挺好用的浏览器 AI 助手。
但把它跟 OpenAI 这一年来发布的其他产品拼在一起,画风就截然不同了。
ChatGPT 你天天用,Codex 是编码 Agent,Atlas 是 OpenAI 自家的浏览器项目。这三条线我以前一直觉得是平行推进、各自为战。直到 Engadget 的报道中点出了一句话:Codex Chrome 扩展是 OpenAI “超级 app” 战略的中间步骤。
OpenAI 真正在做的,很可能是把 Codex、ChatGPT 和 Atlas 整合进同一个入口。最终的形态大概是这样——你打开浏览器,它就是一个能跟你对话、帮你写代码、替你操作所有网站的统一界面。
这听起来像极了 Apple 那种“软件+服务+设备”的打包逻辑。只不过 OpenAI 要打包的,是你工作流里所有的交互入口。