
OpenAI 旗下的 Codex 进行了一次堪称改头换面的重大更新。它不再只是一个在你提出需求时生成代码的工具,而是直接“上手”,变成了一个能操作你电脑、调度多种应用的智能助手。
官方的宣传语颇为直接:“Codex for (almost) everything.” 这次更新的核心,正是将 Codex 的能力边界从“代码生成”狠狠地扩展到了“桌面操作”。这意味着它开始真正地“工作”了——它能使用你电脑上的应用,在不同工具间切换,能把任务留到几天后再继续,甚至能根据你过往的习惯给出下一步建议。这种种能力的叠加,不禁让人联想到另一个流行的概念,也让 Codex 有了“龙虾(OpenClaw)上身”的既视感。

01 从写代码到“动手干活”
这次更新最核心的亮点在于,Codex 开始直接操作你的电脑了。
根据官方介绍,Codex 现在可以通过“看到屏幕、点击鼠标、输入键盘”的方式,直接使用你电脑上的任何应用。它拥有自己的光标,可以在图形界面上完成点击、输入等操作,而不再仅仅依赖于调用有限的 API 接口。
可以这样理解:过去,AI 助手的能力很大程度上受制于它所集成的 API。一旦遇到没有开放接口的设计软件、本地应用或内部系统,它就无能为力。但现在,Codex 可以直接绕过这层限制,像真人用户一样“动手”操作界面。
更重要的是,这种操作并不会打断你的工作。多个 AI Agent 可以在后台并行运行,在不同应用之间切换任务,而你依然可以正常使用电脑。这一功能目前已在 macOS 上抢先推出。

此外,这一版本的 Codex 开始直接与网页内容交互。其桌面应用内置了浏览器,你可以直接在网页上圈出某个按钮、标注某段区域,甚至写下评论,将这个“位置”信息本身作为指令,让它据此修改界面、调整逻辑或检查问题。这对于前端设计和游戏开发尤其有用。
同时,图像生成能力也原生集成进来。Codex 现在可以直接使用内部的 gpt-image-1.5 模型生成和迭代图像,用于产品设计、界面草图或游戏素材,整个过程无需额外的 API 调用。

围绕开发生命周期,这次更新补全了许多原本分散的环节。例如,它可以处理 GitHub 的评审评论、打开多个终端标签、通过 SSH 连接远程开发环境、在侧边栏直接预览 PDF 和文档等。一个汇总面板能让用户清晰看到当前任务的状态、所用的信息以及产出结果。
在智能 & 数据 & 云领域,强大的工具集成能力至关重要。Codex 此次扩展了插件生态,接入了超过 90 个插件,包括 JIRA、GitLab、Microsoft SharePoint 等,让任务能够在不同工具间顺畅流动。

另一个关键的升级是任务的连续性。Codex 现在可以将任务“安排到未来执行”。它可以复用已有的上下文,在几天甚至几周后的某个设定时间点自动唤醒,继续执行之前未完成的任务。这意味着之前的所有讨论、整理的工作成果都不会丢失,可以直接带入后续步骤。
与此同时,记忆能力开始生效。Codex 会记录你的偏好、修改习惯以及整理过的信息。当它掌握了足够的上下文后,就能从不同工具中提取信息,识别出需要跟进的评论或任务,并整理出一份有优先级的行动建议,告诉你该如何继续推进一个项目。

02 不只是功能升级,更是工作流的重塑
乍一看,上面提到的功能点似乎各不相同,但它们共同指向一个深刻的变化:工作流的整合与自动化。
过去,Codex 通常被视为开发流程中的一个特定环节——写代码、解释代码。你需要手动在不同的工具(如 IDE、浏览器、终端、沟通软件)之间切换,将复杂的任务拆解成一个一个片段交给它处理。
但现在,这些环节开始被连接起来了。Codex 可以在应用内操作,在网页上获取信息,在终端里运行命令,再把结果带回到代码中。更重要的是,它可以把这些步骤“记住”并延续下去,在几天后继续推进同一个项目。
简单来说,原本分散在不同工具、不同时间段内的零散工作,开始被串成一条连续、自动化的流程,并被统一收纳入 Codex 这个系统中。这也是为什么有观点认为,Codex 正在演变为知识工作的“操作系统”。

此外,相比接入更多的应用,有人认为记忆层才是这次更新的关键。一旦 AI 开始学习并理解你的工作方式,并在后续任务中复用这些模式,它会变得越来越贴合你的个人习惯,形成强大的用户粘性。
这或许预示着一个新趋势:未来 AI 领域的竞争,可能不再仅仅围绕模型本身的“智商”高低,而在于谁能更深入、更智能地嵌入用户的工作流程,并持续学习“你”是如何工作的。

03 “超级应用”的竞赛已经开始
谈到深入工作流的能力,很多人会立刻想到 OpenClaw(“龙虾”)。两者的方向确实高度一致:都致力于让 AI 去执行任务,而不仅仅是回答问题。
区别在于实现路径。OpenClaw 更侧重于“调用工具”,通过 API 将不同服务串联起来;而 Codex 这次更新则是将 AI 直接嵌入操作系统内部,让它能以最接近人类用户的方式操作应用。所以,说它是“龙虾上身”很形象——它把这套强大的自动化逻辑并入了系统本身。
这种方向的趋同或许与 OpenClaw 创始人加入 OpenAI 有关,但更可能是 OpenAI 自身生态战略的体现:打造一个能搞定几乎所有事情的“超级应用”。官方数据显示,Codex 每周已有超过 300 万用户,其中近一半的使用场景是非编码任务。这次更新,可以看作是迈向这个宏大目标的关键一步。
从上线节奏看,更新正在分阶段推进:桌面控制功能目前仅限于 macOS;记忆和上下文感知建议功能则先向美国用户开放。尽管能力仍在铺开,但方向已非常明确:Codex 正在从一个写代码的工具,演变成一个可以跨应用、跨时间持续完成任务的一体化系统。
这条赛道正变得日益拥挤。几乎在同一时间,Perplexity AI 发布了名为“Personal Computer”的 Mac 桌面应用,同样试图整合本地文件、原生应用和浏览器操作,让 AI 在统一环境中执行任务(其默认的协作模型已更新为 Claude Opus 4.7)。Anthropic 的产品也已具备较强的 Agent 能力,尽管尚未形成直接操作桌面的统一系统。
国内各大厂商也在积极布局类似的 人工智能 Agent 体系,并开始探索让 AI 直接操作本地环境。说到底,大家的目标一致:让 AI 突破对话的界限,真正进入并改变实际的工作环境。
对于开发者广场的广大技术从业者而言,这意味着我们的工作方式即将迎来又一次深刻的变革。从聊天到写代码,再到操作应用、跨时间管理项目,当 AI 开始真正“动手”,它所扮演的角色就从一个被动的工具,转变为一个主动的协作者与执行者。
“龙虾”上身的 Codex,或许只是这场变革大戏中引人注目的一幕。