云栈社区»论坛 › 站务中心「 Forum Service 」 › Codex官方工作流详解：从Computer Use到AI科研的实战指南 ...

发回帖发新帖

4437 积分	0 好友	581 主题

发消息

Codex官方工作流详解：从Computer Use到AI科研的实战指南

发表于 2026-6-14 01:27:59 | 查看: 112| 回复: 0

这段时间以来，Codex 在社交媒体上好评如潮。有网友发现，现在邀请一位朋友加入 Codex，就可以重置速率限制。即便受邀用户并非新用户或订阅用户，只要通过你的链接打开 Codex 并发送几条消息，你就能获得一次重置机会。

邀请好友重置速率限制的Codex界面截图

除了拉新用户送福利的活动，Codex 官方也即将迎来大降价。根据外媒援引知情人士的消息，OpenAI 正在考虑大幅降低其向用户收取的费用，以从竞争对手Anthropic那边争取客户。报道提到，OpenAI 可能会降低 Token 的价格，但关于大幅降价的讨论仍在进行中。

华尔街日报关于OpenAI考虑降价的新闻截图

毕竟，Codex 现在是 OpenAI 最优质的用户拉新平台。和 OpenAI 官方披露的数据一样，ChatGPT 用户数已突破 10 亿，而 Codex 的周活用户刚达到 500 万，相当于 200 个 ChatGPT 用户里，只有 1 个人点开了侧边栏里的 Codex。「用不上」是一方面，更多的人可能还是不知道该怎么用，或者不清楚 Codex 能做什么、哪些是 ChatGPT 做不好而只有 Codex 才能完成的任务。

Codex开发环境界面截图，展示项目导航和代码编辑器

Codex 官方也听到了用户的反馈，一边高调宣传即将并入 ChatGPT。未来我们打开全新大改版的 ChatGPT 应用时，可以选择用 Codex 还是 ChatGPT 来回答问题。

另一边，他们最近在 OpenAI 官网一口气更新了十几个真实世界的工作流程，从常见的部署网页和应用、直接构建 Mac 或 iOS 应用，到大型的项目管理、长达 150 个小时的科研任务，以及各种琐碎的日常工作业务，都有对应的使用案例。这些教程是帮助我们快速上手 Codex 的最佳指南，很好地回答了「 Codex 能做什么」和「如何使用 Codex 」的问题。

Computer Use，让 Codex 控制你的电脑

“Hey Siri，打开微信发消息给妈妈，说 XXXX。”

“请先解锁 iPhone。”

Siri 做不到，Codex 现在也做不到操作微信。但 Codex 的 Computer Use 功能，主要允许 AI 像我们一样操作电脑界面，通过点击、查看和输入来完成任务。这项目适合的场景包括跨应用任务，比如收集笔记、更新记录、在不同位置间复制细节、回复信息等。

Codex询问用户是否允许其使用计算器应用的权限弹窗截图

在官方的案例里，他们举的例子有简单地放首音乐，也有涉及在不同应用之间切换的任务：

@Computer 放点音乐帮我集中注意力。
@Computer 请帮我把 Notes 里的面试笔记添加到飞书里。
@Computer 请查看我的企业微信并添加提醒，提醒我今天结束前需要完成的所有事项。

具体的使用方式，我们要先在 Codex App 里找到 Computer Use 并确认其已开启，接着在对话框输入指令时，开头要加上 @Computer，或者提及特定的应用程序，例如 @Slack 或 @Messages 等。选择好 Computer Use 插件后，描述一下任务和你想要的最终结果。当 Codex 需要访问权限时，批准它，然后让它在后台继续执行任务。

Mac应用商店中Computer Use插件的详细介绍页面截图

使用 Computer Use 有几个注意事项：确保运行时 Mac 不会锁定，或者在 Codex 里打开「锁屏操作」功能。当 Codex 使用电脑上的应用时，我们可以在自定义设置中告诉它默认浏览器是哪个。此外，不要使用两个 Computer Use 的任务线程来控制同一个应用。每一个线程结束后，都可以要求 Codex 总结并优化该任务，甚至将这套工作流程定义为一个可重复的模式。

给 Codex 一个能一直跑下去的目标

平时让 AI 干活，很需要我们站在旁边盯着，它做一小步便停一下，问下一步该怎么办，我们得一直搭把手。/goal 功能想解决的就是这件事：给 Codex 一个长期目标，让它自己照着这个方向一直做下去，干完一轮也不停歇。

Codex中设置长期目标的功能界面截图

官方指南里，几个典型的用法是那种比一句提示词大、又比一整张待办清单小的任务，要求目标明确、能自己验证、并且做到什么程度算结束都定义得非常清晰。

项目迁移：不管是把游戏搬到新技术栈、把移动应用搬到新平台，还是把整个代码库换个框架，都可以用 /goal 让 Codex 把迁移过程一口气跑完。
做原型：从零做一个新应用、新游戏或新功能时，可以用 /goal 让 Codex 交出一版打磨过的初稿。你可以写一份 PLAN.md，把想做成什么样讲清楚，让它照着做。
调提示词：手上有一套测试集，就能用 /goal 拿评测结果来优化提示词。Codex 会去寻找失败的案例、修改提示词、重跑评测，一直迭代到分数达标，或者满足了你定下的收尾条件为止。

要写好一个能稳定运行的目标，关键在于：

先给它一个明确目标和收尾条件；
告诉它先去读哪些文件、文档、issue、日志或计划；
定好用哪条命令、哪个产物来证明进度；
让它分阶段做，顺手记一份简短的进度日志；
过程里我们随时用 /goal 查看状态；
当任务跑完、卡住或者要换方向时，再暂停、继续或清除它。

用 GPT Image 2 来做 PPT

做 PPT 最磨人的一步常常是排版。Codex 自带两个强大的技能：$$slides 用 PptxGenJS 直接读写 .pptx 文件，$$imagegen 负责生成配图。OpenAI 官方给的参考提示词如下：

使用 $$slides 和 $$imagegen 技能，按以下方式编辑此幻灯片：
- 如果存在，请在每张幻灯片的右下角添加 logo.png 文件
- 在幻灯片 X、Y 和 Z 上，将文本向左移动，并使用图像生成功能在右侧生成插图（风格：抽象、数字艺术）。
- 尽可能将文本保留为文本，将简单的图表保留为 PowerPoint 原生图表。
- 添加以下幻灯片：[在此处描述新幻灯片]
- 在新幻灯片和新文本中使用现有品牌标识（颜色、字体、布局等）。
- 将更新后的演示文稿渲染成幻灯片图像，检查输出结果，并在交付前修复布局问题。
- 在交付之前运行溢出和字体替换检查，尤其是在牌组密集的情况下。
- 创建一批相关图像时，保存可重复使用的提示或生成说明。

除了从零开始，一页页描述内容和整体风格，你只需把 Logo、图片丢进同一个文件夹方便它取用。我们还可以让 Codex 来处理周报、月报、季报这类定期更新任务，让它总结一份 guidelines.md 确定好内容、结构和更新方式，再配合别的技能拉取对应的数据。比如给股东的季度汇报，换上新数字和洞察就行。修改现成的 PPT，也可以直接在对话框里，要求 Codex 修正间距、文字错位这类毛病。

Codex的Presentations技能插件页面截图

让 Codex 照着截图做网页

手上有几张截图、一份简短的设计说明，或者几张寻找灵感的参考图，Codex 就能照着做成响应式界面，同时它会顺着项目里已有的写法来，使用原有框架和语言，而不会另起一套。再配上 $playwright 工具，Codex 能在真实浏览器里打开页面，按不同屏幕尺寸跟我们上传的截图逐一对照，反复调整直到接近为止。

参考提示词如下：

请以我提供的屏幕截图和注释为依据，在当前项目中实现此用户界面。
要求：
- 重用现有的设计系统组件和标记。
- 将屏幕截图转换为此存储库的实用程序和组件模式，而不是发明一个并行系统。
- 间距、布局、层级和响应行为要紧密匹配。
- 尊重仓库的路由、状态和数据获取模式。
- 使页面在桌面和移动设备上都能响应。
- 如果截图中的任何细节不明确，请选择最简单但仍符合整体方向的实现方式，并简要说明假设。
验证：
- 将最终的用户界面与提供的屏幕截图进行比较，包括外观和行为。
- 使用 $playwright-interactive 检查 UI 是否与引用匹配，并根据需要进行迭代，直到匹配为止。

从零做一个在浏览器跑的游戏

做游戏大概是能看出 Codex 不仅会写代码还懂设计的场景之一。一个真正的游戏，要有写下来的玩法概念、渲染层、前端外壳、后端状态、美术素材，还得不停地调整画面和手感。

动手搭架子之前，先让它写一份 PLAN.md，把游戏拆成具体几块：玩家目标、核心循环、操作和输入、胜负条件、难度和成长、视觉方向、技术栈和部署假设、里程碑的先后顺序。再写一份 AGENTS.md，按照官方的教程，可以参考下面的写法：

游戏名
<游戏类型>
技术栈：
- 前端 NextJS（部署在 Vercel）
- 渲染用 <填技术>
- 后端 Fastify + WebSocket（部署在 <平台>）
- 数据库 Postgres，缓存和 pub/sub 用 Redis
- 生成式 AI 功能走 OpenAI

约定：
- 每做完一个功能就用 build / test 命令验一下
- 做新功能时照着 PLAN.md 来
- 把思路和决定记在 .logs 里，迭代时回头查
- 用 playwright 测画面效果，不对味就改
- 用 imagegen 出素材，每出一批就把 prompt 存进 .prompts，方便以后接着出同款
- 用 Context7 MCP 拉 <渲染框架> 的文档

把 AGENTS.md 里提到的技能都装上：$$imagegen 出美术素材，$$playwright 在真实浏览器里测游戏，$openai-docs 拉最新的 OpenAI API 文档，需要的话再加个 Context7 MCP 拉渲染框架的文档。接下来 Codex 会照着计划先做出第一版。如果要生成的图很多，这一版可能得跑上好几个小时。不过借由 Playwright 的能力，Codex 可以自己在浏览器里试玩、验证游戏效果，中间基本不用我们管。计划写得越细，第一版出来就越像样。我们让它自己写了一份游戏的 Plan.md，然后生成了一个几乎可以直接上线的小游戏。

一个太空主题的浏览器游戏demo，展示了游戏画面、开发日志和结算界面

Use $playwright-interactive, $imagegen, and $openai-docs to plan and build a browser game in this repo.Implement PLAN.md, and log your work under `.logs/`.

除了小的网页游戏外，使用 Codex 提供的构建 iOS App 插件，我们也能通过一句话在 Codex 内查看和测试 iOS App。

让 AI 自己跑科研

Codex 能干的远不止写代码，它也能在科研领域充当一个长期工作的研究助手。由用户给出方向和判断，它去实现、取证、打分、反复迭代。其中一个案例是改造模型架构。假设你有个关于蛋白质折叠的想法，「让模型多表示一些高阶的几何结构，会不会学得更好」，这种想法不是一遍能写完的，需要反复尝试。用 Codex 的 Goal Mode，给它三样东西：一个划好边界的科学方向、一个能跑的基线模型、一套能自动打分的基准，它就会自己照着这个目标一路提升分数，实现、测试、记实验、查故障、再修改。

展示1-单纯形、2-单纯形和3-单纯形三维几何结构图，用于蛋白质折叠算法研究

官方给出的例子里，Codex 连着跑了 150 多个小时，自主产出了一个名叫 SimplexFold 的实验性架构。另一个案例是给药物靶点排序。这类任务的麻烦之处在于证据散落在十几个数据库里，遗传学、临床、文献、表达数据各管一摊。借助 Life Science Research 插件，Codex 能并行去各家数据库取证，为每条证据线按 1-5 分打分，最后汇成一张打分表加一份排名，还能配上热力图等图表。

Codex用于药物靶点优先排序的界面截图，展示了使用生物信息学工具进行科研任务的流程