找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4033

积分

0

好友

531

主题
发表于 6 小时前 | 查看: 6| 回复: 0

这段时间以来,Codex 在社交媒体上好评如潮。有网友发现,现在邀请一位朋友加入 Codex,就可以重置速率限制。即便受邀用户并非新用户或订阅用户,只要通过你的链接打开 Codex 并发送几条消息,你就能获得一次重置机会。

邀请好友重置速率限制的Codex界面截图

除了拉新用户送福利的活动,Codex 官方也即将迎来大降价。根据外媒援引知情人士的消息,OpenAI 正在考虑大幅降低其向用户收取的费用,以从竞争对手Anthropic那边争取客户。报道提到,OpenAI 可能会降低 Token 的价格,但关于大幅降价的讨论仍在进行中。

华尔街日报关于OpenAI考虑降价的新闻截图

毕竟,Codex 现在是 OpenAI 最优质的用户拉新平台。和 OpenAI 官方披露的数据一样,ChatGPT 用户数已突破 10 亿,而 Codex 的周活用户刚达到 500 万,相当于 200 个 ChatGPT 用户里,只有 1 个人点开了侧边栏里的 Codex。「用不上」是一方面,更多的人可能还是不知道该怎么用,或者不清楚 Codex 能做什么、哪些是 ChatGPT 做不好而只有 Codex 才能完成的任务。

Codex开发环境界面截图,展示项目导航和代码编辑器

Codex 官方也听到了用户的反馈,一边高调宣传即将并入 ChatGPT。未来我们打开全新大改版的 ChatGPT 应用时,可以选择用 Codex 还是 ChatGPT 来回答问题。

另一边,他们最近在 OpenAI 官网一口气更新了十几个真实世界的工作流程,从常见的部署网页和应用、直接构建 Mac 或 iOS 应用,到大型的项目管理、长达 150 个小时的科研任务,以及各种琐碎的日常工作业务,都有对应的使用案例。这些教程是帮助我们快速上手 Codex 的最佳指南,很好地回答了「 Codex 能做什么」和「如何使用 Codex 」的问题。

Computer Use,让 Codex 控制你的电脑

“Hey Siri,打开微信发消息给妈妈,说 XXXX。”

“请先解锁 iPhone。”

Siri 做不到,Codex 现在也做不到操作微信。但 Codex 的 Computer Use 功能,主要允许 AI 像我们一样操作电脑界面,通过点击、查看和输入来完成任务。这项目适合的场景包括跨应用任务,比如收集笔记、更新记录、在不同位置间复制细节、回复信息等。

Codex询问用户是否允许其使用计算器应用的权限弹窗截图

在官方的案例里,他们举的例子有简单地放首音乐,也有涉及在不同应用之间切换的任务:

  • @Computer 放点音乐帮我集中注意力。
  • @Computer 请帮我把 Notes 里的面试笔记添加到飞书里。
  • @Computer 请查看我的企业微信并添加提醒,提醒我今天结束前需要完成的所有事项。

具体的使用方式,我们要先在 Codex App 里找到 Computer Use 并确认其已开启,接着在对话框输入指令时,开头要加上 @Computer,或者提及特定的应用程序,例如 @Slack@Messages 等。选择好 Computer Use 插件后,描述一下任务和你想要的最终结果。当 Codex 需要访问权限时,批准它,然后让它在后台继续执行任务。

Mac应用商店中Computer Use插件的详细介绍页面截图

使用 Computer Use 有几个注意事项:确保运行时 Mac 不会锁定,或者在 Codex 里打开「锁屏操作」功能。当 Codex 使用电脑上的应用时,我们可以在自定义设置中告诉它默认浏览器是哪个。此外,不要使用两个 Computer Use 的任务线程来控制同一个应用。每一个线程结束后,都可以要求 Codex 总结并优化该任务,甚至将这套工作流程定义为一个可重复的模式。

给 Codex 一个能一直跑下去的目标

平时让 AI 干活,很需要我们站在旁边盯着,它做一小步便停一下,问下一步该怎么办,我们得一直搭把手。/goal 功能想解决的就是这件事:给 Codex 一个长期目标,让它自己照着这个方向一直做下去,干完一轮也不停歇。

Codex中设置长期目标的功能界面截图

官方指南里,几个典型的用法是那种比一句提示词大、又比一整张待办清单小的任务,要求目标明确、能自己验证、并且做到什么程度算结束都定义得非常清晰

  • 项目迁移:不管是把游戏搬到新技术栈、把移动应用搬到新平台,还是把整个代码库换个框架,都可以用 /goal 让 Codex 把迁移过程一口气跑完。
  • 做原型:从零做一个新应用、新游戏或新功能时,可以用 /goal 让 Codex 交出一版打磨过的初稿。你可以写一份 PLAN.md,把想做成什么样讲清楚,让它照着做。
  • 调提示词:手上有一套测试集,就能用 /goal 拿评测结果来优化提示词。Codex 会去寻找失败的案例、修改提示词、重跑评测,一直迭代到分数达标,或者满足了你定下的收尾条件为止。

要写好一个能稳定运行的目标,关键在于:

  • 先给它一个明确目标和收尾条件
  • 告诉它先去读哪些文件、文档、issue、日志或计划
  • 定好用哪条命令、哪个产物来证明进度
  • 让它分阶段做,顺手记一份简短的进度日志
  • 过程里我们随时用 /goal 查看状态
  • 当任务跑完、卡住或者要换方向时,再暂停、继续或清除它

用 GPT Image 2 来做 PPT

做 PPT 最磨人的一步常常是排版。Codex 自带两个强大的技能:$$slides 用 PptxGenJS 直接读写 .pptx 文件,$$imagegen 负责生成配图。OpenAI 官方给的参考提示词如下:

使用 $$slides 和 $$imagegen 技能,按以下方式编辑此幻灯片:
- 如果存在,请在每张幻灯片的右下角添加 logo.png 文件
- 在幻灯片 X、Y 和 Z 上,将文本向左移动,并使用图像生成功能在右侧生成插图(风格:抽象、数字艺术)。
- 尽可能将文本保留为文本,将简单的图表保留为 PowerPoint 原生图表。
- 添加以下幻灯片:[在此处描述新幻灯片]
- 在新幻灯片和新文本中使用现有品牌标识(颜色、字体、布局等)。
- 将更新后的演示文稿渲染成幻灯片图像,检查输出结果,并在交付前修复布局问题。
- 在交付之前运行溢出和字体替换检查,尤其是在牌组密集的情况下。
- 创建一批相关图像时,保存可重复使用的提示或生成说明。

除了从零开始,一页页描述内容和整体风格,你只需把 Logo、图片丢进同一个文件夹方便它取用。我们还可以让 Codex 来处理周报、月报、季报这类定期更新任务,让它总结一份 guidelines.md 确定好内容、结构和更新方式,再配合别的技能拉取对应的数据。比如给股东的季度汇报,换上新数字和洞察就行。修改现成的 PPT,也可以直接在对话框里,要求 Codex 修正间距、文字错位这类毛病。

Codex的Presentations技能插件页面截图

让 Codex 照着截图做网页

手上有几张截图、一份简短的设计说明,或者几张寻找灵感的参考图,Codex 就能照着做成响应式界面,同时它会顺着项目里已有的写法来,使用原有框架和语言,而不会另起一套。再配上 $playwright 工具,Codex 能在真实浏览器里打开页面,按不同屏幕尺寸跟我们上传的截图逐一对照,反复调整直到接近为止。

参考提示词如下:

请以我提供的屏幕截图和注释为依据,在当前项目中实现此用户界面。
要求:
- 重用现有的设计系统组件和标记。
- 将屏幕截图转换为此存储库的实用程序和组件模式,而不是发明一个并行系统。
- 间距、布局、层级和响应行为要紧密匹配。
- 尊重仓库的路由、状态和数据获取模式。
- 使页面在桌面和移动设备上都能响应。
- 如果截图中的任何细节不明确,请选择最简单但仍符合整体方向的实现方式,并简要说明假设。
验证:
- 将最终的用户界面与提供的屏幕截图进行比较,包括外观和行为。
- 使用 $playwright-interactive 检查 UI 是否与引用匹配,并根据需要进行迭代,直到匹配为止。

从零做一个在浏览器跑的游戏

做游戏大概是能看出 Codex 不仅会写代码还懂设计的场景之一。一个真正的游戏,要有写下来的玩法概念、渲染层、前端外壳、后端状态、美术素材,还得不停地调整画面和手感。

动手搭架子之前,先让它写一份 PLAN.md,把游戏拆成具体几块:玩家目标、核心循环、操作和输入、胜负条件、难度和成长、视觉方向、技术栈和部署假设、里程碑的先后顺序。再写一份 AGENTS.md,按照官方的教程,可以参考下面的写法:

游戏名
<游戏类型>
技术栈:
- 前端 NextJS(部署在 Vercel)
- 渲染用 <填技术>
- 后端 Fastify + WebSocket(部署在 <平台>)
- 数据库 Postgres,缓存和 pub/sub 用 Redis
- 生成式 AI 功能走 OpenAI

约定:
- 每做完一个功能就用 build / test 命令验一下
- 做新功能时照着 PLAN.md 来
- 把思路和决定记在 .logs 里,迭代时回头查
- 用 playwright 测画面效果,不对味就改
- 用 imagegen 出素材,每出一批就把 prompt 存进 .prompts,方便以后接着出同款
- 用 Context7 MCP 拉 <渲染框架> 的文档

AGENTS.md 里提到的技能都装上:$$imagegen 出美术素材,$$playwright 在真实浏览器里测游戏,$openai-docs 拉最新的 OpenAI API 文档,需要的话再加个 Context7 MCP 拉渲染框架的文档。接下来 Codex 会照着计划先做出第一版。如果要生成的图很多,这一版可能得跑上好几个小时。不过借由 Playwright 的能力,Codex 可以自己在浏览器里试玩、验证游戏效果,中间基本不用我们管。计划写得越细,第一版出来就越像样。我们让它自己写了一份游戏的 Plan.md,然后生成了一个几乎可以直接上线的小游戏。

一个太空主题的浏览器游戏demo,展示了游戏画面、开发日志和结算界面

Use $playwright-interactive, $imagegen, and $openai-docs to plan and build a browser game in this repo.Implement PLAN.md, and log your work under `.logs/`.

除了小的网页游戏外,使用 Codex 提供的构建 iOS App 插件,我们也能通过一句话在 Codex 内查看和测试 iOS App。

让 AI 自己跑科研

Codex 能干的远不止写代码,它也能在科研领域充当一个长期工作的研究助手。由用户给出方向和判断,它去实现、取证、打分、反复迭代。其中一个案例是改造模型架构。假设你有个关于蛋白质折叠的想法,「让模型多表示一些高阶的几何结构,会不会学得更好」,这种想法不是一遍能写完的,需要反复尝试。用 Codex 的 Goal Mode,给它三样东西:一个划好边界的科学方向、一个能跑的基线模型、一套能自动打分的基准,它就会自己照着这个目标一路提升分数,实现、测试、记实验、查故障、再修改。

展示1-单纯形、2-单纯形和3-单纯形三维几何结构图,用于蛋白质折叠算法研究

官方给出的例子里,Codex 连着跑了 150 多个小时,自主产出了一个名叫 SimplexFold 的实验性架构。另一个案例是给药物靶点排序。这类任务的麻烦之处在于证据散落在十几个数据库里,遗传学、临床、文献、表达数据各管一摊。借助 Life Science Research 插件,Codex 能并行去各家数据库取证,为每条证据线按 1-5 分打分,最后汇成一张打分表加一份排名,还能配上热力图等图表。

Codex用于药物靶点优先排序的界面截图,展示了使用生物信息学工具进行科研任务的流程

在 OpenAI 官网给出的用例还有很多,我们这里只是列举了部分热门的用法。感兴趣的朋友可以去 OpenAI 开发者官网 developers.openai.com/codex/use-cases,探索更多不同的案例。

OpenAI开发者官网的Codex用例页面截图




上一篇:大疆诉影石Insta360侵犯6项专利,影石反诉,Luna系列或遭禁售
下一篇:HRM-Text:1500美元训出的1B模型,凭什么Bengio也押注分层递归推理架构?
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-6-14 07:34 , Processed in 0.652745 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表