找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3449

积分

0

好友

457

主题
发表于 昨天 23:02 | 查看: 5| 回复: 0

OpenAI 又一次悄悄地给 Codex“补课”了。

北美时间 5 月 7 日,OpenAI 官宣 Codex for Chrome 扩展功能上线,让 Codex 可以直接调用用户电脑上的 Chrome 浏览器,进入已经登录的网站和工具里完成任务。

按照官方的说法,接入这个扩展之后,Codex 可以读取网页内容、操作内部系统、查看后台、填写表单等,用户还能控制它访问哪些网站。简单来说,现在的 Codex,能接管你的 Chrome 浏览器了。

Codex Chrome扩展功能官方介绍截图

不过光看官方介绍,这的确是个美好的新功能。可体验过当年 OpenAI 推出的 ChatGPT Atlas 的朋友应该都明白,理想和现实总归还差着几步。既然如此,我们决定亲自上手试试。

接入 Codex,浏览器自己“动”起来了

Codex for Chrome 扩展的上手难度并不高,一共两步。先去 Chrome 应用商店搜索“Codex”安装扩展,完成之后它会出现在浏览器右上角,但此时还是未连接状态。

接着打开 Codex,在设置里找到“电脑操控”,把“Google Chrome”这个插件装上,激活后点击连接即可。

Codex Chrome扩展安装界面截图

第一轮测试先来点简单的,让 Codex for Chrome 整理标签页。 发出指令后,Codex 开始思考,整个过程不需要盯着浏览器,它能在后台自动运行。

可偏偏是这简单操作,反倒让 Codex 犯了难。它最开始没法完整识别所有标签页,也没有专用控件执行这个动作,于是想到一个方案:先关闭所有标签页,再按分类顺序重新打开。可惜第一步它就误关了全部页面,却没记下具体网址,自然也就打不开了。

Codex整理标签页操作过程截图

接着测试 Codex for Chrome 整理数据的能力。我们直接在 Codex 上让它唤醒 Chrome,去收集苹果、华为、小米最新款旗舰手机信息,输出资料卡,同时给 5 个选题建议。这次就非常顺利了,能清晰看到它调用 Chrome 进行信息搜索和整理,整个过程大约耗时三分钟。

Codex收集三家旗舰信息生成的资料卡截图

给出的 5 个选题也超出了预期,影像、屏幕、AI 大模型这些大家比较关注的方面均有涉及,Codex 确实挺懂读者想看什么。

Codex给出的5个选题建议截图

既然这个不算难,干脆上个长任务。我让 Codex 在 Chrome 里打开 Deepseek,写一篇符合雷科技风格的文章,主题就用之前分析旗舰机时那个选题题目,全程自主操作。

Codex调用Chrome在Deepseek中写作的界面截图

这次 Codex for Chrome 响应速度很快,约 30 秒就把指令完整贴到了 Deepseek 上,从开始到完成文章也只花了 1 分钟左右。

Deepseek生成的文章内容截图

接着我们又尝试了更复杂的操作:让 Codex for Chrome 做一份 AI 新闻日报表格。由于之前已经给它配置了做 AI 日报总结的 Skill,这部分进展相对顺利,大约 1 分钟就完成了信息收集。然后就是打开腾讯文档、新建表格、把内容粘贴进去,整个过程还算顺畅,中间偶尔出现识别不准,但都能及时纠正。

Codex生成的AI新闻日报表格截图

目前来看,Codex for Chrome 的实用性挺高。一方面,Codex 本身的能力当前就是第一梯队,以它为轴心执行操作,基本不会出大岔子,至少我们尝试的几种方案,没有哪个是完全做不成的。另一方面,打通 Chrome 和 Codex,最大优势在于不需要专门换其他 AI 浏览器也能做到类似效果,降低了换新门槛。

辅助浏览器而不是替代,OpenAI 这次学聪明了

看到 OpenAI 官宣了这个扩展,我们会下意识想起被冷落许久的 ChatGPT Atlas。作为 OpenAI 推出的首款 AI 浏览器,它其实承载了很大期望,不过大家也知道,Atlas 并没掀起多大波澜。

无论是 Firefox、Atlas,还是美团光年之外团队做的 Tabbit 浏览器,这些 AI 浏览器一直在教育用户:如今的浏览器不该只是个看网页的工具,它应该能理解你正在看的内容,预判你接下来可能要干嘛,甚至在某些时候直接帮你把活儿干了。

比如 Atlas 能在你浏览网页、查资料、整理信息时,AI 都在旁边跟着看,必要时候还能进入 agent mode 自动处理任务。但问题是,大家还是按习惯来,每天的工作基本都在 Chrome 上处理。为啥呢?道理其实不复杂——浏览器毕竟不是普通 App,它承载了书签、密码、历史记录、插件、登录状态,还有肌肉记忆般的操作习惯,很多人就是喜欢某些按钮待在特定位置。更别说,Chrome 目前仍是扩展生态最丰富的浏览器。

ChatGPT Auto的任务界面截图

所以回头看 Codex for Chrome,我倒觉得这一招有点鸡贼。大概是 ChatGPT Atlas 的受挫让 OpenAI 换了个思路:既然改变不了用户习惯,那就在用户习惯的框架里塞进更强的能力。

说是 AI 为主,这里面还是有区别的。Atlas、Tabbit 更像是“浏览器 + AI”,浏览器是产品的主角,AI 是核心体验,在搜索、信息总结这些网页能力上表现亮眼。而 Codex for Chrome 本质上是借 Codex 的能力落地,Codex 本身是 OpenAI 打造的专业任务型 Agent,优势自然就是“干实事”。

Tabbit浏览器新建标签页界面截图

从我们前面的实测看也的确如此。让它整理旗舰手机资料、生成选题建议、调用 DeepSeek 写稿、去腾讯文档新建表格,这些事情 Codex for Chrome 都能做,而且整体不算慢。尤其是调用 DeepSeek 写稿那次,体验比预想中顺——它能唤起 Chrome,进入对应页面,找到输入区,把内容写进去,整个过程我都无需监视浏览器动态,也没有被要求接管操作。

我认为 Codex for Chrome 最有价值的地方,还是处理那些日常琐碎工作。就像我把 AI 日报做成表格,这对科技数码行业从业者来说可能是每天都要完成的任务,交给 Codex for Chrome 能省下不少时间和精力。

Codex生成的选题表格截图

和所有 AI 浏览器一样,Codex for Chrome 目前也存在一些问题。手动操作浏览器时,哪些网页没加载出来、哪些按钮不能随便点、登录和广告位置在哪儿,我们都能凭经验判断,但 AI 还是需要花很长时间去识别。最让人捏把汗的是,万一它直接点了发布,把没写完的文章发出去,那就真酿成大祸了。

所以现在我更愿意把 Codex for Chrome 看成一个能干活却仍需盯着的半自动助手。在不涉及安全、金融、隐私这些敏感领域时,可以放心交付,但还是得有人在旁边看着,以防万一。

写在最后

当然,浏览器 Agent 对普通用户来说,形态并没有那么重要,真正重要的是查资料、写稿、填表、整理网页时,它能不能帮上忙。

从这次体验看,Codex for Chrome 已经能做到一部分。它可以帮你跑通一些中间步骤,也能把几个原本要来回切换的网页任务串起来。只不过,它还没到“你说一句话就彻底不管”的成熟度。

至于关闭标签页、提交表单、修改后台数据这些动作,现阶段还是谨慎为好。不是说完全不能做,而是用户最好清楚它走到了哪一步,最好在关键节点亲自看一眼。说白了,你还是得盯着,不能让它全权接管。

这可能也是 Codex for Chrome 眼下最现实的价值:它没有把浏览器 Agent 一步送进终点,但至少让人第一次感受到,这件事不是只能停留在演示里。等它再稳一点、再少翻车一点,用户自然会愿意把更多活儿交给它。到那时候,浏览器会不会被 AI 彻底重塑,反而不用急着下结论。先看它能不能把眼前这些小事办好,就够了。

云栈社区 上,不少开发者也在探讨类似话题——自动化工具如何真正融入日常开发流程,而不是沦为又一个吃灰的酷炫玩具。

OpenAI #Codex #Chrome #Google #浏览器




上一篇:机器人应用商店现状:动作全是舞蹈武术,宇树智元真走偏了吗?
下一篇:不想当产品的设计师,如何用一次工程账号项目重构智能家居交付流程?
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-5-12 01:29 , Processed in 0.634904 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表