前两天晚上,我在 Antigravity 里写一个功能,写到一半,断了。重连,继续写,又断了。第三次断的时候我没再重连,直接切到 Codex 把活干完了。
关了电脑之后我坐在那想了一会儿。去年这个时候,Antigravity 还是我最顺手的编码工具,Gemini 3 Pro 那段时间确实好用,我好几个项目都是用它推进的。现在呢?写个东西像在赌,不知道什么时候会断,不知道今天的模型有没有偷偷降智。
然后我打开 X 刷了一下,满屏都是 GPT-image-2 生成的图。有人做了中文招聘海报,文字居然全是对的。我自己前一天也做过类似的测试:GPT-Image-2 太强了,全面碾压 Nano Banana ,10 个提示词直接复制出图。
这两件事加在一起,我突然很清楚地感觉到,这三家公司已经走上了完全不同的路。
先说GPT
说 GPT-image-2 之前我先说个体感。以前让 AI 画带中文的海报,你得做好心理准备,文字部分一定是鬼画符。不管 DALL-E 还是 Nano Banana 2,中文就是它们的硬伤,你只能当装饰看。
这次我让它生成《出师表》的书法海报。是对的。

不是大概对,是基本每个字都对。
你想想这意味着什么。以前做一张带中文的营销图,AI 出图 → 你手动改文字 → 再调版式,这个流程现在被砍掉了一半。任何人打几句话就能出 80 分的成品。
OpenAI 这半年给我的整体感受是什么都在做:图片、编码、办公、连生命科学都搞了个专用模型。
Codex 也很猛,上了 90 多个插件,我现在写代码主力就是它。更新快到你这周还没学会上周的功能,下一个又来了。
什么都做,而且都做得还不错。但什么都做也意味着什么都要跟专业选手打。图片打 Midjourney,编码打 Claude Code,办公打微软。
现在 GPT-5.5 也出来了,很强。
再看Claude
很多人对 Claude 的印象还停留在“写代码强”。说实话半年前我也这么想。
但你要是把这几个月的更新连起来看,会发现 Anthropic 做的事比你以为的大得多。
1 月 Cowork 出来了。这东西不是聊天窗口,它直接在你电脑上跑,操作你的文件,帮你把活做完交成品。2 月 PPT 和 Excel 插件上线,我同事试了一下,跟它说“帮我做个季度汇报”,出来一份完整的演示文稿带图表。而且 Excel 和 PPT 之间还共享上下文,你在 Excel 里分析完数据,切到 PPT 它已经知道你刚才在看什么了。
然后 4 月 Claude Design 出来了。
这个最狠。发布前三天,Anthropic 的 CPO 悄悄辞去了 Figma 的董事会。发布当天 Figma 股价掉了 5%。
你把这条线串起来看,编码 → 办公文档 → 设计 → 再回到编码。这是一个闭环。
去年 Claude 是程序员的工具。今年产品经理、设计师、分析师都能用了。
我自己现在拿 Claude 做内容创作和复杂规划。说实话 Opus 4.7 在纯文字上的进步没那么夸张。但生态的铺开速度,快到让人有点不真实。
最后谈Gemini
这部分我犹豫了一下要不要写。因为我确实还在用 Gemini,不想搞得像在踩它。
但事实摆在那里。
去年 Nano Banana 刷屏的时候,我挺兴奋的。Google 终于发力了。那段时间 Antigravity 体验确实好,我好几个项目都是用 Gemini 2.5 Pro 推的。
今年开始不对了。
断连只是一方面。V2EX 上我看到有人发帖:“降智太严重了,之前做前端体验非常好,现在啥啥干不好”。跟我的体感一模一样。更离谱的是 GitHub issue 区有人反馈 Gemini 会主动删掉你原来正常运行的代码。
这不是变笨,这是搞破坏。
额度也在砍。25000 积分用 50 次就没了。1 月大面积掉签,很多账号直接丢失订阅。以前说 Google 是大善人,现在大善人也开始算账了。
其实 Gemini 3.1 Pro 的跑分不差的,能力摆在那里。但你的车发动机再好,方向盘不稳、油箱随时可能被砍,谁敢拿它跑生产环境?
我一直觉得 Google 是最有条件做好 AI 平台的。有搜索、有 Android、有 Cloud、有 YouTube,手里这把牌比谁都好。
但为什么打出来总差一口气?
我也想不通。
我现在的搭配
写代码用 Codex。创作和复杂规划用 Claude。做 PPT 和办公文档用 Claude Cowork。图片用 GPT-image-2。视频用 Seedance 2.0,但注意版权。日常问答用 GPT-5.4。省钱批量用 Gemini 3.1 Flash-Lite,做好降智的心理准备。
一句话版本:编码用 Codex,创作和办公用 Claude,图片视频用 GPT 和 Seedance,省钱用 Gemini。
这三家公司现在的状态让我想起一个事。
去年我和朋友聊,说“AI 工具选一个深耕就行了”。现在回头看这句话挺天真的。工具的更新速度已经快到你还没深耕完,格局就变了。去年最顺手的 Gemini 编码体验,今年变成了最让人焦虑的。
所以我现在的策略是,不把自己绑死在任何一家上。每家的长板用好,短板出现了就切。这个切换能力本身,可能比精通任何一个工具都重要。