找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

5221

积分

0

好友

707

主题
发表于 1 小时前 | 查看: 3| 回复: 0

如果说 Claude 是 AI 模型界的苹果,那 Gemini 恐怕正在坐实“安卓”这个位置——跑分没输过,体验没赢过。到了 2026 年,在中文 AI 圈甚至流传着一个更扎心的调侃:Gemini 已经成了美国版豆包

这话不是在贬低豆包,而是在描述一种相对位置:如果让顶尖开发者给模型排个座次,那 Gemini 差不多跟豆包坐在一桌。两者都代表了“够用,但不是优先选项”。谷歌到底做了什么,让用户们得出这个结论?知名开发者博主 Theo(T3 Chat 作者、YouTube 百万订阅频道主理人)在他那期自称“可能毁掉我职业生涯”的视频里,把谷歌在 Google I/O 2026 上刻意遮掩的东西,一件一件翻出来讲清楚了。

价格悄悄涨了二十倍,成了“第四贵”

Google I/O 2026 上,谷歌发布了 Gemini 3.5 Flash,配套一张密密麻麻的跑分图表,却全程没写 API 价格。

这个价格是多少呢?输入端每百万 token 1.5 美元,输出端 9 美元。Flash 系列输出端卖到 9 美元,这个数字本身就足够刺眼。

Theo 用自己最熟悉的模型做了个横向对比,一目了然:

模型 输入 /1M 输出 /1M
Gemini 2.0 Flash(已下架) $0.10 $0.40
Gemini 3 Flash $0.50 $3.00
Gemini 3.5 Flash(最新) $1.50 $9.00

单看 token 单价,输入端涨了 15 倍,输出端更是暴涨 22.5 倍。但这还只是表面数字。

更狠的在后面:3.5 Flash 是个推理模型,每次回答都会生成大量思维链 token。第三方测评机构 Artificial Analysis 的数据显示,虽然它产出的 token 总量与上一代 Flash 接近,但要按三倍的单价结算。实际算下来,它成了测评池里第四贵的模型,真实使用成本比 Gemini 3.1 Pro 还高将近一倍。难怪谷歌在发布页上对定价只字不提。

跑分是新高,生成的代码却跑不起来

发布会 PPT 上,3.5 Flash 的跑分确实亮眼:Terminal-Bench 得分仅次于 GPT-5.5,SWE-Bench 超过了 Gemini 3.1 Pro,还拿下了 Finance Agent 和 MCP Toolathon 等多项“最优”标注。看起来是谷歌迄今为止最强的 Flash 模型。

但跑分和现实之间,隔了一条鸿沟。Theo 用自己的游戏项目 “Fish Slap” 做了个实战测试:给模型完整的源码,让它重写一个更稳定、更易维护的版本。任务不复杂,就是一次真实的代码重构。他用这个任务跑了市面上多个主流模型,结果很尴尬:

所有参测模型中,只有 Gemini 3.5 Flash 没有完成任务。 它生成了无法运行的代码。Theo 要求修复后,第二版比第一版更糟:游戏核心机制一个没实现,图片透明度错误,画面上还莫名出现一圈光晕特效。

同样的任务交给 GPT-5.5,不仅一次完成,Theo 追加要求“改成 3D 风格”,它也顺利做到了。

“跑分很高”与“代码跑不起来”并不矛盾,这恰好暴露了问题的本质:谷歌的模型在强化学习上还没有真正突破。它不具备验证自己输出的能力,不会在偏离方向时自我纠正,只会持续燃烧 token,生成一条看起来很长的推理链,却没有任何实质性进展。跑分测的是某种特定的能力切片,而实际工程任务,测的是另一件事。

「这对一个号称最先进的模型来说,是真实意义上的尴尬。它花了很多时间,生成了很多 token,交出来的东西比什么都不做还糟糕。」

砍掉十万 Star 的开源项目,换来一个满是 Bug 的闭源 CLI

在 Google I/O 同台,谷歌宣布:Gemini CLI 正式并入全新的 Antigravity CLI,不再单独维护。

要知道,Gemini CLI 是个开源项目,在 GitHub 上积累了超过 10 万 Star,合并了 6000 多个社区 PR,国内外不少团队用它作为 AI 编码工具链的参考基准。它并不完美,但在持续迭代,社区信任也在一步步建立。

而这次“接替”它的,是一个用 Go 重写的闭源 Antigravity CLI。发布当天,Theo 实测后记录下的 bug 包括:

  • 向上滚动时,旧输入内容会写入当前输入框,而不是执行正常的翻页操作。
  • Ctrl+C 无法退出,必须手动输入 /exit
  • 每次启动都要重新登录,没有持久化会话。
  • 登录邮件地址在 CLI 界面内全程暴露,无法隐藏。
  • 输入框持续跳位,UI 残影无法清除。

更耐人寻味的是一个细节:Antigravity 应用的 UI 被广泛认为与 OpenAI 的 Codex 应用高度相似。在官方演示视频里,演示者向 Antigravity 添加了一个本地文件夹,那个文件夹的名字就叫 “Codex”,根本没来得及改。

这一切的背后,是谷歌花重金收购了 Windsurf 的联合创始团队,让他们来主导 Antigravity 的开发。此举的直接结果是,原本负责 Gemini CLI 的内部团队被整体边缘化,开源策略宣告终止,多年积累的社区信任也随之清零。

在发布会当天,把每月花 200 万美元的大客户整崩了

就在 Google I/O 当天,部署平台 Railway 全站宕机。原因不是网络攻击,也不是 Railway 自身的故障,而是谷歌云在毫无预警的情况下,封禁了 Railway 的 Google Cloud 账户。

Railway 每月在谷歌云上的支出超过 200 万美元。账号被封后,Railway 所有对外的 Web 层和 CDN 立即离线。由于故障严重程度极不寻常,一些用户一度以为遭遇了大规模攻击。

Theo 说,他听过太多类似的故事了,这并非个例。两年前,谷歌云就曾“意外删除”过澳大利亚一家管理规模约 900 亿美元的养老基金 UniSuper 的整个私有云订阅,连谷歌云 CEO 都不得不亲自下场道歉。那次幸好对方在另一家云服务商存有备份,否则将是灾难性的数据损失。

「Azure 有时候慢、有时候怪,但只要你投诉够多次,他们会做点什么。他们肯定不会在你每个月给他们花两百万美元的情况下把你账号封掉。AWS 依然稳健,它排第一是有原因的。谷歌云是个笑话。」

不是谷歌不想做好,而是没有能力“在乎”了

Theo 在视频里把话说得很透:谷歌并非一家“不在乎”的公司,更准确的说法是,它在当前的组织结构下,已经没有能力“在乎” 了。

谷歌拥有一切:顶级工程师、独有的 TPU 集群、最前沿的 AI 研究、庞大的云端基础设施。但这些资源从来没有机会在一个稳定的框架下汇聚,因为:

  • 人还没做完事就离开了。
  • 项目还没上线就被内部政治斗掉了。
  • 外部收购团队进来,原有的开发者关系直接清零。

他在视频里点名了三个人:Dimitri、Jack 和 Gal,他们是之前 Gemini 开发者关系团队里让他保持耐心的核心原因。这三人会主动私信他,听真实反馈,是真正在乎产品的人。正是因为他们,这期批评视频才推迟了将近一年。随着 Antigravity 团队接管,这三人的职能被全部替代。视频发出来了,因为那个让他选择沉默的理由,消失了。

一家公司在 AI 上掉队,很少是突然宣布放弃。更常见的路径是:跑分依然在做,发布会依然在开,价格却悄悄往上涨,开发者工具一件一件烂掉,好的团队被内部政治换掉,真正在乎产品的人选择离开。而外界感知到的,只是一种越来越模糊的“好像差点意思”。

Theo 说,如今他帮谷歌的朋友找新工作,花的时间比用谷歌任何产品都要多。他嘴上说希望自己判断错了,可心里清楚并非如此。


内容整理自 Theo 频道视频完整字幕,数据来源包括 Google I/O 2026 官方发布材料及 Artificial Analysis 测评报告,价格及性能数据以发布时点为准。




上一篇:双脉冲测试650V/120A:动态特性评估与过冲抑制实战指南
下一篇:Karpathy吐槽AI编码坏习惯,催生57行规则文件,GitHub狂揽14.6万星
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-5-24 20:53 , Processed in 0.610719 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表