云栈社区»论坛 › 站务中心「 Forum Service 」 › Gemini 3.5 Pro难产背后：谷歌CEO承认AI编程落后，模型推理停滞 ...

发回帖发新帖

3859 积分	0 好友	501 主题

发消息

Gemini 3.5 Pro难产背后：谷歌CEO承认AI编程落后，模型推理停滞

发表于 5 小时前 | 查看: 4| 回复: 0

谷歌CEO与Gemini 3.5 Pro机器人，背景显示任务进度和内部测试反馈

谷歌的急行军还在继续，但这一次，传来的消息似乎少了一些惊喜，多了一丝争议。

好消息是，Gemini 3.5 Pro 快发布了！

用户讨论Gemini 3.5 Pro可能发布及其规划能力

坏消息是，这次更新后的 Gemini 可能仍不敌 Claude 和 ChatGPT。

用户指出Gemini Pro迭代速度远不及Claude或GPT

谷歌CEO承认：在Agentic Coding上确实落后了

5月，在谷歌的 I/O 旗舰开发者大会现场，观众席虽然座无虚席，但与会者普遍感到颇为失望。

“我知道大家已经迫不及待地想要体验 Gemini 3.5 Pro 了，”谷歌首席执行官劈材在台上说道，“再给我们一点时间，下个月我们就会把它交到大家手中。”

I/O大会现场两位嘉宾对谈

毫无疑问，谷歌正在悄然主导 AI 领域一个极其重要的类别——数学。Gemini 3.1 Deep Think 的最新推理更新，已巩固了其在高级数学证明领域的领先地位。谷歌上个月是毫无争议的赢家，而且他们正保持着这一势头。

预测市场图表显示谷歌在数学AI模型上遥遥领先

在 DeepSeek 的测试中，Gemini 在世界知识上也独占鳌头。

四种大模型在多个基准测试集上的性能对比图

但古怪的是，Gemini 在编程中的体验却有些拉胯。

三家AI编程工具的卡通形象对比，其中Gemini形象呆萌

2个月前，Gemini Pro 3.1 被爆开始「摸鱼」，不深入思考，回应毫无用处。

论坛截图显示用户抱怨Gemini Pro 3.1停止思考

这似乎是 Gemini 的老毛病——在 AI 编辑器中，Gemini 3 Pro 曾过于激进地自动重写代码，导致用户在审阅待接受代码时，仅因提问就被覆盖了原有工作；一旦拒绝修改，则会丢失已生成的全部代码。而竞品 Opus 4.6 表现则堪称完美：无需任何严格提示，只需一次项目上下文输入，即可进行只读分析并回答问题，全程尊重待处理状态，绝不覆盖差异代码。

论坛截图讨论Gemini 3 Pro未经授权改写代码问题

这种「懒惰」，或许正是大家觉得 Gemini 用起来别扭的真正原因。毕竟，一个在世界知识上最强的模型，如果就是懒得调用工具，那就像一位博览群书的人，你问他最近发生了什么，他却耸耸肩说：“我没看今天的报纸”。

推文截图指出Gemini 3.1 Pro世界知识最强但工具使用懒惰

谷歌首席执行官劈材已坦承，在 AI 编程领域，尤其是处理复杂软件任务方面，谷歌正落后于竞争对手。

新闻标题：劈材承认谷歌在AI编程领域落后

尽管承认了差距，劈材听起来却并不怎么担心。他在内部表示：“我在公司内部从未见过这样的情况；（使用量）每周都在翻倍，人们确实在让这些模型投入到实际工作中。” 他还高调宣称，公司内部 75% 的新代码已由 AI 生成。

劈材宣称75%新代码由AI生成的Reddit帖子

然而，谷歌内部员工却在内部论坛大量发布反 AI 表情包，嘲讽公司自研工具 Jetski 不可靠，制造的全是「垃圾代码」（slop）。

发布会大屏幕显示“Entirely new ways to SLOP”
忍者角色互相指责的表情包，吐槽Jetski
飞天小女警被抓起的表情包，表达被强迫用AI的感受
潜水员被催促使用AI的表情包，表达赶工的压力

如果说他们大量分享的反 AI 表情包能说明什么问题的话，那就是谷歌员工已经受够了这项技术。

员工对公司AI感到厌恶的新闻截图

Gemini 3.5 Pro：有点令人失望

据最新独家爆料，谷歌目前正在紧锣密鼓地对即将发布的重磅大语言模型 Gemini 3.5 Pro 进行高强度迭代，在正式揭晓之前，内部预计还会测试更多的版本。然而，现阶段的测试反馈却多多少少有些让人失望。

推文截图列出Gemini 3.5 Pro泄露信息，称其令人失望

目前最棘手、也最让全网关注的硬伤，依然是 Gemini 在面对长文本以及高复杂度任务时表现出的「消极怠工」现象。这种大模型的「偷懒」行为，已经成为谷歌在正式发布前必须全力攻克的头号顽疾。

用户讨论Gemini 3.5 Pro懒惰问题未解决的推文截图

当然，作为 3.5 时代的重磅产品，它并非毫无亮点。相比于上一代 Gemini 3.1 Pro，新模型在视觉能力、图像生成、SVG 生成质量以及多模态理解方面都展现出了更强劲的实力。

爆料称Gemini 3.5 Pro未能复现简单像素画

有爆料称，Gemini 3.5 Pro 上下文窗口将达到 2M token。

Gemini 3.5 Pro的2M上下文宣传图

但与这些硬实力升级相伴而来的，是更严格的内容过滤机制与安全限制。

懒惰，已然成为 Gemini 3 Pro 最后的顽疾。

推文和视频展示Gemini 3.5 Pro的测试效果

更现实的挑战在于成本——爆料明确指出，Gemini 3.5 Pro 的定价要比 Gemini 3.1 Pro 更加昂贵。

推文吐槽Gemini 3.5 Pro不仅贵而且懒

而 OpenAI 和 Anthropic，不仅模型更优，发布速度还在不断加快。

AI模型重大发布加速的时间线图
用户评论指出模型突破间隔正在缩短

留给 Gemini 的时间，真的不多了。

AI深水区

谷歌 3.5 Pro 暴露出的这些问题，或许正是当前 AI 下半场的缩影。谷歌在 I/O 大会上的局促，以及 3.5 Pro 爆料出的困境，实际上宣告了整个 AGI 行业正式迈入了「边际效应递减」的深水区。靠堆砌参数、堆砌算力就能让 AI 实现指数级跨越的「黄金时代」，正在逐渐远去。随之而来的，是昂贵的算力成本、越来越窄的安全红线，以及模型自身在物理极限下的自我妥协。

参考资料：
https://archive.ph/BeICs
https://www.timesnownews.com/technology-science/google-ceo-sundar-pichai-admits-google-is-falling-behind-in-ai-coding-race-article-154420504

上一篇：Midjourney全息超声波扫描仪登场：60秒全身成像，AI算力颠覆传统医疗
下一篇：燃油车降价、新能源涨价：2026车市冰火两重天？

谷歌, Gemini3．5Pro, 大模型, AI编码, Agent

Gemini 3.5 Pro难产背后：谷歌CEO承认AI编程落后，模型推理停滞

谷歌CEO承认：在Agentic Coding上确实落后了

Gemini 3.5 Pro：有点令人失望

AI深水区

相关帖子