找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3859

积分

0

好友

501

主题
发表于 5 小时前 | 查看: 4| 回复: 0

谷歌CEO与Gemini 3.5 Pro机器人,背景显示任务进度和内部测试反馈

谷歌的急行军还在继续,但这一次,传来的消息似乎少了一些惊喜,多了一丝争议。

好消息是,Gemini 3.5 Pro 快发布了!

用户讨论Gemini 3.5 Pro可能发布及其规划能力

坏消息是,这次更新后的 Gemini 可能仍不敌 Claude 和 ChatGPT。

用户指出Gemini Pro迭代速度远不及Claude或GPT

谷歌CEO承认:在Agentic Coding上确实落后了

5月,在谷歌的 I/O 旗舰开发者大会现场,观众席虽然座无虚席,但与会者普遍感到颇为失望。

“我知道大家已经迫不及待地想要体验 Gemini 3.5 Pro 了,”谷歌首席执行官劈材在台上说道,“再给我们一点时间,下个月我们就会把它交到大家手中。”

I/O大会现场两位嘉宾对谈

毫无疑问,谷歌正在悄然主导 AI 领域一个极其重要的类别——数学。Gemini 3.1 Deep Think 的最新推理更新,已巩固了其在高级数学证明领域的领先地位。谷歌上个月是毫无争议的赢家,而且他们正保持着这一势头。

预测市场图表显示谷歌在数学AI模型上遥遥领先

在 DeepSeek 的测试中,Gemini 在世界知识上也独占鳌头。

四种大模型在多个基准测试集上的性能对比图

但古怪的是,Gemini 在编程中的体验却有些拉胯。

三家AI编程工具的卡通形象对比,其中Gemini形象呆萌

2个月前,Gemini Pro 3.1 被爆开始「摸鱼」,不深入思考,回应毫无用处。

论坛截图显示用户抱怨Gemini Pro 3.1停止思考

这似乎是 Gemini 的老毛病——在 AI 编辑器中,Gemini 3 Pro 曾过于激进地自动重写代码,导致用户在审阅待接受代码时,仅因提问就被覆盖了原有工作;一旦拒绝修改,则会丢失已生成的全部代码。而竞品 Opus 4.6 表现则堪称完美:无需任何严格提示,只需一次项目上下文输入,即可进行只读分析并回答问题,全程尊重待处理状态,绝不覆盖差异代码。

论坛截图讨论Gemini 3 Pro未经授权改写代码问题

这种「懒惰」,或许正是大家觉得 Gemini 用起来别扭的真正原因。毕竟,一个在世界知识上最强的模型,如果就是懒得调用工具,那就像一位博览群书的人,你问他最近发生了什么,他却耸耸肩说:“我没看今天的报纸”。

推文截图指出Gemini 3.1 Pro世界知识最强但工具使用懒惰

谷歌首席执行官劈材已坦承,在 AI 编程 领域,尤其是处理复杂软件任务方面,谷歌正落后于竞争对手。

新闻标题:劈材承认谷歌在AI编程领域落后

尽管承认了差距,劈材听起来却并不怎么担心。他在内部表示:“我在公司内部从未见过这样的情况;(使用量)每周都在翻倍,人们确实在让这些模型投入到实际工作中。” 他还高调宣称,公司内部 75% 的新代码已由 AI 生成

劈材宣称75%新代码由AI生成的Reddit帖子

然而,谷歌内部员工却在内部论坛大量发布反 AI 表情包,嘲讽公司自研工具 Jetski 不可靠,制造的全是「垃圾代码」(slop)。

发布会大屏幕显示“Entirely new ways to SLOP”
忍者角色互相指责的表情包,吐槽Jetski
飞天小女警被抓起的表情包,表达被强迫用AI的感受
潜水员被催促使用AI的表情包,表达赶工的压力

如果说他们大量分享的反 AI 表情包能说明什么问题的话,那就是谷歌员工已经受够了这项技术。

员工对公司AI感到厌恶的新闻截图

Gemini 3.5 Pro:有点令人失望

据最新独家爆料,谷歌目前正在紧锣密鼓地对即将发布的重磅大语言模型 Gemini 3.5 Pro 进行高强度迭代,在正式揭晓之前,内部预计还会测试更多的版本。然而,现阶段的测试反馈却多多少少有些让人失望。

推文截图列出Gemini 3.5 Pro泄露信息,称其令人失望

目前最棘手、也最让全网关注的硬伤,依然是 Gemini 在面对长文本以及高复杂度任务时表现出的「消极怠工」现象。这种大模型的「偷懒」行为,已经成为谷歌在正式发布前必须全力攻克的头号顽疾。

用户讨论Gemini 3.5 Pro懒惰问题未解决的推文截图

当然,作为 3.5 时代的重磅产品,它并非毫无亮点。相比于上一代 Gemini 3.1 Pro,新模型在视觉能力、图像生成、SVG 生成质量以及多模态理解方面都展现出了更强劲的实力。

爆料称Gemini 3.5 Pro未能复现简单像素画

有爆料称,Gemini 3.5 Pro 上下文窗口将达到 2M token。

Gemini 3.5 Pro的2M上下文宣传图

但与这些硬实力升级相伴而来的,是更严格的内容过滤机制与安全限制。

懒惰,已然成为 Gemini 3 Pro 最后的顽疾。

推文和视频展示Gemini 3.5 Pro的测试效果

更现实的挑战在于成本——爆料明确指出,Gemini 3.5 Pro 的定价要比 Gemini 3.1 Pro 更加昂贵。

推文吐槽Gemini 3.5 Pro不仅贵而且懒

而 OpenAI 和 Anthropic,不仅模型更优,发布速度还在不断加快。

AI模型重大发布加速的时间线图
用户评论指出模型突破间隔正在缩短

留给 Gemini 的时间,真的不多了。

AI深水区

谷歌 3.5 Pro 暴露出的这些问题,或许正是当前 AI 下半场的缩影。谷歌在 I/O 大会上的局促,以及 3.5 Pro 爆料出的困境,实际上宣告了整个 AGI 行业正式迈入了「边际效应递减」的深水区。靠堆砌参数、堆砌算力就能让 AI 实现指数级跨越的「黄金时代」,正在逐渐远去。随之而来的,是昂贵的算力成本、越来越窄的安全红线,以及模型自身在物理极限下的自我妥协。

参考资料:
https://archive.ph/BeICs
https://www.timesnownews.com/technology-science/google-ceo-sundar-pichai-admits-google-is-falling-behind-in-ai-coding-race-article-154420504




上一篇:Midjourney全息超声波扫描仪登场:60秒全身成像,AI算力颠覆传统医疗
下一篇:燃油车降价、新能源涨价:2026车市冰火两重天?
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-6-21 07:37 , Processed in 0.755105 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表