找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3881

积分

0

好友

503

主题
发表于 1 小时前 | 查看: 4| 回复: 0

谷歌的急行军还在继续,但这一次,传来的消息似乎少了一些惊喜,多了一丝争议。

好消息,Gemini 3.5 Pro 快发布了!

用户Haider推文:Gemini 3.5 Pro可能即将发布,期待更好的规划与代码库理解能力

坏消息,这次更新 Gemini 可能不敌 Claude 和 ChatGPT。

用户emollick推文:Gemini Pro模型迭代速度远不及Claude或GPT,性能差距扩大

谷歌 CEO 承认:Agentic Coding 确实落后了

5 月,谷歌的 I/O 旗舰开发者大会现场座无虚席,但许多观众却感到颇为失望。

“我知道大家已经迫不及待地想要体验 Gemini 3.5 Pro 了,”谷歌首席执行官劈材在台上说道。“再给我们一点时间,下个月我们就会把它交到大家手中。”

谷歌I/O大会现场,劈材承诺Gemini 3.5 Pro下月发布

毫无疑问,谷歌正在悄然主导 AI 领域最重要的类别——数学。

Gemini 3.1 Deep Think 的最新推理更新,已巩固其在高级数学证明领域的领先地位。

谷歌上个月是毫无争议的赢家,而且他们正保持着这一势头。

Polymarket投票:哪家公司数学AI模型最强?谷歌以74%领先

在 DeepSeek 的测试中,Gemini 在世界知识上也独占鳌头。

四种大模型在知识与推理、智能体能力上的性能对比

但古怪的是,Gemini 在编程中的体验有些拉胯。

AI编程工具对比:Claude Code、Codex与Gemini

2 个月前,Gemini Pro 3.1 被爆开始“摸鱼”,不深入思考,回应毫无用处。

Reddit帖子:Gemini Pro 3.1停止思考,回答无用

这似乎是 Gemini 的老毛病——Gemini 3 Pro 在 AI 编辑器中过于激进地自动重写代码,导致用户审阅待接受代码时,因提问而被覆盖,拒绝修改则会丢失已生成的全部代码。

而 Opus 4.6 表现完美——无需严格提示,只需一次项目上下文输入,即可只读分析、回答问题,全程尊重待处理状态,不覆盖差异代码。

论坛帖子:如何阻止Gemini 3 Pro擅自重写代码,破坏用户工作

这种懒惰,可能是 Gemini 用起来别扭的真正原因。

推文:DeepSeek V4报告揭示Gemini 3.1 Pro世界知识最强,但工具调用极懒

谷歌首席执行官劈材坦承,在AI编程领域,尤其是处理复杂软件任务方面,谷歌正落后于竞争对手。

新闻截图:谷歌CEO Sundar Pichai承认在AI编程领域落后

尽管承认了差距,劈材听起来并不怎么担心:
“我在公司内部从未见过这样的情况;(使用量)每周都在翻倍,人们确实在让这些模型投入到实际工作中。”

他还高调宣称 75% 新代码由 AI 生成。

Reddit帖子:谷歌宣称75%新代码已由AI生成,从2024年的25%激增

然而,谷歌内部员工却在内部论坛大量发布反 AI 表情包,嘲讽公司自研工具 Jetski 不可靠、制造“垃圾代码”(slop)。

谷歌I/O大会宣布“Entirely new ways to SLOP”

表情包:各家公司想方设法让用户使用AI功能

表情包:别人催促用AI,而我在干活

如果说他们大量分享的反 AI 表情包能说明什么问题的话,那就是谷歌员工已经受够了这项 AI 编程。

新闻:谷歌CEO力推AI,但内部员工对此感到厌恶

Gemini 3.5 Pro:有点令人失望

据最新独家爆料,谷歌目前正在紧锣密鼓地对即将发布的重磅大语言模型 Gemini 3.5 Pro 进行高强度的激进迭代,在正式揭晓之前,内部预计还会测试更多的版本。
然而,现阶段的测试反馈却多多少少有些让人失望。

推文泄露:Gemini 3.5 Pro有点令人失望,懒惰仍是最大问题

目前最棘手、也最让全网关注的硬伤,依然是 Gemini 在面对长文本以及高复杂度任务时表现出的“消极怠工”现象。

这种大模型的“偷懒”行为,已经成为谷歌在正式发布前必须全力攻克的头号顽疾。

推文:Gemini 3.5 Pro懒惰问题未解决,配套Zen Voxel Garden演示

当然,作为 3.5 时代的重磅产品,它并非毫无亮点。

相比于上一代 Gemini 3.1 Pro,新模型在视觉能力、图像生成、SVG 生成质量以及多模态理解方面都展现出了更强劲的实力。

推文泄露:Gemini 3.5 Pro无法复现简单像素艺术,GPT-5.5轻松完成

有爆料称,Gemini 3.5 Pro 上下文将达到 2M。

推文:Gemini 3.5 Pro 200万上下文窗口、深度思考推理等特性

但与这些硬实力升级相伴而来的,是更严格的内容过滤机制与安全限制。

懒惰已成 Gemini 3 Pro 最后顽疾。

推文:Gemini 3.5 Pro旧检查点测试,口味与世界知识惊人但仍懒惰

更现实的挑战在于成本——爆料明确指出,Gemini 3.5 Pro 的定价要比 Gemini 3.1 Pro 更加昂贵。

推文:Gemini 3.5 Pro不仅贵还懒,问题未解决

而 OpenAI 和 Anthropic,不仅模型更优,发布速度还在加速,留给 Gemini 的时间不多了。

时间线图表:主要AI模型步进式发布加速,间隔缩短

推文:图表暗示AI突破间隔不断缩短,已从月变为周

AI 深水区

Gemini 3.5 Pro 暴露出的这些问题,或许正是当前 AI 下半场的缩影。

谷歌在 I/O 大会上的局促,以及 3.5 Pro 爆料出的困境,实际上宣告了整个 AGI 行业正式迈入了“边际效应递减”的深水区。

靠堆砌参数、堆砌算力就能让 AI 实现指数级跨越的“黄金时代”,正在逐渐远去。
随之而来的,是昂贵的算力成本、越来越窄的安全红线,以及模型自身在物理极限下的自我妥协。

开发者广场上,工程师们对此也展开了激烈讨论。  

参考资料:  




上一篇:make-look-scanned:把普通PDF变成逼真扫描件,开源、命令行和浏览器都能用
下一篇:2055太空产业前瞻:悲观割裂、现实常态与乐观繁荣三种推演
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-6-22 02:43 , Processed in 0.615178 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表