找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1163

积分

0

好友

163

主题
发表于 前天 05:22 | 查看: 4| 回复: 0

图片

在全球人工智能竞争白热化的背景下,谷歌与OpenAI近日再次同步推出重要更新,将行业焦点引向智能体(Agent)能力与生态的较量。

谷歌正式发布了经过重新构思的Gemini Deep Research版本,并首次开放了嵌入式研究智能体的API。几乎同一时间,OpenAI也推出了代号为“Garlic”的GPT-5.2。两家巨头在智能体未来、基础模型边界及应用生态主导权上的竞争,已进入空前激烈的阶段。

图片

谷歌全新Deep Research Agent详解

谷歌推出的全新Gemini Deep Research工具是一个能够整合海量信息、处理超长上下文数据的智能体。其应用场景广泛,覆盖从尽职调查到药物毒性安全研究等多种复杂任务。谷歌计划将其深度集成至谷歌搜索、谷歌财经、Gemini应用及NotebookLM等服务中,展现了以AI代理逐步替代传统信息检索方式的战略意图。

本次更新的核心在于架构级重构。新版Deep Research Agent以Gemini 3 Pro为核心基础模型,致力于打造一个更稳定、准确且可追溯的深度研究系统。其能力提升主要体现在模型升级、推理稳定性突破与交互能力增强三大方向。

1. 模型与训练策略升级
新版智能体完全基于被谷歌视为迄今最可靠、最适合长链推理的旗舰模型Gemini 3 Pro构建。为了确保在数十步甚至数百步的复杂研究任务中保持稳定,谷歌采用了多步轨迹强化学习(Reinforcement Learning over Multi-step Trajectories) 策略进行训练,旨在显著减少长链推理中的逻辑偏移与幻觉,保证连续决策的一致性。

2. 超强上下文与可追溯性
依托Gemini 3 Pro,该智能体具备超大规模上下文处理能力,可一次性消化大量学术论文、报告等资料。其标志性功能是为每一个结论自动附加可追溯的引用来源,不仅提供链接,更结构化地指向原文关键片段,使输出结果具备研究级的可信度与可审核性。

3. 开源基准与结构化API
谷歌此次系统性发布了DeepSearchQA基准测试Interactions API。DeepSearchQA是一个开源的网络研究智能体基准,包含17个领域的900道复杂“因果链”任务,用于评估智能体在多步骤信息检索中的全面性与精确度。

Interactions API则允许开发者以结构化方式控制智能体的行为状态、推理步骤及任务执行过程,标志着从“向模型提问”到“调度智能体执行任务”的范式转变。

基准测试表现:与GPT-5.2的正面较量

在关键的基准测试中,新版Deep Research Agent取得了先进成果:

  • 人类的最后考试(HLE):得分46.4%,优于GPT-5 Pro报告的38.9%(根据OpenAI研究员Sebastien Bubeck在领英发布的数据,GPT-5.2在HLE上的得分为45%)。
  • DeepSearchQA:得分66.1%,略高于GPT-5 Pro的65.2%。
  • BrowseComp:得分59.2%,与GPT-5 Pro表现相当。

图片

技术社区反响与对比

技术社区对谷歌此次将智能体“工程化产品化”的努力给予了关注。Reddit等论坛上有开发者认为,强调“可验证引用”和“多步推理稳定性”是AI智能体领域的一次实质性进步。也有声音保持谨慎,呼吁需要更多第三方真实场景测试。

由于发布时间重合,网友自然将Deep Research Agent与GPT-5.2进行比较。有观点认为两者用途侧重不同,但GPT-5.2在通用性上可能更好;而基准分数上的细微差别也引发了广泛讨论。这场“发布会大战”背后,是双方在模型能力上持续的“贴身肉搏”。

竞争焦点:从基础模型到智能体平台

基础模型方面,Gemini 3 Pro与GPT-5.2的差距已进入毫厘之间,各自在长链推理、逻辑一致性等不同场景互有优势。

而竞争更深层的维度在于智能体平台能力。谷歌通过Deep Research Agent及其Interactions API,正构建一个可控、可追溯的专业研究型智能体执行引擎。OpenAI则通过Agent API、Swarm等打造了一个侧重通用性与自由度的智能体开发框架。这场竞赛的本质,是争夺以智能体为核心的下一代软件开发框架与标准的主导权。

参考链接:




上一篇:Manus通用智能体为什么没被替代?技术架构、产品决策与市场增长分析
下一篇:33岁程序员职业选择:深入对比腾讯与国企的技术发展、稳定与挑战
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2025-12-17 14:38 , Processed in 0.105785 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 云栈社区.

快速回复 返回顶部 返回列表