继 Anthropic 的 Claude 新版本发布后,Google 也迅速跟进,推出了 Gemini 3.1 Pro 的更新,延续了“加量不加价”的策略。
以下是本次更新中几个值得开发者关注的核心特性:
1. 函数调用支持多模态返回
此前,模型的函数调用(Function Calling)通常只能返回文本信息。现在,Gemini 3.1 Pro 的 API 可以直接返回图片和 PDF 等文件。这一升级极大地增强了自动化工作流的直观性和实用性,使得 AI 驱动的应用能够输出更丰富、更具表现力的结果。
2. 强大的多模态文档与视频理解能力
Gemini 3.1 Pro 在长上下文处理上展现了令人印象深刻的能力:
- 海量图文处理:单次 Prompt 最多可支持处理 900 张图片 或 900 页 PDF 文档。
- 超长视频理解:支持对长达 1 小时 的视频内容进行理解和分析。
凭借这样的解析能力,Gemini 3.1 Pro 在当前支持长上下文的大模型中,堪称顶级水平,为处理复杂的多模态任务提供了强大支持。
3. 新增“思考签名”,降低模型幻觉
本次更新引入了一项名为“思考签名”(Thinking Signatures)的新技术。该技术旨在让模型在生成回复时,能更好地“理解”自己的推理过程,从而大幅减少“幻觉”(即事实性错误或编造信息)的发生。简单来说,这让 AI 变得更有“自知之明”,显著降低了错判率,输出的结果更加稳定、准确和可靠。
总体来看,Gemini 3.1 Pro 的这次升级,在保持原有定价体系的基础上,重点提升了其在复杂多模态任务处理上的能力与可靠性,为开发者构建更强大的 AI 应用提供了新的可能。
|