谷歌正式发布了其Gemini 3家族的最新成员——Gemini 3 Flash。这款模型重新定义了轻量级模型的可能性,它并非性能的妥协版本,而是成功将前沿智能与极致速度融为一体。目前,该模型已全面覆盖API、谷歌搜索以及面向消费者的全球免费Gemini应用。

前沿智能不再以牺牲速度为代价
传统观念认为,模型的“聪明程度”与反应速度往往难以兼得。Gemini 3 Flash的出现打破了这一僵局。它在继承Gemini 3 Pro级别推理能力的基础上,依然保持了Flash系列在延迟、效率和成本控制上的显著优势,甚至在部分基准测试中表现超越了Gemini 3 Pro。

在考察博士级别专业推理的GPQA Diamond基准测试中,Gemini 3 Flash取得了90.4%的优异成绩。在Humanity‘s Last Exam的无工具测试中,它也获得了33.7%的分数。这些成绩使其不仅在轻量级模型中领先,更在多方面显著超越了前代旗舰模型Gemini 2.5 Pro。
多模态能力同样是本次升级的重点。在MMMU Pro基准测试中,Gemini 3 Flash获得了81.2%的高分,与更大体量的Gemini 3 Pro不相上下,证明了其在处理图像、视频等复杂多媒体内容时的顶尖实力。
除了纯粹的智能比拼,效率是模型商业化落地的关键。Gemini 3 Flash通过引入一种动态思维调节机制,在性能与效率的平衡上取得了突破。处理简单任务时它能快速响应,面对复杂用例则会自动进行更长时间的深度推理。在典型流量测试中,为达到同等高性能准确度,其消耗的Token数量比Gemini 2.5 Pro平均减少了30%。

速度方面,Gemini 3 Flash展现了Flash系列的传统优势。根据Artificial Analysis的基准测试,其运行速度是Gemini 2.5 Pro的3倍。

定价策略上,它保持了极强的竞争力:每100万输入Token价格为0.50美元,每100万输出Token价格为3.00美元。这种高性价比的定价,为大规模AI应用的部署扫清了障碍。
专为开发者打造的敏捷智能
对于开发者而言,Gemini 3 Flash是高频工作流中的得力助手。它专为迭代开发而生,拥有与Gemini 3 Pro同级的代码编写能力,且延迟更低,使得在构建代理系统或交互式应用时,能获得更快的响应与修正循环。
在评估编码代理能力的权威基准SWE-bench Verified中,Gemini 3 Flash获得了78%的分数,这一成绩不仅超越了2.5全系列,甚至超过了Gemini 3 Pro,表明在特定代理任务中,极速的推理反馈可能比单纯的参数量更具优势。
目前,Gemini 3 Flash已全面接入Google AI Studio、Gemini CLI以及全新的代理开发平台Google Antigravity。得益于强大的视觉问答、数据提取和视频分析能力,开发者可以基于它构建出更加智能的应用程序,例如需要实时分析的游戏内助手,或对反馈速度要求极高的A/B测试实验。


全球用户免费触达的智能升级
Gemini 3 Flash现已正式成为Gemini App的默认模型,取代了之前的2.5 Flash版本。全球用户无需支付额外费用,即可直接体验Gemini 3代的智能水平。
用户可以利用其极速的多模态理解能力,例如上传一段运动视频,几秒内它便能分析动作并给出改进计划。


对于非开发者,它同样强大。用户可以直接通过语音描述应用创意,Gemini 3 Flash能在短时间内将这些非结构化语音转化为一个可运行的原型应用,极大降低了开发门槛。


在谷歌搜索中,Gemini 3 Flash也开始作为AI Overviews的默认模型向全球推送。它能细腻解析查询意图,综合本地信息与全网内容,提供结构清晰、视觉友好的深度回答,将搜索体验升级为研究与行动的结合体。
当然,该模型目前可能存在幻觉率略高的问题。

目前,Gemini 3 Flash已全面开放,开发者可通过Google AI Studio、Google Antigravity、Vertex AI以及Gemini Enterprise等渠道进行调用。