惊喜不多,性价比拉满。
这两天,谷歌又有了新动作。就在2月26日晚间,谷歌在Gemini App中上线了Nano Banana 2(技术代号Gemini 3.1 Flash Image)。这款图像模型已全面接入Gemini App、Google Search及开发者API。这一全新模型融合了此前Nano Banana Pro的高阶能力与Gemini Flash的极速性能,更像是一次从“酷炫秀”向“生产级工具”的战略转移。
相比此前Nano banana pro带来的惊艳感,这次更新在速度和价格上有极大优势。资深AI产品经理麦莉也表示,Nano Banana 2的图像生成速度比上一代Pro模型明显更快,只是亮点确实谈不上。
据Google DeepMind官方博客披露,Nano Banana 2的核心卖点是“将Nano Banana Pro的高级能力融入Flash速度”。

首先,Nano Banana 2最直观的冲击来自原生4K输出。前代Nano Banana(基于Gemini 2.5 Flash)的画质在复杂场景下会有涂抹感,Banana 2在保持同等响应速度的前提下,支持512px至4K的原始分辨率输出,皮肤纹理、褶皱、远景细节不再主要依赖后期放大来提升清晰度。AI圈内人士认为,这次Banana 2的光影逻辑更符合真实世界,核心是推理层的升级。
实际测试输出一张4K高分辨率人像,在光影和水珠的处理上确实有肉眼可见的提升:

更实用的是,本次Banana 2支持单workflow追踪最多5个角色与14个物体,可基于14张参考图进行元素融合,这对系列插画、故事板制作等需要角色一致性的场景较为实用。
比如将一张电影海报进行换脸处理后:

再根据prompt的关键词设置后,就会得到这样一组分镜头画面:

难怪有博主称设计行业要变天了。随意上传一款产品,让Nano banana 2设计出一套视觉方案,没想到细节都很到位:

其次,Nano Banana 2增强了世界知识与文本渲染能力。文字生成一直是AIGC绘图的行业痛点,Banana 2在这方面进步明显:海报标题、屏幕UI、白板手写体均可清晰呈现,中文支持度达标。
在prompt中包含明确文本的相关场景测试中,Nano Banana 2对指定中文和英文文本的还原准确度较高:

不过也发现,虽然中文显示基本可用,但也别塞太多字,不然生成的图片就会出现模糊和粘连的问题。

此外,Nano Banana 2得益于Gemini系列强大的世界知识基础,能够调用实时网络信息来提升图像生成效果和细节准确性。为此,谷歌做了一个‘Window Seat’(靠窗座位)的展示,意味着Nano Banana 2结合全球各地的真实场景和实时天气数据,生成当下最符合现实世界的窗外照。
结合北京刚刚下过雪的天气,体验一下谷歌引以为傲的‘Window Seat’演示:

在更复杂的指令理解场景下,Nano Banana 2的稳定性也有所提升。设置了包含具体地理位置、室内视角和极端天气条件的提示。模型能够较好地理解“船舱内靠窗视角”这一空间约束,并生成符合德雷克海峡海况特征的画面,整体光影和物理逻辑较为合理。

最后则是老生常谈的“性价比”。以1K分辨率计算,Nano Banana 2的价格仅为0.067美元,约为Pro版的一半。谷歌用更低的成本,换来了画质接近Pro版、更快的生成效率,以及独占的4K输出能力。在价格与性能同时下探的情况下,直接挑战Midjourney和DALL·E在性价比上的短板。
另外,谷歌已将Nano Banana 2设为默认图像生成模型,并整合进Gemini、Google Search、Google Lens及Flow等核心产品,同时通过Gemini API和Vertex AI向开发者开放。这意味着,无论是普通用户、内容创作者还是企业级开发者,都可以在日常使用与生产流程中更广泛地享受到这项技术。
总体来看,Nano Banana 2的升级路径偏向“去炫技化”——将重心放在生成效率、跨平台协同与成本控制上,试图将人工智能图像生成从演示场景推进至常规工作流。
从资本市场角度出发,谷歌此次更新暂未激起明显波澜。一位二级市场投资经理认为,前一晚美股行情主要受“软件压制硬件”的结构性因素主导,相关影响是否释放,仍需等待后续交易时段的市场反馈。对于持续关注AI模型动态的开发者,可以来云栈社区获取更多技术资讯与深度讨论。