找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3899

积分

0

好友

537

主题
发表于 15 小时前 | 查看: 2| 回复: 0

惊喜不多,性价比拉满。

这两天,谷歌又有了新动作。就在2月26日晚间,谷歌在Gemini App中上线了Nano Banana 2(技术代号Gemini 3.1 Flash Image)。这款图像模型已全面接入Gemini App、Google Search及开发者API。这一全新模型融合了此前Nano Banana Pro的高阶能力与Gemini Flash的极速性能,更像是一次从“酷炫秀”向“生产级工具”的战略转移。

相比此前Nano banana pro带来的惊艳感,这次更新在速度和价格上有极大优势。资深AI产品经理麦莉也表示,Nano Banana 2的图像生成速度比上一代Pro模型明显更快,只是亮点确实谈不上。

据Google DeepMind官方博客披露,Nano Banana 2的核心卖点是“将Nano Banana Pro的高级能力融入Flash速度”。

Nano Banana 2官方宣传图

首先,Nano Banana 2最直观的冲击来自原生4K输出。前代Nano Banana(基于Gemini 2.5 Flash)的画质在复杂场景下会有涂抹感,Banana 2在保持同等响应速度的前提下,支持512px至4K的原始分辨率输出,皮肤纹理、褶皱、远景细节不再主要依赖后期放大来提升清晰度。AI圈内人士认为,这次Banana 2的光影逻辑更符合真实世界,核心是推理层的升级。

实际测试输出一张4K高分辨率人像,在光影和水珠的处理上确实有肉眼可见的提升:

Nano Banana 2生成的高细节人像图

更实用的是,本次Banana 2支持单workflow追踪最多5个角色与14个物体,可基于14张参考图进行元素融合,这对系列插画、故事板制作等需要角色一致性的场景较为实用。

比如将一张电影海报进行换脸处理后:

经过AI换脸处理的电影海报

再根据prompt的关键词设置后,就会得到这样一组分镜头画面:

由模型生成的分镜头概念图

难怪有博主称设计行业要变天了。随意上传一款产品,让Nano banana 2设计出一套视觉方案,没想到细节都很到位:

AI为产品生成的电商视觉方案图

其次,Nano Banana 2增强了世界知识与文本渲染能力。文字生成一直是AIGC绘图的行业痛点,Banana 2在这方面进步明显:海报标题、屏幕UI、白板手写体均可清晰呈现,中文支持度达标。

在prompt中包含明确文本的相关场景测试中,Nano Banana 2对指定中文和英文文本的还原准确度较高:

生成的电影节海报,文字清晰可辨

不过也发现,虽然中文显示基本可用,但也别塞太多字,不然生成的图片就会出现模糊和粘连的问题。

包含过多文字导致显示模糊的信息图

此外,Nano Banana 2得益于Gemini系列强大的世界知识基础,能够调用实时网络信息来提升图像生成效果和细节准确性。为此,谷歌做了一个‘Window Seat’(靠窗座位)的展示,意味着Nano Banana 2结合全球各地的真实场景和实时天气数据,生成当下最符合现实世界的窗外照。

结合北京刚刚下过雪的天气,体验一下谷歌引以为傲的‘Window Seat’演示:

结合实时天气生成的北京胡同窗外雪景

在更复杂的指令理解场景下,Nano Banana 2的稳定性也有所提升。设置了包含具体地理位置、室内视角和极端天气条件的提示。模型能够较好地理解“船舱内靠窗视角”这一空间约束,并生成符合德雷克海峡海况特征的画面,整体光影和物理逻辑较为合理。

根据复杂地理与天气提示生成的船舱视角图

最后则是老生常谈的“性价比”。以1K分辨率计算,Nano Banana 2的价格仅为0.067美元,约为Pro版的一半。谷歌用更低的成本,换来了画质接近Pro版、更快的生成效率,以及独占的4K输出能力。在价格与性能同时下探的情况下,直接挑战Midjourney和DALL·E在性价比上的短板。

另外,谷歌已将Nano Banana 2设为默认图像生成模型,并整合进Gemini、Google Search、Google Lens及Flow等核心产品,同时通过Gemini API和Vertex AI向开发者开放。这意味着,无论是普通用户、内容创作者还是企业级开发者,都可以在日常使用与生产流程中更广泛地享受到这项技术。

总体来看,Nano Banana 2的升级路径偏向“去炫技化”——将重心放在生成效率、跨平台协同与成本控制上,试图将人工智能图像生成从演示场景推进至常规工作流。

从资本市场角度出发,谷歌此次更新暂未激起明显波澜。一位二级市场投资经理认为,前一晚美股行情主要受“软件压制硬件”的结构性因素主导,相关影响是否释放,仍需等待后续交易时段的市场反馈。对于持续关注AI模型动态的开发者,可以来云栈社区获取更多技术资讯与深度讨论。




上一篇:C++程序调试指南:Linux下GDB、Valgrind等五大工具实战解析
下一篇:深度解读:英伟达投资OpenAI的背后,黄仁勋的算力生态棋局如何布局?
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-1 20:21 , Processed in 0.520659 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表