4035 积分	0 好友	527 主题

谷歌 Gemini 3.1 Flash (Nano Banana 2) 发布：角色一致性、多语言文本生成，成本减半

发表于 2026-2-28 04:25:57 | 查看: 181| 回复: 0

谷歌的 Nano Banana 2（即 Gemini 3.1 Flash 图像模型）已正式亮相。简而言之，它将以往具备专业（Pro）级的能力，融入到了闪电般迅捷的 Flash 推理引擎中。

Nano Banana 2 宣传图：一个穿着蓝色背带裤、标有“NB2”的卡通香蕉角色，周围环绕着其特性介绍，如 Flash 级速度、Pro 级能力、4K分辨率和角色一致性等

核心亮点：多图绘制，角色保持一致 🎨

这次更新最实用的功能之一，无疑是大幅增强的“角色一致性”能力。这正好切中了当前许多AIGC绘画工具的一个痛点——在同一系列图片中，角色形象难以维持稳定。

角色一致性：Nano Banana 2 能够在一个工作流中，保持最多 5 个角色 或 14 个物体 的外观特征不变。
创作流程革新：这意味着，当你想用 AI 创作连环画、故事板或系列插画时，主角的面孔和造型不会再从一张图“突变”到另一张图。这对于需要视觉连贯性的项目来说，是一个巨大的进步。
精准指令遵循：谷歌同时强调了模型的“精准指令遵循”能力，它会尽力捕捉并实现你提示词中的所有细节要求，减少遗漏。

模型现已集成谷歌搜索的实时信息，这使其对世界的认知更贴近现实。

减少常识错误：基于对真实世界的更好理解，模型生成的图像在逻辑和常识上会更加合理。
强大的文本渲染：过去，让 AI 在图片中生成清晰、正确的文字是一大挑战。Nano Banana 2 在这方面表现突出，能生成非常清晰、易读的文字。更值得一提的是，它还能对图像中的文字进行翻译和本地化。例如，你可以直接要求它生成一张包含多国语言标语的海报，一步到位。

虽然冠以“Flash”之名强调速度，但在画质上并未妥协。

高分辨率支持：支持从 512px 到 4K (3840×2160) 的多种分辨率，且长宽比可自由调整。无论是制作竖屏社交媒体图片还是宽屏演示文稿背景，都能获得足够的清晰度。
细节质感提升：在光影、纹理和细节表现上，相比初代 Nano Banana 有了明显进步，能够轻松生成具有照片级写实感的图像。

目前，谷歌已经开始在其生态内的多项服务中集成并推广这一新模型：

Gemini App：默认模型已更新为最新版本。如果你是 Gemini Pro 或 Ultra 订阅用户，若想体验更深入的创作，仍可通过菜单切换回原有的 Pro 模型。
谷歌搜索：在 AI 概述（Search Generative Experience）和 Lens 图像识别功能中可以直接调用。
Flow & Google Ads：对于营销人员和广告从业者，现在可以直接利用它来快速生成营销素材。
API & AI Studio：对于开发者而言，目前已经可以通过 API 或 AI Studio 平台进行试用和集成开发。

最后，为了应对 AI 生成内容带来的挑战，谷歌在 Nano Banana 2 中深度集成了 SynthID（数字水印） 和 C2PA（内容来源和真实性标准） 技术。这意味着，图像是否由 AI 生成以及其生成溯源信息可以被有效标识和查验，旨在提升内容的透明度和可信度。

想了解更多具体的 Prompt 案例和技术细节，可以查阅谷歌的官方发布博客。