找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1644

积分

0

好友

212

主题
发表于 昨天 04:25 | 查看: 3| 回复: 0

谷歌的 Nano Banana 2(即 Gemini 3.1 Flash 图像模型)已正式亮相。简而言之,它将以往具备专业(Pro)级的能力,融入到了闪电般迅捷的 Flash 推理引擎中。

Nano Banana 2 宣传图:一个穿着蓝色背带裤、标有“NB2”的卡通香蕉角色,周围环绕着其特性介绍,如 Flash 级速度、Pro 级能力、4K分辨率和角色一致性等

核心亮点:多图绘制,角色保持一致 🎨

这次更新最实用的功能之一,无疑是大幅增强的“角色一致性”能力。这正好切中了当前许多AIGC绘画工具的一个痛点——在同一系列图片中,角色形象难以维持稳定。

  • 角色一致性:Nano Banana 2 能够在一个工作流中,保持最多 5 个角色14 个物体 的外观特征不变。
  • 创作流程革新:这意味着,当你想用 AI 创作连环画、故事板或系列插画时,主角的面孔和造型不会再从一张图“突变”到另一张图。这对于需要视觉连贯性的项目来说,是一个巨大的进步。
  • 精准指令遵循:谷歌同时强调了模型的“精准指令遵循”能力,它会尽力捕捉并实现你提示词中的所有细节要求,减少遗漏。

理解力升级:更懂现实,字正腔圆 🌍

模型现已集成谷歌搜索的实时信息,这使其对世界的认知更贴近现实。

  • 减少常识错误:基于对真实世界的更好理解,模型生成的图像在逻辑和常识上会更加合理。
  • 强大的文本渲染:过去,让 AI 在图片中生成清晰、正确的文字是一大挑战。Nano Banana 2 在这方面表现突出,能生成非常清晰、易读的文字。更值得一提的是,它还能对图像中的文字进行翻译和本地化。例如,你可以直接要求它生成一张包含多国语言标语的海报,一步到位。

速度与画质兼得:4K 清晰,质感出众 ⚡️

虽然冠以“Flash”之名强调速度,但在画质上并未妥协。

  • 高分辨率支持:支持从 512px 到 4K (3840×2160) 的多种分辨率,且长宽比可自由调整。无论是制作竖屏社交媒体图片还是宽屏演示文稿背景,都能获得足够的清晰度。
  • 细节质感提升:在光影、纹理和细节表现上,相比初代 Nano Banana 有了明显进步,能够轻松生成具有照片级写实感的图像。

如何上手使用?💡

目前,谷歌已经开始在其生态内的多项服务中集成并推广这一新模型:

  1. Gemini App:默认模型已更新为最新版本。如果你是 Gemini Pro 或 Ultra 订阅用户,若想体验更深入的创作,仍可通过菜单切换回原有的 Pro 模型。
  2. 谷歌搜索:在 AI 概述(Search Generative Experience)和 Lens 图像识别功能中可以直接调用。
  3. Flow & Google Ads:对于营销人员和广告从业者,现在可以直接利用它来快速生成营销素材。
  4. API & AI Studio:对于开发者而言,目前已经可以通过 API 或 AI Studio 平台进行试用和集成开发。

最后,为了应对 AI 生成内容带来的挑战,谷歌在 Nano Banana 2 中深度集成了 SynthID(数字水印)C2PA(内容来源和真实性标准) 技术。这意味着,图像是否由 AI 生成以及其生成溯源信息可以被有效标识和查验,旨在提升内容的透明度和可信度。

想了解更多具体的 Prompt 案例和技术细节,可以查阅谷歌的官方发布博客。

原文链接:https://blog.google/innovation-and-ai/technology/ai/nano-banana-2




上一篇:OpenScholar开源科研AI系统:超越GPT-4o,实现专家级引文准确性
下一篇:《宝可梦TCGP》上线一年营收12亿美元,解析全球第一IP的长青秘诀
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-1 00:42 , Processed in 0.474139 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表