阿里千问的 Qwen-Image-2.0 刚刚发布,我们就第一时间上手,想看看这个新模型在实际应用中的表现究竟如何。这次,我们直接用它来生成一个视频封面图,让它解决一个具体的视觉设计需求。
从实测结果来看,新模型对于提示词中“手绘风格”和特定“颜色编码”这类复杂指令的理解相当到位,在布局和细节的还原上超出了预期。

目前,我们可以通过 Qwen Chat 平台免费体验这个新模型,对 人工智能 图像生成感兴趣的朋友不妨去试试。

这次测试我们使用了下面这个包含详细视觉和布局要求的提示词:
// 关键内容 (KEY CONTENT)
- 引用文本标题: x claude sess - 让历史会话井井有条
- 引用文本副标题: FZF 交互式预览 + 快速清理,告别混乱的会话历史
- 署名: @x-cmd
// 视觉画面 (VISUAL)
画面中心是一个手绘风格的文件柜,抽屉半开,里面整齐排列着带标签的文件夹(代表会话)。文件柜上方漂浮着一个放大镜图标(代表 FZF 搜索)和一个垃圾桶图标(代表清理功能)。背景是柔和的米白色 #F9F7F2,整体采用温暖的手绘插画风格,线条自然流畅。文件夹用柔和的珊瑚红 #FF7F7F 和鼠尾草绿 #8FA87A 点缀。
// 布局结构 (LAYOUT)
海报式布局。标题用手写圆体居中上方,文件柜占据画面中心偏下,放大镜和垃圾桶图标在文件柜两侧漂浮。副标题和署名位于下方,用较小的手写体呈现。
总的来说,Qwen-Image-2.0 在这次针对特定风格和细节要求的测试中展现出了不错的理解与执行能力,标志着其在多模态AI领域又向前迈进了一步。对于需要快速生成概念插图或设计稿的开发者而言,这无疑是一个值得关注的新工具。更多关于AIGC模型的技术讨论和应用分享,欢迎访问 云栈社区。
|