老鬼看这种 Skill,第一眼一般不看它能不能画得漂亮,先看两件事:能不能批量出图,风格会不会崩。
Visual IP Illustrations 这个项目就卡在这儿。它不是让你随手写一句 prompt,然后祈祷模型别把人物画歪,而是先选一条视觉 IP 路线,再围着这个角色生成一组 16:9 手绘风正文配图。README 里写得很直白:它会读文章里的“认知锚点”,把一个判断、工作流、结构或隐喻,转成一张解释图。
啧,这个点挺实用。
公众号配图最烦的不是“没有图”,而是每张图都像不同外包画的。第一张小黑,第二张赛博猫,第三张突然来了个 3D 玻璃球,读者还没看正文,视觉先散了。这个 Skill 现在给了几条路线:默认小黑、纸盒人 Littlebox、Rust 螃蟹 Ferris、Seal、OpenClaw、Go Gopher,还有一个蔡徐坤的 stylized mascot-only 路线。
我比较在意的是,它没有只写“支持多个角色”这种空话,而是把每个角色的边界写进去了。比如 Tom 是 protected-character 路线,Ferris、Go Gopher 这类会挂 source-reviewed,蔡徐坤路线还专门写了 public-figure likeness boundary、public sample review gate 这些限制。
这块先别急着吹,反而说明它麻烦。
但做内容工具,麻烦有时候是好事。以前做一组文章配图,最容易翻车的就是“上一张可以,下一张不像同一个世界”。角色设定、动作、背景、文字标签、输出目录,全靠人脑记,写到第三张就开始漂。Visual IP Illustrations 的输出里会先给 4 到 8 张 shot list,每张图包含位置、主题、核心观点、结构类型、角色动作和建议可见标签,最后再出 PNG。
这就很现实。
我会把它当成“文章配图导演”,不是单纯画图工具。比如写一个 AI Agent 工作流,就让小黑去搬箱子、接线、卡在回调口;写 Rust 项目,就让 Ferris 做构建、守门、检查边界。视觉隐喻别太满,读者能一眼看懂就行。
保留意见也有:这种 Skill 的效果很吃底层图像模型,角色越敏感,审核和授权边界越要小心。尤其是公众人物、已有角色,不适合拿来乱蹭广告语。
但如果你是经常写公众号、博客、Notion 文档的人,Visual IP Illustrations 值得扫一眼。它解决的不是“生成一张好看的图”,而是“整篇文章别像拼贴海报”。
项目已在 GitHub 上开源:yangchuansheng/visual-ip-illustrations
|