从一款火爆的AI漫剧APP说起
在今年1月初,一个名为 DirectorAI 的开源开源项目首次发布。这款利用 AI 一键生成剧本、分镜并合成视频的APP迅速获得了大量关注。

项目在 GitHub 上很快收获了 764 个 Star 和 181 个 Fork,远超开发团队的预期。更令人惊喜的是,其影响力还吸引到了国际开发者的参与,甚至有用户提 Issue 希望项目支持多语言。

这或许就是开源的魅力所在。不过,团队也注意到,移动端应用虽然方便,但许多用户更期待一个能够随时随地通过浏览器访问的 Web 版本。
响应需求:Web版AI漫剧平台诞生
面对用户“求电脑版本”的呼声,开发团队决定投入新一轮的开发。耗时约20天,一个功能完整的 Web 版本 AI 漫剧平台正式开源。
这个平台的核心目标用户,依然是那些对 AI 漫剧创作感兴趣但缺乏专业背景的爱好者。其主打功能便是 “一句话生成漫剧故事”。你只需输入一个简单的创意,比如“一个程序员深夜加班发现AI有了自我意识”,平台就能自动为你生成完整的故事线、角色设定和分镜头。

对于暂时没有灵感的用户,平台也贴心地内置了多个主题模板,例如“马到成功送祝福”、“马上有美食”等充满节日氛围的故事范例,一键加载即可开始创作。

当然,平台也充分考虑了高阶用户的自由创作需求。除了“一句话生成”的快速通道,还提供了一个完整的自定义工作流。用户可以从头开始,逐步完成“创建角色 → 创建场景 → 编排分镜 → 生成图像 → 合成视频 → 导出作品”的全流程。

在分镜编排阶段,你可以自由添加不同景别的镜头,如全景、中景、特写、过肩镜头等,并详细描述每个镜头中的动作和情节。

编排完成后,即可进入生成阶段,AI 会根据你的描述逐个生成对应的镜头画面。

整个项目的技术核心之一,是解决了 AI 绘画中令人头疼的角色一致性问题。通过一系列深度调优,平台能够确保同一个角色在不同镜头、不同角度下保持外貌特征的稳定。

团队为此开发了多种风格系列,涵盖 2D 卡通、3D 动画、写实等多种场景,以满足不同题材漫剧的创作需求。


开发实战:踩坑经验与最佳实践分享
在开发这款人工智能驱动的漫剧平台过程中,团队积累了不少宝贵的实战经验,尤其是在提升生成质量和优化工作流方面。
1. 角色一致性的解决方案
角色“变脸”是AI生图领域的常见难题。团队尝试了多种方案,最终一个稳定有效的实践是结合参考图、标准化描述和种子锁定。
- 参考图选择:清晰、无遮挡、包含多角度的角色图片。
- 描述格式:采用结构化描述,例如“
25岁女性,黑色长直发,棕色大眼睛,穿白色衬衫和黑色西装裙,戴细框眼镜”。
- 种子锁定:在生成第一个镜头后,记录其随机种子,后续镜头使用相同种子,配合变化的提示词,能在保持整体风格一致的前提下产生画面差异。
2. 内置标准镜头模板
为了让不懂影视运镜的用户也能轻松创作,平台内置了 9 种经过验证的标准镜头模板,AI 可以根据故事内容自动推荐或由用户手动选择。

模板分为三大类:
- 建立类:用于开场、建立环境(如全景俯瞰)。
- 聚焦类:用于对话、情绪表达(如标准中景、特写)。
- 动势类:用于表现动作、转场(如跟随视角、主观镜头)。
3. 提升生成质量的技巧
- 画面描述具体化:避免使用“漂亮”、“好看”等模糊词汇,尽可能详细描述构图、光影、角色动作和表情。
- 善用负面提示词:明确排除不想要的元素,如“extra fingers, bad anatomy”。
- 迭代选择:对重要镜头可以多次生成,从中挑选最满意的一张。
4. 分镜节奏设计原则
一个流畅的漫剧需要合理的镜头节奏。可以参考以下基本原则:
基本原则:
- 全景→中景→特写(渐进式)
- 对话场景用过肩镜头正反打
- 情绪高潮用特写
- 场景转换用全景或框中框
示例分镜节奏:
1. T1 全景俯瞰 - 城市远景(建立环境)
2. T2 环境中景 - 主角走在街上(角色入场)
3. T4 标准中景 - 主角看手机(日常动作)
4. T6 特写 - 手机屏幕显示消息(信息传递)
5. T6 特写 - 主角惊讶表情(情绪反应)
6. T8 跟随视角 - 主角奔跑(动态转场)
手把手教程:如何部署与使用
整体创作流程概览
整个平台的创作遵循一个清晰的可视化流程,即使是新手也能快速上手:
[导入剧本] → [创建角色] → [创建场景] → [编排分镜] → [生成图片] → [生成视频] → [导出]
↓ ↓ ↓ ↓ ↓
(可选) 上传参考图 上传参考图 选择模板 AI生成
填写描述 填写描述 写画面描述 保持一致性

关键配置:选择图像生成后端
平台支持两种图像生成方式:本地ComfyUI 和 云端API。对于大多数用户,尤其是希望快速开始、避免复杂环境配置的,推荐使用云端API方式。
这里以 Atlas Cloud 为例,演示如何配置。这是一个聚合了多种主流AI模型的API平台,在漫剧生成场景下,其稳定性和对内容的友好度表现不错。
步骤 1:获取API密钥
- 注册并登录 Atlas Cloud。
- 进入控制台,在
API密钥 管理页面,创建一个新的密钥。

- 创建时可为密钥命名(例如“漫剧平台”),过期时间可选择“永不过期”。

- 创建成功后,立即复制生成的API密钥。

步骤 2:配置项目环境变量
- 将开源项目克隆到本地。
- 在项目根目录下,找到或复制
.env.example 文件,重命名为 .env。
- 使用文本编辑器打开
.env 文件,关键配置如下:
# AI Storyboard Pro - Environment Configuration
# ====================================
# Image Generation Backend
# 使用 API 方式(云端 API)
IMAGE_BACKEND=api
# ====================================
# API Configuration
# Atlas Cloud API 配置
NANA_BANANA_API_KEY = 你的API密钥 # 粘贴刚才复制的密钥
NANA_BANANA_BASE_URL=https://api.atlascloud.ai

步骤 3:启动项目并开始创作
配置完成后,按照项目README的指引启动Web服务。打开浏览器即可开始你的漫剧创作。
- 创建角色与场景:你可以为故事添加角色,并设定故事发生的场景。平台支持通过AI辅助生成描述,也支持手动精细调整。

- 编排分镜:为核心情节添加镜头。选择镜头类型,描述画面内容,并选择该镜头中出镜的角色。

平台会为每个镜头生成专业的分镜提示语和AI绘图提示词,确保生成质量。

- 生成图像与视频:编排完成后,即可一键生成所有镜头的图片。图片生成完毕后,可以继续一键合成每个镜头的动态视频。


- 导出作品:最后,你可以将生成的所有素材(图片包、视频、分镜脚本、项目文件)打包导出,用于后续的视频剪辑或存档。

开源共建与展望
这个项目的诞生,源于几个开发者对AI漫剧创作的热情。尽管他们并非专业导演或行业从业者,但借助现代AI编程工具,成功地将想法落地为可用的产品。目前,项目由三位核心贡献者共同维护,并在社区中持续迭代优化。
项目完全开源,这意味着你不仅可以免费使用所有功能,还可以根据自身需求修改代码,甚至使用 Claude Code 等AI编程助手来定制专属功能。这正是开源与AI结合带来的可能性:打造真正满足自己创意需求的工具,而非被动接受现有的解决方案。
如果你对这个项目感兴趣,欢迎访问 GitHub 仓库了解更多细节、Star 支持或参与共建。在AI内容创作的时代,每个人都有可能成为自己故事的导演。