你是否想过,将一篇优质的知乎回答或其他网络文章,快速变成配有语音和字幕的视频,并一键分发到B站、抖音等多个平台?现在,借助一款名为 Panda Video Generator(熊猫视频自动化引擎) 的开源工具,这一切都能轻松实现。它专为开发者和内容创作者设计,旨在提供一站式的全自动化视频内容生成与发布解决方案。
✨ 核心特性:三大“一键”自动化工作流
Panda Video Generator 的核心设计理念就是“自动化”,致力于将繁琐的视频制作流程简化为几个简单的命令或点击操作。开发者社区 云栈社区 中不乏对这类提升效率的自动化工具的关注与探讨。
- 🕷️ 一键网页转文本:彻底告别手动复制粘贴。只需提供一个网页链接(例如知乎问答地址),工具便能自动抓取标题和正文内容,并通过大语言模型(LLM)将其整理成结构清晰、适合口播的文稿。
- 🎬 一键文本转视频:内置强大的渲染工作流。它能将整理好的文稿通过微软 Edge TTS 服务转换为自然流畅的语音,同步生成 VTT 格式的字幕文件,最后利用 Remotion 视频模板引擎渲染出最终的成片视频。
- 🚀 一键多平台发布:视频制作完成后,无需再手动登录各个平台逐一上传。工具通过浏览器自动化技术,可以实现一键将视频发布到B站、抖音、视频号、YouTube、小红书、快手等主流平台。
- 🧭 网页自动化向导:对于不习惯使用命令行的用户,项目还提供了一个基于网页的图形化向导。只需跟随界面指引点击鼠标,就能一步步完成从文稿生成、语音合成、视频渲染到最终发布的全过程。
🎥 实际效果与成品展示
让我们通过下面的演示和实例,直观感受一下 Panda Video Generator 的能力。
功能演示视频:

观看完整的功能演示视频,请访问 Bilibili:
https://www.bilibili.com/video/BV141XfB3ELj/
成品展示视频:

观看由工具自动生成的成品视频,请访问 Bilibili:
https://www.bilibili.com/video/BV19Rw9zwEd4/
🚀 快速上手指南:从零开始部署与使用
只需完成简单的环境配置,你就能立刻开始体验自动化视频创作的魅力。
第一步:基础环境配置
开始前,请确保你的系统满足以下要求。
1. 环境依赖:
- Node.js:版本要求为
20.9 或更高。
- ffmpeg:必须安装并正确配置到系统环境变量
PATH 中,工具会调用它进行音视频处理。
- macOS:
brew install ffmpeg
- Ubuntu:
sudo apt install ffmpeg
- Windows:可通过
choco install ffmpeg 安装,或从 ffmpeg官网 下载并手动配置环境变量。
2. 获取并安装项目:
# 克隆项目代码到本地
git clone https://github.com/szhshp/panda-video-generator.git
# 进入项目目录
cd panda-video-generator
# 推荐使用项目提供的一键安装命令,它会自动处理所有依赖
pnpm install:project
3. 验证环境与配置:
- 运行自检命令,确保所有前置条件都已就绪:
pnpm check:setup
- 复制环境变量示例文件,并填入必要的配置信息(例如后续会用到的 API Key):
cp .env.example .env
第二步:选择你的操作方式
环境就绪后,你可以根据自身情况选择最适合的使用方式。
方式一:网页自动化向导(推荐新手使用)
这是最直观的方式,无需记忆任何命令。
- 在项目根目录下运行命令启动向导服务:
pnpm automation
- 你的默认浏览器会自动打开向导页面。
- 根据页面上的引导,依次完成“文稿处理”、“TTS语音生成”、“视频渲染”和“发布”等步骤即可。
方式二:命令行接口(适合进阶与自动化集成)
对于熟悉终端操作或希望将流程脚本化的用户,命令行模式提供了更精细的控制能力。
📚 命令行模式详解
下面我们将详细拆解命令行的分步操作流程。
快速示例:一键从知乎链接生成视频
这是一个经典的端到端(End-to-End)用法,输入一个知乎问题链接,直接输出最终视频文件。
# 将 <知乎问题链接> 替换为实际的URL
pnpm pipeline:zhihu-video -- <知乎问题链接>
# 具体示例
pnpm pipeline:zhihu-video -- https://www.zhihu.com/question/316150890
注意:此功能依赖 LLM 对抓取的内容进行整理和优化,因此你需要在 .env 文件中配置好 DEEPSEEK_API_KEY 或其他支持的 LLM API 密钥。
分步操作详解
如果你想对每一个环节进行精细控制,可以按照以下流程手动执行。
STEP 1:文稿准备与整理
目标:在 output/spider/ 目录下生成一个名为 input.txt 的口播文稿文件。
有三种方式可以准备文稿:
- 手动撰写:直接在
output/spider/input.txt 文件中编写稿件,工具会将每个非空行视为一个独立的语音段落进行处理。
- 知乎抓取 + LLM整理:
pnpm spider:zhihu -- <知乎问题URL>
此命令会自动抓取指定问题下的内容,并调用 LLM 生成 input.txt 口播稿以及存储元信息的 title.json 文件。
- 通用网页抓取 + LLM整理:
# 设置环境变量指定要抓取的网页地址
SPIDER_SOURCE='https://example.com/article' pnpm spider:extract:url
# 调用LLM对抓取内容进行总结并生成口播稿
pnpm caption:env
STEP 2:TTS语音合成与视频渲染
目标:基于上一步生成的文稿,合成语音、生成字幕,并最终渲染出视频文件 video.mp4。
STEP 3:多平台发布(可选步骤)
目标:将渲染好的视频自动上传到各大视频平台。
- 首次登录:每个平台在第一次发布前,都需要通过工具完成一次扫码登录认证。
pnpm login:bilibili # 登录B站
pnpm login:douyin # 登录抖音
# 其他平台的登录命令请查看项目根目录下的 package.json 文件
- 上传视频:
# 可以通过环境变量设置视频的标题、描述和标签
VIDEO_TITLE="我的第一个自动化视频" \
VIDEO_DESC="这是通过Panda Video Generator自动生成的" \
VIDEO_TAGS="AI,自动化,视频生成" \
pnpm upload:bilibili # 上传到B站
# 或者一键上传到所有已经登录过的平台
pnpm upload:all
📋 项目当前状态与未来规划
该项目目前仍在积极迭代开发中,已经实现了完整的核心工作流,未来的更新计划也相当丰富。
- ✅ 网页图形化向导
- ✅ 网页内容提取 (支持知乎、通用网页)
- ✅ 人工智能内容整理 (支持 DeepSeek 等 LLM)
- ✅ 文本转视频完整流程 (TTS语音、字幕生成、横竖屏视频模板)
- ✅ 自定义视频素材 (背景视频、背景音乐)
- ✅ 多平台发布 (支持 B站, 抖音, 视频号, 小红书, YouTube, 快手)
- 🚧 未来计划:支持更多内容源(如 Reddit)、集成更多 LLM 模型、AI 生成视觉素材、集成 Github Action 实现定时任务等。
如果你是一位渴望从重复的视频剪辑和上传工作中解放出来的内容创作者,或是一位对自动化流程充满热情的开发者,那么 Panda Video Generator 无疑是一个值得深入尝试的利器。立即访问其 GitHub 仓库,开启你的高效自动化视频创作之旅吧!
项目官网:https://panda.szhshp.org
GitHub 地址:https://github.com/szhshp/panda-video-generator