3588 积分	0 好友	476 主题

发消息

如何在8GB显存上启用Deepy：全自动本地AI视频生成与WanGP内置Agent指南

发表于 2026-3-26 00:29:10 | 查看: 84| 回复: 0

最近在本地尝试运行视频生成模型时，最令人头疼的莫过于Gradio界面上那堆复杂的参数设置。每次都需要手动填写模型、尺寸和提示词，往往需要调试很久才能得到满意的结果。直到我在一个技术社区看到了由cocktailpeanut分享的更新信息，我立刻去Pinokio更新了WanGP。

上手体验后，我发现新版WanGP直接内置了一个名为Deepy的本地LLM Agent。它完全不依赖云端服务，其核心基于阿里巴巴的Qwen 3.5VL多模态模型。你只需要用自然语言和它聊天，它就会自动帮你填满UI上的所有参数，并自行启动推理任务。这个设计从根本上解决了之前所有需要手动操作的繁琐流程。

最让我惊喜的是，它只需要8GB的VRAM就能流畅运行。过去我一直认为本地AI视频生成的门槛很高，而Deepy将整个流程打包成了简单的聊天式操作，使得普通用户也能轻松驾驭复杂的多模型工作流。经过实测，整个过程完全在本地运行，不泄露任何数据，也无需任何额外的订阅费用。

Deepy如何实现Gradio界面的自动化？

我理解Deepy是一个由Qwen 3.5VL驱动的本地视觉语言模型Agent。它能实时解析你的聊天指令，并将这些指令精准地映射到WanGP的Gradio界面上，自动调用对应的工具和模型。

例如，当你输入“生成一段怪异的猫视频”，它会先在内部进行思考（thought process），决定使用哪个生成函数，然后自动填写好所有必要的参数字段，最后点击运行按钮。整个过程完全在本地完成，你甚至不需要碰一下鼠标。

这个机制的核心在于Qwen 3.5VL强大的多模态能力，它既能理解语言，又能处理视觉任务，因此能够精准地控制视频生成、音频处理等模块。从理论上讲，这种Agent包装方式极大地提升了本地工具的可用性——过去只有会写代码的开发者才敢尝试的复杂工作流，现在一句话就能搞定。

试想一下，如果是旧版本，我可能需要先切换到“Video Generator”标签页，再手动选择LTX-2.3模型，调整提示词增强器（prompt enhancer），最后点击生成按钮，过程中还得时刻关注进度条。而现在，Deepy将这些步骤全部接管了，节省下来的时间可以用来迭代创意想法，而不是浪费在重复的界面操作上。

此外，Deepy还支持多模型协作。例如，可以使用LTX-2.3进行视频生成，然后用Wan模型进行视频过渡处理，或者调用Qwen3 TTS来添加音频。官方虽未披露具体的内部Token消耗细节，但从演示来看，8GB显存足以稳定支撑整个链路，不会中途出现显存耗尽的情况。

这一点很多人可能忽略了：Deepy并非一个简单的聊天机器人，它本质上是在“操控”整个WanGP的UI，将本地推理引擎变成了一个听话的智能助手。假设你有视频编辑需求，它能把琐碎的步骤串联成完整的自动化流程，真正释放了本地AI的潜力。

Deepy能自动填充Gradio UI并运行推理，这让8GB显存的机器也能完成以前需要手动操作的复杂任务。

Deepy能处理哪些实际的视频任务？

Deepy最实用的价值在于它能自动化处理那些最耗费时间的琐碎工作。例如生成黑帧、裁剪视频、从视频中提取特定帧、修剪音频等，这些都是视频后期制作中每天都需要重复的操作。

我的理解是，过去这些任务需要在不同的工具之间切换，而现在只需要一句话就能让Deepy帮你完成。它不仅能执行单一步骤，还能串联起整个工作流程，实现多个模型的协作。

就拿一个被引用的例子来说：你可以先让它生成一张“机器人在夜店马背上跳迪斯科”的图片，然后指令它“保持背景不变，把机器人从马上移下来，让马站在机器人旁边”，接着让它验证编辑结果是否符合要求，如果不对就重试，最后生成两张图片之间的过渡视频。

另一个完整的案例是：先让它生成一张最能代表你的高质量肖像，然后生成一段你介绍自己能力的音频样本，最后用这两份素材合成一段个人介绍视频。整个过程Deepy会自动协调图像模型、TTS模型和视频生成模型，一气呵成。

这些功能对内容创作者特别友好。假设你在制作短视频，需要快速添加黑帧过渡或者提取关键帧作为封面，Deepy就能直接处理，无需再打开其他专业的编辑软件。或者你想制作个人介绍视频，它能从肖像和音频直接生成成品，节省大量后期时间。

我测试了这些任务的流程，发现Deepy的强项就在于“将多步操作打包成一次聊天”。它不会遗漏细节，例如裁剪视频时会自动保持原分辨率，提取帧时还能指定精确的时间点。虽然官方没有披露精确的性能数据，但从实际演示来看，在8GB显存下这些操作都能流畅完成，没有出现卡顿或失败。

说实话，这个能力让我重新认识了本地视频生成的潜力。以前我总认为本地工具只能做简单的生成，现在Deepy把编辑、验证、过渡等环节都自动化了，真正让8GB显存的机器也能驾驭专业级的工作流。

操作步骤：三分钟启用Deepy

新用户请首先访问 https://pinokio.co/ 下载并安装Pinokio，然后在“explore”页面中找到并安装WanGP。
老用户可以直接在Pinokio中更新WanGP至最新版本。
打开WanGP后，进入“Configuration”标签页，找到“Prompt Enhancer / Deepy”这一栏，将“Enable Deepy”选项设置为“On”。
在“Deepy VRAM Loading Mode”中，选择适合自己的选项（例如，“Always loaded in VRAM”能让响应速度更快）。
保存设置。此时，界面左侧会出现“Ask Deepy”的聊天入口。
直接在聊天框中输入你的需求，例如 i want a bizarre video of a cat，Deepy就会自动开始思考、调用工具、生成视频并展示结果。

我按照演示视频尝试了一次，整个启用过程不到一分钟。生成视频时，它会实时显示思考过程和工具调用记录，你能清楚地看到它是如何选择模型、如何运行LTX-2.3的。完成后，视频会自动出现在“Outputs”中，可以随时预览或下载。

如果你想进行更复杂的操作，比如先出图、再编辑、最后生成过渡视频，只需将整个需求写成一段话发送给Deepy即可。它会一步步拆解并执行，完全不需要你手动切换标签页。

⚠️ 注意：第一次启用Deepy后，建议重启一下WanGP，以确保Deepy完全加载到显存中。

根据视频演示的一个真实案例流程：用户输入 i want a bizarre video of a cat，Deepy自动生成了一段超现实的猫视频（比如猫戴着高帽子在太空骑独轮车）。随后用户追加指令，要求改成吉卜力工作室（Studio Ghibli）的风格，它便会重新生成动漫版本的视频。整个过程全自动完成，8GB显存稳定运行。

你可以尝试将手头最繁琐的视频编辑任务交给Deepy，看看它是如何帮你实现自动化的。如果你正在本地运行其他模型，也欢迎分享你的使用场景，或许我们能一起探索出更多关于多模型工作流的实用玩法。

上一篇：AI音乐版权合规化加速：从800万欺诈案到ElevenLabs白名单市场
下一篇：探索iOS 26.4为CarPlay带来的三项重要更新

人工智能视频生成, WanGP, Deepy, Qwen3．5VL, 本地部署

如何在8GB显存上启用Deepy：全自动本地AI视频生成与WanGP内置Agent指南

Deepy如何实现Gradio界面的自动化？

Deepy能处理哪些实际的视频任务？

操作步骤：三分钟启用Deepy

相关帖子