该组合是目前零成本、无限生成且角色一致性较强的本地方案。Qwen(本地大模型)负责写剧本、自动拆分镜头及生成提示词;ComfyUI 负责图像生成、角色一致性及动态视频制作。适合新手或日更用户,低配 8GB 显存即可运行(推荐 12GB+ 更流畅)。全流程免费、无网络依赖、隐私安全。
一、硬件要求
- GPU:NVIDIA 8GB 显存起步(RTX 3060 12GB 较稳),AMD/Intel 也可(需 ROCm/OneAPI)。
- 内存:16GB+ RAM(32GB 最佳)。
- 硬盘:SSD 50GB+ 空闲空间。
- 系统:Windows 10/11(推荐)或 Linux/Mac。
二、安装本地 Qwen
- 下载 Ollama(最简单本地 LLM 工具):访问官网 https://ollama.com 下载安装。
- 打开命令提示符(Win+R 输入 cmd),运行命令拉取模型:
ollama pull qwen3.5:32b
推荐使用逻辑较强的版本,若显存不足可选轻量版:
ollama pull qwen2.5:14b
- 测试:运行
ollama run qwen3.5。


