在家也能做 AI 导演!本地部署 Wan2.1 视频生成模型全攻略

在家也能做 AI 导演!本地部署 Wan2.1 视频生成模型全攻略

文章目录

前言

Wan2.1 模型搭配 ComfyUI 框架,能实现文本转视频、图片转动画等功能,生成的视频质量可媲美专业工具,普通 PC 就能运行,特别适合自媒体创作者、短视频团队和 AI 爱好者快速制作动态内容,无需复杂技术背景也能上手,且完全开源免费,性价比很高。

使用时发现,选择模型版本要结合显卡配置:8G 以下显存选 fp8 量化版,12G 以上选 fp16 版效果更好;生成视频时长越长,等待时间也会增加,建议先从短时长测试参数。另外,工作流文件导入后记得设置自动保存,避免成果丢失。

不过,这套系统默认只能在局域网内使用,要是出门在外想调用家里的设备生成视频,或者团队成员想远程协作调整参数,就只能局限在同一网络环境,没法随时随地操作,灵活性大打折扣。

好在通过 cpolar 内网穿透,不用搭建云服务器,也不用公网 IP,就能把本地服务映射到公网,实现异地远程访问。无论是在咖啡厅改脚本,还是团队成员分头调整视频参数,都能实时连接本地设备,让 AI 视频创作摆脱网络限制。

本方案特别适合需要快速建立AI视频生成能力的技术团队,通过三个核心组件的协同工作(ComfyUI工作流引擎、Wan2.1生成模型、cpolar网络解决方案),构建起完整的本地化AI创作系统。

image-20250328170652107

1.软件准备

1.1 ComfyUI

首先访问ComfyUI的Github下载对应操作系统版本,本例使用Windows系统进行演示,全部所需软件资源链接我会放在文章末尾。

ComfyUI Github:https://github.com/comfyanonymous/ComfyUI

image-20250328115533255

选择免安装版本(本例以适用于N卡的免安装版本0.3.27为例演示)

image-20250328115623927

下载后解压到已定义路径,然后继续下载其他软件:

image-20250328131010965

1.2 文本编码器

现在需要下载文本编码器,大家可以根据显卡内存进行选择,本例中以fp8量化版进行演示,适用于低于8G的显卡,如果显卡内存高于12G,可以选择fp16这个,生成后的视频精度会更高。

文本编码器下载地址:Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

image-20250328134032601

1.3 VAE

然后需要下载VAE,点击download即可:

image-20250328134119724

VAE下载地址:split_files/vae/wan_2.1_vae.safetensors · Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

1.4 视频生成模型

最后还需要下载Wan2.1视频生成模型,如果显卡配置较好,可以选择最完整的32G的模型。本例中以相对显卡要求较低的wan2.1_t2v_1.3B_fp16.safetensors模型进行演示:

image-20250328134504175

注意:建议使用 fp16 版本而不是 bf16 版本,因为它们会产生更好的结果。

质量等级(从高到低):fp16 > bf16 > fp8_scaled > fp8_e4m3fn

视频生成模型下载地址:Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

2.整合配置

现在要把上边准备好的编码器、模型等整合到ComfyUI中,然后导入工作流文件,就能使用它来生成视频了。

首先,把文本编码器 umt5_xxl_fp8_e4m3fn_scaled.safetensors 放入 ComfyUI/models/text_encoders/

image-20250328135303505
image-20250328135816803

第二步,将VAE文件 wan_2.1_vae.safetensors 放入 ComfyUI/models/vae/

image-20250328140305746

第三步,将 Wan 2.1 模型 放入ComfyUI/models/diffusion_models/

image-20250328140453169

最后一步,下载文字转视频所需的 Json 格式的工作流,右键另存为到桌面即可,稍后打开ComfyUI时拖入。

下载地址:comfyanonymous.github.io/ComfyUI_examples/wan/text_to_video_wan.json

image-20250328140802142

3. 本地运行测试

现在我们回到解压后的ComfyUI根目录,双击运行脚本:

image-20250328140956450

启动中:(启动后这个服务窗口也不要关)

image-20250328141131576

启动完毕后,会自动在浏览器打开ComfyUI的使用界面, 或者在网址栏输入 http://127.0.0.1:8188 也可以:

image-20250328141326584
image-20250328141419401

然后,将刚才下载好的 Json 格式的工作流文件直接拖入这个界面即可:

image-20250328141609344
image-20250328141649403

使用文生视频前,可以先右键保存动画模块,在模式中选择Always,这样以后生成的视频都会被自动保存下来:

image-20250328143630913

然后在编辑器中输入提示词(中英文都可以),点击运行即可启动文生视频工作流:

image-20250328142250430

例:一个小男孩在海边提足球

image-20250328143946700

默认生成的视频参数是832*480,如果需要修改可以在这里对宽度和高度进行调整:

image-20250328145040115

默认视频长度是33,如果需要修改可以在这里调整,更长的时长也需要更多的时间来生成视频:

image-20250328150414291
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

4. 公网使用Wan2.1模型生成视频

现在我们已经在本地成功部署了Wan2.1模型,并通过ComfyUI工作流来使用文字生成视频了,但如果我们部署的这台电脑配置不错,使用这款大模型毫无压力,要是我们出门时,或者是想团队多人使用,打算远程调用这台电脑上部署的大模型应该怎么办呢?

很简单,我们只需要安装Cpolar内网穿透工具就能轻松实现公网环境远程访问本地部署的服务!通过它,我们可以免去复杂得本地部署过程,只需要一个公网地址就可以随时随地访问到ComfyUI中来使用Wan2.1模型来生成视频了。也无需自己注册域名购买云服务器,下面是安装cpolar步骤:

cpolar官网地址:https://www.cpolar.com

点击进入cpolar官网,点击免费使用注册一个账号,并下载最新版本的Cpolar。

img

登录成功后,点击下载Cpolar到本地并安装(一路默认安装即可)本教程选择下载Windows版本。

image-20240319175308664

Cpolar安装成功后,在浏览器上访问http://localhost:9200,使用cpolar账号登录,登录后即可看到Cpolar web 配置界面,结下来在web 管理界面配置即可。

img

4.1 创建远程连接公网地址

登录cpolar web UI管理界面后,点击左侧仪表盘的隧道管理——创建隧道:

  • 隧道名称:可自定义,本例使用了: wan21 注意不要与已有的隧道名称重复
  • 协议:http
  • 本地地址:8188
  • 域名类型:随机域名
  • 地区:选择China Top
  • 高级:Http Auth:user:123(本例中用户名user 密码123)

点击保存

image-20250328151828884

创建成功后,打开左侧在线隧道列表,可以看到刚刚通过创建隧道生成了两个公网地址,接下来就可以在其他电脑(异地)上,使用任意一个地址在浏览器中访问即可。

image-20250328151931960

如下图所示,输入设置的用户名user及密码123(也可以不设置高级,就无需用户名密码直接登入,安全起见,建议配置密码,避免他人蹭显卡算力_

image-20250328152127049

可以看到成功实现使用公网地址异地远程访问本地部署的ComfyUI使用Wan2.1大模型!

需要注意的是首次登录,默认显示的工作流可能不是我们刚才使用的工作流配置,点击左边菜单栏中的队列,在之前保存过的视频中,右键加载工作流,即可远程使用对应的工作流来生成视频啦!

image-20250328152609754

小结

为了方便演示,我们在上边的操作过程中使用了cpolar生成的HTTP公网地址隧道,其公网地址是随机生成的。这种随机地址的优势在于建立速度快,可以立即使用,然而,它的缺点是网址是随机生成,这个地址在24小时内会发生随机变化,更适合于临时使用。

如果有长期远程访问本地部署的ComfyUI使用Wan2.1大模型或者其他本地服务的需求,但又不想每天重新配置公网地址,还想地址好看又好记,那我推荐大家选择使用固定的二级子域名方式来远程访问,带宽会更快,使用cpolar在其他用途还可以保留多个子域名,支持多个cpolar在线进程。(根据cpolar套餐而定)

5. 固定远程访问公网地址

由于以上使用cpolar所创建的隧道使用的是随机公网地址,24小时内会随机变化,不利于长期远程访问。因此我们可以为其配置二级子域名,该地址为固定地址,不会随机变化。

注意需要将cpolar套餐升级至基础套餐或以上,且每个套餐对应的带宽不一样。【cpolar.cn已备案】

登录cpolar官网,点击左侧的预留,选择保留二级子域名,地区选择china top,然后设置一个二级子域名名称,自定义即可,然后填写备注信息,点击保留。

image-20250328153007281

保留成功后复制保留的二级子域名地址:mywan21

image-20250328153056392

登录cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道wan21,点击右侧的编辑

image-20250328153132963

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 域名类型:选择二级子域名
  • Sub Domain:填写保留成功的二级子域名
  • 地区: China TOP

点击更新

image-20250328153226764

更新完成后,打开在线隧道列表,此时可以看到随机的公网地址已经发生变化,地址名称也变成了保留和固定的二级子域名名称。

image-20250328153300357

最后,我们使用固定的公网地址访问 ComfyUI 可以看到访问成功,一个永久不会变化的远程访问方式即设置好了,同样需要输入在高级中配置的用户名和密码登录。

image-20250328153357978
image-20250328153538574

总结

经过本次技术验证,我们成功构建了基于公网网络环境的远程控制体系,使本地部署的Wan2.1模型具备跨地域访问能力。该解决方案不仅支持团队成员通过专属连接通道实现实时协作,还显著优化了分布式开发场景下的协同效率。对于个人开发者而言,这套系统提供了灵活的远程访问支持,能够适配各种终端设备的接入需求。

通过以上步骤,你已掌握在本地搭建 Wan2.1 视频生成环境并结合 cpolar 实现公网访问的方法,既发挥了本地化部署的低成本优势,又突破了局域网的局限,让 AI 视频创作更灵活高效,适合个人和团队长期使用。

使用软件资源链接:https://pan.baidu.com/s/1N46hOSsSsVr848cWXxTVzA?pwd=6666

Read more

猫头虎AI分享10个全网超火的Skills开源仓库:Claude Skills开源库必装精选 & 安装配置实战指南

猫头虎AI分享10个全网超火的Skills开源仓库:Claude Skills开源库必装精选 & 安装配置实战指南

分享10个全网超火的Skills仓库(Star 500+、更新频率高):Claude Skills开源库必装精选 & 实战指南 大家好,我是 猫头虎 🐯如果你和我一样每天在 Claude Code + AI Agent workflow 混迹,肯定发现一个真理: 🎯 Skill 才是 AI 长期生产力的灵魂! 不管你是用 Claude 写代码、做自动化任务、搞科研、做资料整理还是构建复杂流程——真正能让 AI “马上就能用”的,是 Skills。 今天这篇,我给你整理了 10 个全网超火的、⭐️500+ Stars、活跃更新的 Skills 仓库,并告诉你: * ⭐ 这些仓库到底是什么 * 🚀 谁应该装 * 🧠 如何快速上手 文章目录 * 分享10个全网超火的Skills仓库(

OpenClaw进阶篇:浏览器自动化——让AI帮你操作网页

OpenClaw进阶篇:浏览器自动化——让AI帮你操作网页

OpenClaw进阶篇:浏览器自动化——让AI帮你操作网页 前言 上篇我们写了自定义Skill,发现核心是Prompt模板。 但Skill只是告诉AI"怎么做",真正执行还需要Tool。 今天讲一个强大的Tool:browser。 它让AI能像人一样操作浏览器——点击、输入、截图、执行JS。 一、browser工具是什么 OpenClaw的browser工具提供了三种连接模式: 1. 内置浏览器(默认) OpenClaw自带Playwright浏览器,AI可以直接调用: 功能说明示例navigate打开网页访问百度、知乎snapshot获取页面快照了解当前页面状态screenshot截图保留证据click点击元素登录、搜索、提交type输入文字填表单、发评论evaluate执行JS提取数据、计算select下拉选择选择日期、分类hover悬停显示隐藏菜单 特点:开箱即用,适合大多数场景。 2. CDP模式(Chrome DevTools Protocol) 连接你已有的Chrome浏览器,通过调试端口控制: // 启动Chrome时加上调试端口/

Obsidian+Claude Code打造本地AI知识库

Claudian + Obsidian Skills 1. 核心组件 * Claudian: Obsidian 第三方插件(暂未上架官方市场),适配 Claude Code。 * Obsidian Skills: 由 Obsidian CEO (Kepano) 发布的 Skill 包,赋予 AI 处理 Canvas、Markdown 及数据库的能力。 2. 环境部署流程 2.1 安装 Claudian 插件 (手动旁加载) 1. 获取文件: 访问 GitHub 仓库 claudian,下载以下三个核心文件: * main.js * manifest.json * styles.css 2. 放置插件:

本地Qwen + ComfyUI 制作AI漫剧完整保姆级教程(2026年3月最新版)

本地Qwen + ComfyUI 制作AI漫剧完整保姆级教程(2026年3月最新版)

这个组合是目前零成本、无限生成、角色一致性最强的本地方案! Qwen(本地大模型)负责写剧本 + 自动拆分镜 + 生成提示词;ComfyUI负责图像生成 + 角色一致性 + 动态视频。 适合新手/日更党,低配8GB显存就能跑(推荐12GB+更流畅)。全流程免费、无网络依赖、隐私安全。 模型+:工作流:https://pan.quark.cn/s/efc430e1996d 一、硬件要求(必看) * GPU:NVIDIA 8GB显存起步(RTX 3060 12GB最稳),AMD/Intel也可(需ROCm/OneAPI)。 * 内存:16GB+ RAM(32GB最佳)。 * 硬盘:SSD 50GB+ 空闲空间。 * 系统:Windows