跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

InfiniteTalk V2:音频驱动图片生成逼真说话唱歌视频,支持 ComfyUI 与 WebUI

综述由AI生成InfiniteTalk V2 是一款基于音频生成无限时长人物说话或唱歌视频的 AI 模型。它支持视频换配音及静态图片驱动说话,具备唇形同步、头部转动及肢体动作模拟功能。相比同类模型,其稳定性更高,减少了手部扭曲问题。该工具提供 ComfyUI 和 WebUI 两种模式,兼容多种分辨率,适用于影视娱乐、数字人生成、教育科普及商业宣传等领域。使用建议 N 卡显存 8G 以上,CUDA 版本需匹配。

监控大屏发布于 2026/2/6更新于 2026/6/1332 浏览
InfiniteTalk V2:音频驱动图片生成逼真说话唱歌视频,支持 ComfyUI 与 WebUI

InfiniteTalk V2 简介

InfiniteTalk 是一个能根据音频生成无限时长人物说话/唱歌视频的 AI 模型。无论是给现有视频配音,还是让静态图片'开口说话',还是让人物图片'唱歌',它都能实现精准的唇形同步和自然的肢体动作。

今天分享的 InfiniteTalk V2 版基于上一版本的工作流更新升级,新增了适合新手操作的 WebUI。如果是使用 ComfyUI 且下载过上个版本的资深用户,无需下载此整合包。WebUI 支持自定义切换 Wan 主模型和 InfiniteTalk 模型,整合包自带 Q4 和 Q8 两个版本,用户可根据自己的显卡配置选择。当前 WebUI 只支持单人生成,后续版本会集成双人版。

核心特点

全维度同步

不仅唇形与音频匹配,还会自动生成对应的头部转动、身体姿态和面部表情,让虚拟人物更生动。传统配音工具只调整嘴唇,而 InfiniteTalk 连肢体语言一起模拟。

无限时长生成

支持超长视频生成(如 1 小时以上),通过分段处理技术保证连贯性。普通 AI 视频模型通常限制在几十秒内。

双模式输入

  • 视频 + 音频:给现有视频换配音(如翻译配音、内容修改)。
  • 图片 + 音频:让一张静态照片'开口说话'(如虚拟主播、教育视频)。

高稳定性

相比同类模型(如 MultiTalk),显著减少了手部扭曲和身体变形的问题。

多分辨率支持

兼容 480P 和 720P,可根据设备性能选择清晰度。

应用领域

  • 影视娱乐:电影配音、短视频角色配音、虚拟偶像直播。
  • 数字人生成:一键生成数字人视频,助力自媒体创作。
  • 教育科普:定制化教学视频、历史人物'亲口'讲解。
  • 商业宣传:品牌虚拟代言人自动生成多语言宣传片。
  • 社交娱乐:让自拍照片念台词、生成个性化生日祝福视频。

使用教程

建议 N 卡,显存 8G 起,CUDA 版本建议≥12.8。

整合包包含所需所有节点,下载主程序和模型(ComfyUI 文件夹即为模型),解压主程序一键包,将 ComfyUI 文件夹移动到主程序目录下即可。

ComfyUI 模式

双击启动 ComfyUI,进入页面后,点击左侧的'工作流',选择对应的工作流(包含单人、多人及视频驱动视频三种模式),根据需要选择。上传需要生成的人物图片和音频文件,设置相关参数,运行即可。ComfyUI 模式建议专业人士使用,小白可以使用下面的 WebUI 模式。

WebUI 模式

双击启动 WebUI,进入页面后,上传需要生成的人物图像和音频文件,设置相关参数,生成即可。

参数说明
  • 模型精度:显卡好的,可以下载精度更高的模型,比如 Wan 视频模型和 InfiniteTalk 模型。
  • 加速模式:默认开启 sag 加速,如果卡在采样报错,请切换至 sdpa 或手动安装 vc 编译器。
  • 交换块大小:默认是 20,如果显卡好,比如 4090 或 5090 等,可以改成 40。

InfiniteTalk 模型可以根据显卡选择,显存 8G 的可以切换到 Q4 版,显存≥12G 的,建议使用 Q8 版。其他版本可前往官方仓库查找,下载后放到 ComfyUI\models\diffusion_models 目录,网页端切换即可。

目录

  1. InfiniteTalk V2 简介
  2. 核心特点
  3. 全维度同步
  4. 无限时长生成
  5. 双模式输入
  6. 高稳定性
  7. 多分辨率支持
  8. 应用领域
  9. 使用教程
  10. ComfyUI 模式
  11. WebUI 模式
  12. 参数说明
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • OpenClaw「龙虾」本地部署指南:安装、QQ 接入及运维实战
  • Java 常见锁类型及适用场景详解
  • 检索增强生成 (RAG) 技术原理与框架实践
  • 银行智能营销助手架构:知识图谱与大模型融合应用
  • Pyenv 多版本 Python 环境管理与实战指南
  • 使用 OpenClaw 与飞书搭建服务器运维机器人
  • 前端安全实战:防御 XSS、CSRF 及敏感信息保护
  • MATLAB 实现基于天牛须搜索算法(BAS)的无人机三维路径规划
  • 基于 Docker 部署 Appsmith 并配置内网穿透远程访问
  • C++ 异常处理机制:异常捕获、自定义异常与实战应用
  • 前端微前端:大型应用的模块化解决方案
  • Neo4j 5.26 版本下载安装与配置详解
  • C++ 内存池技术在量子计算仿真中的应用与优化
  • JDK 17 安装与环境配置实战指南
  • Altium Designer 常用快捷键速查指南
  • 利用 Anthropic Skill 提升大模型前端设计的审美
  • Clawdbot 秒级云上部署教程:让闲置服务器焕发新生
  • Linux 网络基础:协议分层与数据传输流程
  • 企业微信 CLI 接入 AI Agent 实践:结合 OpenClaw 与多模型网关
  • Stable Diffusion 3.5 创意工作流与云端 GPU 加速方案

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online