跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

Stable Diffusion 图生图与视频生成完整工作流

介绍基于 Stable Diffusion WebUI 和 AnimateDiff 插件的图像转视频工作流。涵盖环境搭建、模型选择、提示词编写、运动参数设置及常见问题解决方案,旨在帮助用户生成高质量动态视频。

嘘发布于 2026/4/5更新于 2026/6/1043 浏览
Stable Diffusion 图生图与视频生成完整工作流

Stable Diffusion 图生图与视频生成完整工作流

一、前言

最近 AI 视频生成技术发展迅速,从 Runway Gen-2 到 Stable Diffusion 的 AnimateDiff 插件,静态图片'动起来'已不再是难题。但很多初学者在实操时会遇到各种坑:视频闪烁、人物变形、运动不自然等。

本文将以 Stable Diffusion WebUI + AnimateDiff 为主线,详细拆解从图生图(优化图片)到图生视频的全流程操作,并附上提示词和参数表。无论你是刚入门的小白,还是想提升效率的老手,这篇教程都能帮你快速上手。

二、环境搭建与工具选择

2.1 硬件要求

  • 显卡:NVIDIA 显卡,显存建议 8GB 以上(6GB 也可运行,但帧数需调低)
  • 内存:16GB+
  • 系统:Windows 10/11(Linux 也可,本文以 Windows 为例)

2.2 软件工具

工具说明获取方式
Stable Diffusion WebUI秋叶整合包或官方源码GitHub 或相关社区
AnimateDiff 插件视频生成核心插件WebUI 扩展中搜索'AnimateDiff'安装
ControlNet 插件可选,用于控制画面一致性WebUI 扩展中搜索'ControlNet'安装
Python3.10.x整合包自带

2.3 模型准备

  • 底模:推荐写实风格 majicMIX realistic 或二次元风格 Anything V5
  • 运动模块:AnimateDiff 官方提供的 mm_sd_v15.ckpt(插件会自动下载,或手动放入 models/AnimateDiff)

三、第一步:生成高质量基础图片(图生图)

视频的质量很大程度上取决于首帧图片的质量。如果直接用网上随便找的图,很可能因为风格不统一或细节缺失导致生成失败。因此,建议先用图生图(或文生图)生成一张满意的图片作为起点。

3.1 模型选择

  • 写实人像:majicMIX realistic 或 ChilloutMix
  • 二次元:Anything V5 或 Counterfeit
  • 风景/建筑:Realistic Vision 或 DreamShaper

3.2 提示词编写

提示词分为正向和负向,建议将关键描述词放在前面,用 (keyword:权重) 加强。

正向提示词示例(古风美女):

(masterpiece, best quality:1.2), 1girl, solo, chinese clothes, hanfu, looking at viewer, standing, garden, flowers, trees, soft lighting, detailed face, highly detailed skin, (wind blowing hair and clothes:1.1) 

负向提示词(通用反咒):

nsfw, bad hands, bad fingers, missing fingers, extra fingers, bad face, bad eyes, bad proportions, ugly, duplicate, morbid, mutilated, tranny, trans, deformed, blurry, low quality, worst quality, signature, watermark, username, artist name 

3.3 参数设置参考

参数推荐值说明
采样器 (Sampler)DPM++ 2M Karras生成质量与速度均衡
步数 (Steps)30太少细节不足,太多变化不大
CFG Scale7提示词相关性,过高色彩过饱和
宽度/高度512x768竖构图更适合短视频,显存友好
种子 (Seed)-1随机生成,可固定种子复现效果

生成满意图片后,保存到本地(建议 PNG 格式,保留元数据)。

四、第二步:图生视频核心操作

4.1 AnimateDiff 插件安装与配置

  1. 在 WebUI 中点击 '扩展' -> '可用' -> 搜索 AnimateDiff -> 安装。
  2. 重启 WebUI 后,在文生图/图生图界面下方会出现 AnimateDiff 折叠面板。
  3. 第一次使用时,需要下载运动模块。点击面板中的 '下载运动模块',选择 mm_sd_v15.ckpt 下载。若下载慢,可手动下载后放入 models/AnimateDiff 文件夹。

4.2 运动参数详解

切换到 图生图 界面,加载刚才生成的图片,展开 AnimateDiff 面板,设置如下:

参数推荐值说明
启用✅必须勾选
运动模块mm_sd_v15.ckpt已下载的模块
帧数 (Number of frames)16(测试)→ 32(成品)帧数越多视频越长,显存占用越大
帧率 (FPS)8生成时的预览帧率,后期可用软件补帧
上下文批大小 (Context batch size)16同时处理的帧数,越大越稳定,但显存要求高
运动参数 (Motion parameters)见下表控制镜头运动

运动参数详解表:

参数含义推荐范围示例
平移 X (Translation X)水平移动-2 ~ 2X:0 不动,X:1 每秒右移 1 像素
平移 Y (Translation Y)垂直移动-2 ~ 2Y:0.5 每秒上移 0.5 像素
旋转 (Rotation)画面旋转-0.5 ~ 0.5通常设为 0
缩放 (Scale)镜头推拉0.98 ~ 1.02Scale:1.01 每秒放大 1%,Scale:0.99 缩小

示例组合: 缓慢上移 + 轻微放大
Translation X: 0, Translation Y: 0.5, Rotation: 0, Scale: 1.005

注意: 运动幅度不宜过大,否则人物容易变形。新手建议先尝试单一方向微动。

4.3 生成视频与后处理

设置好参数后,点击 '生成'。生成完毕后,在输出图片区域会显示一个 GIF 预览。点击 GIF 右下角的文件夹图标,可以找到生成的 MP4 视频文件(位于 outputs/img2img-images/日期 下)。

如果需要高清视频,可以使用 Topaz Video AI 进行补帧(将 8fps 提升到 24fps)和放大分辨率。

五、实战案例与提示词解析

案例 1:写实人像(镜头缓慢上移)

基础图提示词:

正向:(photorealistic:1.3), (masterpiece:1.2), 1girl, detailed face, perfect eyes, soft skin, natural lighting, depth of field, looking at viewer, wearing sweater, indoors, cozy atmosphere
负向:nsfw, bad hands, bad anatomy, ugly, deformed, disfigured, poorly drawn face, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, username, watermark, signature 

运动参数:Translation Y: 0.5, Scale: 1.0

案例 2:风景(镜头缓缓拉远)

基础图提示词:

正向:(masterpiece, best quality), landscape, mountains, river, waterfall, forest, autumn colors, sunny day, blue sky, clouds, highly detailed, cinematic lighting, 8k, photorealistic
负向:nsfw, low quality, worst quality, blurry, fog, text, signature, watermark, username, artist name, ugly, deformed, bad anatomy, bad proportions 

运动参数:Translation Y: 0, Scale: 0.99(每秒缩小 1%,镜头拉远)

六、常见问题与解决方案(避坑指南)

Q1:生成的视频闪烁严重

原因: 运动幅度过大,或上下文批大小太小。
解决: 降低平移/缩放值,增大上下文批大小至 24;开启 ControlNet Tile 模型(预处理选择 tile_resample)可以增强一致性。

Q2:人物五官扭曲/崩坏

原因: 基础图面部细节不足,或运动过程中面部出现错位。
解决:

  • 在负向提示词中强化'bad face, distorted face'。
  • 使用 ADetailer 插件(人脸修复)对每一帧进行后处理。
  • 降低运动幅度,或使用逐帧生成模式(需更高级设置)。

Q3:视频长度太短

原因: 帧数设置太少。
解决: 增加帧数,但注意显存占用。16 帧约 1 秒(8fps),32 帧约 2 秒。可以生成多段后用剪辑软件拼接,或使用 EbSynth 等工具进行关键帧插值。

Q4:显存不足(CUDA out of memory)

原因: 帧数/上下文批大小过大,或分辨率太高。
解决: 降低分辨率(如 384x512),减少帧数,减小上下文批大小,关闭其他占用显存的应用。

七、结语

AI 视频生成技术日新月异,但万变不离其宗:高质量的基础图片 + 合理的运动参数 = 流畅的视频。希望这篇教程能帮助你打开 AI 视频/图片创作的大门。后续还会更新更多 AIGC 实战技巧。

目录

  1. Stable Diffusion 图生图与视频生成完整工作流
  2. 一、前言
  3. 二、环境搭建与工具选择
  4. 2.1 硬件要求
  5. 2.2 软件工具
  6. 2.3 模型准备
  7. 三、第一步:生成高质量基础图片(图生图)
  8. 3.1 模型选择
  9. 3.2 提示词编写
  10. 3.3 参数设置参考
  11. 四、第二步:图生视频核心操作
  12. 4.1 AnimateDiff 插件安装与配置
  13. 4.2 运动参数详解
  14. 4.3 生成视频与后处理
  15. 五、实战案例与提示词解析
  16. 案例 1:写实人像(镜头缓慢上移)
  17. 案例 2:风景(镜头缓缓拉远)
  18. 六、常见问题与解决方案(避坑指南)
  19. Q1:生成的视频闪烁严重
  20. Q2:人物五官扭曲/崩坏
  21. Q3:视频长度太短
  22. Q4:显存不足(CUDA out of memory)
  23. 七、结语
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 利用 GPT4 和 DALL·E 制作 AI 绘画短视频指南
  • Web 应用开发全栈实践:从前端到后端
  • C++ 智能指针详解:原理、实现与内存安全
  • 基于Python和SQLAlchemy的高效邮件发送系统设计与实现
  • 通义万相 2.1 文生视频模型评测与部署指南
  • Java 面试高频场景题:Full GC、秒杀、幂等性与高可用设计
  • C++ 递推算法详解:GESP 四级考试核心考点
  • 腾讯混元图像 3.0 图生图开源,LMArena 跻身全球第一梯队
  • 前端网络基础详解:OSI 模型与核心协议解析
  • Python Web 框架对比与实战:Django vs Flask vs FastAPI
  • Flutter BIP340 适配鸿蒙 HarmonyOS 实战:Schnorr 签名应用
  • Spring MVC 中 Cookie 与 Session 机制详解
  • Linux 字体管理与安装详细教程
  • Java 使用 LangChain4j 构建 AI 智能体实战
  • RAG 的 12 种核心调优策略
  • Qwen-Multiple-Angles:基于 Qwen-Image-Edit 的多视角生成插件实战
  • Git 代码上传 Gitee 实战指南
  • 利用 AI 工具实现软件原型自动绘制与代码生成
  • 基于飞算 JavaAI 的 SQL Chat 功能实战解析
  • VS Code 搭配 GitHub Copilot 实战指南:从配置到高效协作

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online