Stable Diffusion 图生图与视频生成完整工作流 | 极客日志

PythonAI算法

Stable Diffusion 图生图与视频生成完整工作流

介绍基于 Stable Diffusion WebUI 和 AnimateDiff 插件的图像转视频工作流。涵盖环境搭建、模型选择、提示词编写、运动参数设置及常见问题解决方案，旨在帮助用户生成高质量动态视频。

嘘发布于 2026/4/5更新于 2026/7/2771 浏览

Stable Diffusion 图生图与视频生成完整工作流

一、前言

最近 AI 视频生成技术发展迅速，从 Runway Gen-2 到 Stable Diffusion 的 AnimateDiff 插件，静态图片'动起来'已不再是难题。但很多初学者在实操时会遇到各种坑：视频闪烁、人物变形、运动不自然等。

本文将以 Stable Diffusion WebUI + AnimateDiff 为主线，详细拆解从图生图（优化图片）到图生视频的全流程操作，并附上提示词和参数表。无论你是刚入门的小白，还是想提升效率的老手，这篇教程都能帮你快速上手。

二、环境搭建与工具选择

2.1 硬件要求

显卡：NVIDIA 显卡，显存建议 8GB 以上（6GB 也可运行，但帧数需调低）
内存：16GB+
系统：Windows 10/11（Linux 也可，本文以 Windows 为例）

2.2 软件工具

工具	说明	获取方式
Stable Diffusion WebUI	秋叶整合包或官方源码	GitHub 或相关社区
AnimateDiff 插件	视频生成核心插件	WebUI 扩展中搜索'AnimateDiff'安装
ControlNet 插件	可选，用于控制画面一致性	WebUI 扩展中搜索'ControlNet'安装
Python	3.10.x	整合包自带

2.3 模型准备

底模：推荐写实风格 majicMIX realistic 或二次元风格 Anything V5
运动模块：AnimateDiff 官方提供的 mm_sd_v15.ckpt（插件会自动下载，或手动放入 models/AnimateDiff）

三、第一步：生成高质量基础图片（图生图）

视频的质量很大程度上取决于首帧图片的质量。如果直接用网上随便找的图，很可能因为风格不统一或细节缺失导致生成失败。因此，建议先用图生图（或文生图）生成一张满意的图片作为起点。

3.1 模型选择

写实人像：majicMIX realistic 或 ChilloutMix
二次元：Anything V5 或 Counterfeit
风景/建筑：Realistic Vision 或 DreamShaper

3.2 提示词编写

提示词分为正向和负向，建议将关键描述词放在前面，用 (keyword:权重) 加强。

正向提示词示例（古风美女）：

(masterpiece, best quality:1.2), 1girl, solo, chinese clothes, hanfu, looking at viewer, standing, garden, flowers, trees, soft lighting, detailed face, highly detailed skin, (wind blowing hair  clothes:)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

nsfw, bad hands, bad fingers, missing fingers, extra fingers, bad face, bad eyes, bad proportions, ugly, duplicate, morbid, mutilated, tranny, trans, deformed, blurry, low quality, worst quality, signature, watermark, username, artist name

参数	推荐值	说明
采样器 (Sampler)	DPM++ 2M Karras	生成质量与速度均衡
步数 (Steps)	30	太少细节不足，太多变化不大
CFG Scale	7	提示词相关性，过高色彩过饱和
宽度/高度	512x768	竖构图更适合短视频，显存友好
种子 (Seed)	-1	随机生成，可固定种子复现效果

参数	推荐值	说明
启用	✅	必须勾选
运动模块	mm_sd_v15.ckpt	已下载的模块
帧数 (Number of frames)	16（测试）→ 32（成品）	帧数越多视频越长，显存占用越大
帧率 (FPS)	8	生成时的预览帧率，后期可用软件补帧
上下文批大小 (Context batch size)	16	同时处理的帧数，越大越稳定，但显存要求高
运动参数 (Motion parameters)	见下表	控制镜头运动

参数	含义	推荐范围	示例
平移 X (Translation X)	水平移动	-2 ~ 2	`X:0` 不动，`X:1` 每秒右移 1 像素
平移 Y (Translation Y)	垂直移动	-2 ~ 2	`Y:0.5` 每秒上移 0.5 像素
旋转 (Rotation)	画面旋转	-0.5 ~ 0.5	通常设为 0
缩放 (Scale)	镜头推拉	0.98 ~ 1.02	`Scale:1.01` 每秒放大 1%，`Scale:0.99` 缩小

正向：(photorealistic:1.3), (masterpiece:1.2), 1girl, detailed face, perfect eyes, soft skin, natural lighting, depth of field, looking at viewer, wearing sweater, indoors, cozy atmosphere
负向：nsfw, bad hands, bad anatomy, ugly, deformed, disfigured, poorly drawn face, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, username, watermark, signature

正向：(masterpiece, best quality), landscape, mountains, river, waterfall, forest, autumn colors, sunny day, blue sky, clouds, highly detailed, cinematic lighting, 8k, photorealistic
负向：nsfw, low quality, worst quality, blurry, fog, text, signature, watermark, username, artist name, ugly, deformed, bad anatomy, bad proportions

Stable Diffusion 图生图与视频生成完整工作流

Stable Diffusion 图生图与视频生成完整工作流

一、前言

二、环境搭建与工具选择

2.1 硬件要求

2.2 软件工具

2.3 模型准备

三、第一步：生成高质量基础图片（图生图）

3.1 模型选择

3.2 提示词编写

更多推荐文章

相关免费在线工具

3.3 参数设置参考

四、第二步：图生视频核心操作

4.1 AnimateDiff 插件安装与配置

4.2 运动参数详解

4.3 生成视频与后处理

五、实战案例与提示词解析

案例 1：写实人像（镜头缓慢上移）

案例 2：风景（镜头缓缓拉远）

六、常见问题与解决方案（避坑指南）

Q1：生成的视频闪烁严重

Q2：人物五官扭曲/崩坏

Q3：视频长度太短

Q4：显存不足（CUDA out of memory）

七、结语

更多推荐文章

相关免费在线工具

Stable Diffusion 图生图与视频生成完整工作流

Stable Diffusion 图生图与视频生成完整工作流

一、前言

二、环境搭建与工具选择

2.1 硬件要求

2.2 软件工具

2.3 模型准备

三、第一步：生成高质量基础图片（图生图）

3.1 模型选择

3.2 提示词编写

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.3 参数设置参考

四、第二步：图生视频核心操作

4.1 AnimateDiff 插件安装与配置

4.2 运动参数详解

4.3 生成视频与后处理

五、实战案例与提示词解析

案例 1：写实人像（镜头缓慢上移）

案例 2：风景（镜头缓缓拉远）

六、常见问题与解决方案（避坑指南）

Q1：生成的视频闪烁严重

Q2：人物五官扭曲/崩坏

Q3：视频长度太短

Q4：显存不足（CUDA out of memory）

七、结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具