AI 图生图与视频生成完整工作流及提示词参数表 | 极客日志

PythonAI算法

AI 图生图与视频生成完整工作流及提示词参数表

基于 Stable Diffusion WebUI 和 AnimateDiff 插件的 AI 图生图及视频生成完整工作流。内容涵盖环境搭建、硬件要求、模型选择、提示词编写技巧、关键参数设置（如帧数、运动幅度）、实战案例演示以及常见问题解决方案。通过规范化的操作流程和参数调整，帮助用户解决视频闪烁、人物变形等问题，实现高质量的静态图片动态化生成。

苹果系统发布于 2026/4/6更新于 2026/7/2460 浏览

一、前言

AI 视频生成技术快速发展，从 Runway Gen-2 到 Stable Diffusion 的 AnimateDiff 插件，静态图片'动起来'已不再是难题。初学者在实操时可能会遇到视频闪烁、人物变形、运动不自然等问题。

本文将以 Stable Diffusion WebUI + AnimateDiff 为主线，详细拆解从图生图（优化图片）到图生视频的全流程操作，并附上可直接复制的提示词和参数表。

二、环境搭建与工具选择

2.1 硬件要求

显卡：NVIDIA 显卡，显存建议 8GB 以上（6GB 也可运行，但帧数需调低）
内存：16GB+
系统：Windows 10/11（Linux 也可，本文以 Windows 为例）

2.2 软件工具

工具	说明	获取方式
Stable Diffusion WebUI	整合包或官方源码	GitHub
AnimateDiff 插件	视频生成核心插件	WebUI 扩展中搜索安装
ControlNet 插件	可选，用于控制画面一致性	WebUI 扩展中搜索安装
Python	3.10.x	整合包自带

2.3 模型准备

底模：推荐写实风格 majicMIX realistic 或二次元风格 Anything V5
运动模块：AnimateDiff 官方提供的 mm_sd_v15.ckpt（插件会自动下载，或手动放入 models/AnimateDiff）

三、第一步：生成高质量基础图片（图生图）

视频的质量很大程度上取决于首帧图片的质量。如果直接用网上随便找的图，很可能因为风格不统一或细节缺失导致生成失败。因此，建议先用图生图（或文生图）生成一张满意的图片作为起点。

3.1 模型选择

写实人像：majicMIX realistic 或 ChilloutMix
二次元：Anything V5 或 Counterfeit
风景/建筑：Realistic Vision 或 DreamShaper

3.2 提示词编写

提示词分为正向和负向，建议将关键描述词放在前面，用 (keyword:权重) 加强。

正向提示词示例（古风美女）：

(masterpiece, best quality:1.2), 1girl, solo, chinese clothes, hanfu, looking at viewer, standing, garden, flowers, trees, soft lighting, detailed face, highly detailed skin, (wind blowing hair and clothes:)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

sfw, bad hands, bad fingers, missing fingers, extra fingers, bad face, bad eyes, bad proportions, ugly, duplicate, morbid, mutilated, tranny, trans, deformed, blurry, low quality, worst quality, signature, watermark, username, artist name

参数	推荐值	说明
采样器 (Sampler)	DPM++ 2M Karras	生成质量与速度均衡
步数 (Steps)	30	太少细节不足，太多变化不大
CFG Scale	7	提示词相关性，过高色彩过饱和
宽度/高度	512x768	竖构图更适合短视频，显存友好
种子 (Seed)	-1	随机生成，可固定种子复现效果

参数	推荐值	说明
启用	✅	必须勾选
运动模块	mm_sd_v15.ckpt	已下载的模块
帧数 (Number of frames)	16（测试）→ 32（成品）	帧数越多视频越长，显存占用越大
帧率 (FPS)	8	生成时的预览帧率，后期可用软件补帧
上下文批大小 (Context batch size)	16	同时处理的帧数，越大越稳定，但显存要求高
运动参数 (Motion parameters)	见下表	控制镜头运动

参数	含义	推荐范围	示例
平移 X (Translation X)	水平移动	-2 ~ 2	`X:0` 不动，`X:1` 每秒右移 1 像素
平移 Y (Translation Y)	垂直移动	-2 ~ 2	`Y:0.5` 每秒上移 0.5 像素
旋转 (Rotation)	画面旋转	-0.5 ~ 0.5	通常设为 0
缩放 (Scale)	镜头推拉	0.98 ~ 1.02	`Scale:1.01` 每秒放大 1%，`Scale:0.99` 缩小

正向：(photorealistic:1.3), (masterpiece:1.2), 1girl, detailed face, perfect eyes, soft skin, natural lighting, depth of field, looking at viewer, wearing sweater, indoors, cozy atmosphere 
负向：nsfw, bad hands, bad anatomy, ugly, deformed, disfigured, poorly drawn face, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck, username, watermark, signature

正向：(masterpiece, best quality), landscape, mountains, river, waterfall, forest, autumn colors, sunny day, blue sky, clouds, highly detailed, cinematic lighting, 8k, photorealistic 
负向：nsfw, low quality, worst quality, blurry, fog, text, signature, watermark, username, artist name, ugly, deformed, bad anatomy, bad proportions

AI 图生图与视频生成完整工作流及提示词参数表

一、前言

二、环境搭建与工具选择

2.1 硬件要求

2.2 软件工具

2.3 模型准备

三、第一步：生成高质量基础图片（图生图）

3.1 模型选择

3.2 提示词编写

更多推荐文章

相关免费在线工具

3.3 参数设置参考

四、第二步：图生视频核心操作

4.1 AnimateDiff 插件安装与配置

4.2 运动参数详解

4.3 生成视频与后处理

五、实战案例与提示词解析

案例 1：写实人像（镜头缓慢上移）

案例 2：风景（镜头缓缓拉远）

六、常见问题与解决方案（避坑指南）

Q1：生成的视频闪烁严重

Q2：人物五官扭曲/崩坏

Q3：视频长度太短

Q4：显存不足（CUDA out of memory）

七、结语

更多推荐文章

相关免费在线工具

AI 图生图与视频生成完整工作流及提示词参数表

一、前言

二、环境搭建与工具选择

2.1 硬件要求

2.2 软件工具

2.3 模型准备

三、第一步：生成高质量基础图片（图生图）

3.1 模型选择

3.2 提示词编写

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.3 参数设置参考

四、第二步：图生视频核心操作

4.1 AnimateDiff 插件安装与配置

4.2 运动参数详解

4.3 生成视频与后处理

五、实战案例与提示词解析

案例 1：写实人像（镜头缓慢上移）

案例 2：风景（镜头缓缓拉远）

六、常见问题与解决方案（避坑指南）

Q1：生成的视频闪烁严重

Q2：人物五官扭曲/崩坏

Q3：视频长度太短

Q4：显存不足（CUDA out of memory）

七、结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具