Stable Diffusion 图像生成与 sd-scripts 工具使用指南
kohya-ss/sd-scripts 是基于 Diffusers 库开发的开源 AI 图像生成工具集,为创作者提供了丰富的 Stable Diffusion 模型支持和灵活的生成选项。
环境准备与项目安装
首先克隆项目仓库到本地:
git clone https://github.com/kohya-ss/sd-scripts
cd sd-scripts
安装必要的依赖包:
pip install -r requirements.txt
5 个必备工具快速掌握
- gen_img_diffusers.py - 核心图像生成脚本
- sdxl_gen_img.py - SDXL 模型专用生成器
- merge_models.py - 模型合并工具
- train_network.py - 网络训练功能
- extract_lora_from_models.py - LoRA 模型提取
最佳实践:3 步完成高质量图像生成
第一步:选择适合的模型
项目支持多种 Stable Diffusion 模型格式:
- 标准 ckpt 格式模型
- SD 2.x 系列模型
- SDXL 大模型
- LoRA 轻量模型
第二步:配置生成参数
| 参数类别 | 推荐设置 | 说明 |
|---|---|---|
| 图像尺寸 | 512x512 | 标准分辨率 |
| 采样步数 | 28-50 步 | 平衡速度与质量 |
| 引导尺度 | 7.5-12.5 | 控制创意自由度 |
第三步:优化输出效果
- 启用 xformers 减少显存占用
- 使用半精度模式提升生成速度
- 调整 batch_size 控制批量生成数量
进阶技巧:解锁高级创作功能
LoRA 模型应用指南
LoRA 技术让你能够快速应用特定风格或角色特征:
python gen_img_diffusers.py --ckpt base_model.ckpt \
--network_module networks.lora \
--network_weights style_lora.safetensors
ControlNet 精确控制
通过边缘检测、深度图等方式精确控制图像构图:
--control_net_models control_model.safetensors \
--guide_image_path control_image.png
实战案例:从创意到成品的完整流程
场景一:概念艺术创作
使用文本提示词生成奇幻场景:

