Python 调用 Stable Diffusion API 实战指南

从零开始学习使用 Python 调用 Stable Diffusion API 生成图像，涵盖本地部署、API 封装、ControlNet 扩展及后处理流程。

技术架构概览

整个方案主要围绕 Python 客户端与 Stable Diffusion 模型交互展开。根据部署环境不同，可分为本地部署（如 SD WebUI/ComfyUI）和云端 API（如 Replicate/Stability AI）。核心功能包括文生图、图生图、局部重绘以及超分辨率放大。生成的图像最终通过本地存储或 OSS 进行持久化。

环境准备

1. 本地部署 Stable Diffusion WebUI

首先需要克隆官方仓库并启动服务，务必开启 API 模式以便外部调用。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui
# Linux/Mac 用户
./webui.sh --api --listen
# Windows 用户
webui.bat --api --listen

2. 安装依赖包

项目需要 requests 处理 HTTP 请求，Pillow 处理图片，以及 base64 进行编码转换。

pip install requests Pillow io base64

核心代码实现

1. SD API 客户端封装

为了简化调用逻辑，我们封装了一个 StableDiffusionClient 类。这里定义了一个配置数据类 GenerationConfig，集中管理提示词、采样器、步数等参数。实际开发中，这样能避免每次调用都重复填写相同的默认值。

import requests
import base64
import io
import json
import time
from pathlib import Path
from PIL import Image
from dataclasses import dataclass, field
from typing import Optional

@dataclass
class GenerationConfig:
    """图像生成配置"""
    prompt: str = ""
    negative_prompt: str = "low quality, blurry, deformed"
    width:  = 
    height:  = 
    steps:  = 
    cfg_scale:  = 
    sampler_name:  = 
    seed:  = -  
    batch_size:  = 
    n_iter:  =   
    model: [] = 

 :
    
     ():
        .base_url = base_url
        .api_url = 

     () -> :
        
        img_data = base64.b64decode(b64_str)
        img = Image.(io.BytesIO(img_data))
        img.save(output_path)
         output_path

    
     () -> []:
        
        payload = {
            : config.prompt,
            : config.negative_prompt,
            : config.width,
            : config.height,
            : config.steps,
            : config.cfg_scale,
            : config.sampler_name,
            : config.seed,
            : config.batch_size,
            : config.n_iter,
        }
         config.model:
            ._switch_model(config.model)
        
        response = requests.post(, json=payload)
        response.raise_for_status()
        data = response.json()
        Path(output_dir).mkdir(exist_ok=)
        saved_paths = []
         i, img_b64  (data[]):
            path = 
            ._save_base64_image(img_b64, path)
            saved_paths.append(path)
        ()
         saved_paths

    
     () -> []:
        
        config = config  GenerationConfig()
         (init_image_path, )  f:
            init_images = [base64.b64encode(f.read()).decode()]
        
        payload = {
            : init_images,
            : prompt,
            : config.negative_prompt,
            : config.width,
            : config.height,
            : config.steps,
            : config.cfg_scale,
            : config.sampler_name,
            : denoising_strength,
            : config.seed,
        }
        response = requests.post(, json=payload)
        response.raise_for_status()
        data = response.json()
        Path(output_dir).mkdir(exist_ok=)
        saved_paths = []
         i, img_b64  (data[]):
            path = 
            ._save_base64_image(img_b64, path)
            saved_paths.append(path)
        ()
         saved_paths

    
     () -> []:
        
         (init_image_path, )  f:
            init_images = [base64.b64encode(f.read()).decode()]
         (mask_image_path, )  f:
            mask = base64.b64encode(f.read()).decode()
        
        payload = {
            : init_images,
            : mask,
            : prompt,
            : ,
            : denoising_strength,
            : ,  
            : ,
            : ,
            : ,
            : ,
            : ,
            : ,
        }
        response = requests.post(, json=payload)
        response.raise_for_status()
        data = response.json()
        Path(output_dir).mkdir(exist_ok=)
        saved_paths = []
         i, img_b64  (data[]):
            path = 
            ._save_base64_image(img_b64, path)
            saved_paths.append(path)
         saved_paths

    
     () -> :
        
         (image_path, )  f:
            img_b64 = base64.b64encode(f.read()).decode()
        payload = {
            : img_b64,
            : ,
            : scale,
        }
        response = requests.post(, json=payload)
        response.raise_for_status()
        data = response.json()
        Path(output_dir).mkdir(exist_ok=)
        path = 
        ._save_base64_image(data[], path)
        ()
         path

    
     ():
        
        response = requests.post(, json={: model_name})
        response.raise_for_status()
        time.sleep()  

     () -> []:
        
        response = requests.get()
         [m[]  m  response.json()]

     () -> []:
        
        response = requests.get()
         [s[]  s  response.json()]

参数	推荐值	说明
`steps`	25-35	步数越多细节越好，但边际递减且更慢
`cfg_scale`	7-12	越高越遵循 prompt，过高会过饱和
`sampler`	DPM++ 2M Karras	兼顾速度与质量
`denoising_strength`	0.5-0.8	图生图降噪强度，越高变化越大
`seed`	-1	随机种子，固定可复现

Python 调用 Stable Diffusion API 实战指南

技术架构概览

环境准备

1. 本地部署 Stable Diffusion WebUI

2. 安装依赖包

核心代码实现

1. SD API 客户端封装

更多推荐文章

相关免费在线工具

2. 批量生成示例

3. 调用 Stability AI 云端 API

4. 图像后处理管道

Prompt 工程技巧

关键参数影响

完整使用流程

总结

更多推荐文章

相关免费在线工具

Python 调用 Stable Diffusion API 实战指南

技术架构概览

环境准备

1. 本地部署 Stable Diffusion WebUI

2. 安装依赖包

核心代码实现

1. SD API 客户端封装

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 批量生成示例

3. 调用 Stability AI 云端 API

4. 图像后处理管道

Prompt 工程技巧

关键参数影响

完整使用流程

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具