Stable Diffusion v1.5 模型介绍及 Python 代码实现 | 极客日志

PythonAI算法

Stable Diffusion v1.5 模型介绍及 Python 代码实现

Stable Diffusion v1.5 是由 Stability AI 与 RunwayML 合作开发的文生图模型，支持文本生成图像、图像修复及风格迁移等功能。该模型基于扩散架构，默认分辨率 512x512，可通过 Python 的 diffusers 库调用。适用于插画生成、产品设计草图及二次元风格创作，需配合显卡运行以获得较好性能。

DevOpsTeam发布于 2026/4/8更新于 2026/5/2316 浏览

1. runwayml/stable-diffusion-v1-5 是干啥的？

它是一个文生图（Text-to-Image）AI 模型，输入一段文字提示 Prompt，就能生成对应风格、内容的图像。

典型用途：

生成艺术插画
生成产品设计图
生成动漫风人物
生成建筑、工业设计概念图
做 AI 绘画工具的基础模型
图像扩散、修图、风格迁移、补图、扩图等功能

2. 由谁开发？

开发方：Stability AI + RunwayML 合作
发布年份：2022 年底
模型基于：Stable Diffusion 1.x 系列

RunwayML 是一家专注于创作者工具的 AI 公司 Stability AI 则是 Stable Diffusion 系列模型的主要研发者。

runwayml/stable-diffusion-v1-5 是 Stable Diffusion 1.5 的官方托管 checkpoint。

3. 它的功能和特点

文生图（Text → Image）

输入一句话生成图：

'a cat wearing sunglasses sitting on a cyberpunk motorcycle'

图生图（Image → Image，img2img）

使用一张图片+Prompt 来生成新的变化图。

图像修复（Inpainting）

你给一张图+mask，它可以补画被挖空的部分。

可控扩散（ControlNet 支持）

可以用姿势图、边缘图、深度图约束生成内容。

可调节分辨率

默认 512×512，可生成 768×768、1024×1024（显存越大越好）。

模型可 LoRA 微调

支持训练角色、风格、IP 角色形象。

4. 和其他模型区别？

模型	类型	功能	备注
Helsinki-NLP/opus-mt-zh-en	翻译模型	中英互翻	完全不是绘图模型
runwayml/stable-diffusion-v1-5	文生图模型	绘画、修图	AI 图像生成主力模型
SDXL 1.0	更强模型	分辨率更高、效果更逼真	2023 新一代
SD 1.5	经典模型	风格更开放、LoRA 多	2022–2024 都很流行

你的项目如果是：

翻译文本 → 选 opus-mt
生成图像 → 选 stable-diffusion-v1-5

两者完全不同领域。

5. stable-diffusion-v1-5 的技术底层

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

pip install diffusers transformers accelerate safetensors torch

pip install torch --index-url https://download.pytorch.org/whl/cu121

from diffusers import StableDiffusionPipeline
import torch

# 加载模型
pipe = StableDiffusionPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5",
    torch_dtype=torch.float16
).to("cuda")  # 如果无 GPU 则改为 "cpu"

prompt = "a cute cat wearing sunglasses, cyberpunk style, high detail"
# 推理
image = pipe(prompt).images[0]
# 保存
image.save("output.png")

image = pipe(
    prompt,
    num_inference_steps=30,  # 步数（越高越细致但越慢）
    guidance_scale=7.5,      # 越大越听 prompt（通常 7-10）
    width=768,
    height=768,
    generator=torch.manual_seed(42)  # 固定种子，保持一致输出
).images[0]
image.save("cat2.png")

from diffusers import StableDiffusionImg2ImgPipeline
from PIL import Image

pipe = StableDiffusionImg2ImgPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5",
    torch_dtype=torch.float16
).to("cuda")

init_image = Image.open("input.jpg").convert("RGB")
prompt = "cyberpunk style, neon lights"
image = pipe(prompt=prompt, image=init_image, strength=0.7).images[0]
image.save("output_img2img.png")

from diffusers import StableDiffusionInpaintPipeline
from PIL import Image

pipe = StableDiffusionInpaintPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5",
    torch_dtype=torch.float16
).to("cuda")

image = Image.open("image.png")
mask = Image.open("mask.png")
# 白色表示要补的区域
result = pipe(
    prompt="a beautiful background with flowers",
    image=image,
    mask_image=mask
).images[0]
result.save("inpaint.png")

场景	能力
AI 绘画生成	强
角色卡风格训练	强（LoRA）
产品设计草图生成	强
二次元插画	强
写实风格	中等（SDXL 更强）
翻译/文本理解	❌（不能翻译）
视频生成	❌（不是视频模型）

Stable Diffusion v1.5 模型介绍及 Python 代码实现

1. runwayml/stable-diffusion-v1-5 是干啥的？

2. 由谁开发？

3. 它的功能和特点

文生图（Text → Image）

图生图（Image → Image，img2img）

图像修复（Inpainting）

可控扩散（ControlNet 支持）

可调节分辨率

模型可 LoRA 微调

4. 和其他模型区别？

5. stable-diffusion-v1-5 的技术底层

更多推荐文章

相关免费在线工具

6. 用 Python 调用 stable-diffusion-v1-5

6.1 安装依赖

6.2 文生图最简代码（Text → Image）

6.3 增强版：控制分辨率、步骤数、种子

6.4 图生图（img2img）

6.5 Inpainting（修复图像）

7. 适用场景总结

总结

更多推荐文章

相关免费在线工具

Stable Diffusion v1.5 模型介绍及 Python 代码实现

1. runwayml/stable-diffusion-v1-5 是干啥的？

2. 由谁开发？

3. 它的功能和特点

文生图（Text → Image）

图生图（Image → Image，img2img）

图像修复（Inpainting）

可控扩散（ControlNet 支持）

可调节分辨率

模型可 LoRA 微调

4. 和其他模型区别？

5. stable-diffusion-v1-5 的技术底层

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

6. 用 Python 调用 stable-diffusion-v1-5

6.1 安装依赖

6.2 文生图最简代码（Text → Image）

6.3 增强版：控制分辨率、步骤数、种子

6.4 图生图（img2img）

6.5 Inpainting（修复图像）

7. 适用场景总结

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具