1. runwayml/stable-diffusion-v1-5 是干啥的?
它是一个文生图(Text-to-Image)AI 模型,输入一段文字提示 Prompt,就能生成对应风格、内容的图像。
典型用途:
- 生成艺术插画
- 生成产品设计图
- 生成动漫风人物
- 生成建筑、工业设计概念图
- 做 AI 绘画工具的基础模型
- 图像扩散、修图、风格迁移、补图、扩图等功能
2. 由谁开发?
- 开发方:Stability AI + RunwayML 合作
- 发布年份:2022 年底
- 模型基于:Stable Diffusion 1.x 系列
RunwayML 是一家专注于创作者工具的 AI 公司 Stability AI 则是 Stable Diffusion 系列模型的主要研发者。
runwayml/stable-diffusion-v1-5 是 Stable Diffusion 1.5 的官方托管 checkpoint。
3. 它的功能和特点
文生图(Text → Image)
输入一句话生成图:
'a cat wearing sunglasses sitting on a cyberpunk motorcycle'
图生图(Image → Image,img2img)
使用一张图片+Prompt 来生成新的变化图。
图像修复(Inpainting)
你给一张图+mask,它可以补画被挖空的部分。
可控扩散(ControlNet 支持)
可以用姿势图、边缘图、深度图约束生成内容。
可调节分辨率
默认 512×512,可生成 768×768、1024×1024(显存越大越好)。
模型可 LoRA 微调
支持训练角色、风格、IP 角色形象。
4. 和其他模型区别?
| 模型 | 类型 | 功能 | 备注 |
|---|---|---|---|
| Helsinki-NLP/opus-mt-zh-en | 翻译模型 | 中英互翻 | 完全不是绘图模型 |
| runwayml/stable-diffusion-v1-5 | 文生图模型 | 绘画、修图 | AI 图像生成主力模型 |
| SDXL 1.0 | 更强模型 | 分辨率更高、效果更逼真 | 2023 新一代 |
| SD 1.5 | 经典模型 | 风格更开放、LoRA 多 | 2022–2024 都很流行 |
你的项目如果是:
- 翻译文本 → 选 opus-mt
- 生成图像 → 选 stable-diffusion-v1-5
两者完全不同领域。

