Stable Diffusion 的发布是 AI 图像生成发展过程中的一个里程碑,相当于给大众提供了一个可用的高性能模型,让「AI 文本图片生成」变成普通人也能玩转的技术。最近一些网友将网上的真人图片不断喂给模型,让其自主学习,训练出来的效果已经可以做到以假乱真。本文将从零开始,手把手教你如何搭建自己的本地 AI 图文视频生成环境。
1. 搭建你自己的 AI 网站
本篇我们将单刀直入教各位最快搭建出一个质量不错的 AI 网站。下文会提及的模型、插件和源码,均为开源社区通用资源。
1.1 环境准备
第一步,我们需要在电脑上安装 Python 3.10.6 版本。如果已经安装了其他 Python 版本,可以利用 conda 安装多一个 3.10 的虚拟环境版本:
conda create -n sd_env python==3.10.6
激活该环境:
conda activate sd_env
接下来下载 Stable Diffusion WebUI 的官方仓库代码:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
cd stable-diffusion-webui
1.2 安装 PyTorch GPU 版本
进入刚刚创建的虚拟环境后,需要安装对应的 GPU 版本的 Pytorch。请根据显卡型号选择 CUDA 版本(此处以 CUDA 11.6 为例):
python -m pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
安装成功后,可以测试自己的 PyTorch 版本是否可以跑通:
import torch
print(torch.cuda.is_available())
如果输出 True,说明 GPU 驱动配置成功。
1.3 安装依赖
进入刚刚下载的 Github 仓库的代码文件夹,安装第三方依赖:
python -m pip install -r requirements.txt
2. 模型下载与管理
有了网站之后,就需要下载对应的 AI 模型进行有效生成。一些网友已经利用网上大量的图片训练好的模型,并分享到网站上。
可以在模型资源站找到很多已经训练好的模型。例如找一个生成真人图片的模型:ChilloutMix。从网页上下载对应的模型文件(通常为 .safetensors 或 .ckpt 格式),把该模型放到工程目录下的 models/Stable-diffusion 文件夹中。
重启 WebUI 后,在界面顶部的下拉菜单中即可选择加载该模型。
3. 汉化与插件下载
stable-diffusion-webui 这个项目支持下载第三方插件。例如我们可以下载对应的汉化插件。
登陆扩展管理页面,搜索中文语言包插件。下载插件的安装包后,将其解压放到 extensions 目录下。
接着,需要对网页进行重启服务。在扩展选项卡中,勾选刚安装的插件,并在设置中找到 zh_CN 语言选项,最后重新启动网页,界面即可生效为中文。
4. 生成你的真人图片
启动主程序 launch.py,等待一定的时间出现网页地址就可以了。打开网址时,有时候可能模型没有更新,因此可以尝试多次重启。需要选择刚刚下载的模型:ChilloutMix。
这样就已经完成前期的部署工作了。接下来详细教大家怎么生成自己想要的图片。
4.1 生成真人图片
在模型资源站上,已经有很多大神利用 Prompt 生成图片了,因此我们就可以对这些进行参考。例如找一个好看的图片,对下面的 Prompt 词语进行复制。


