Stable Diffusion WebUI 从安装到实战:原理、部署与问题全解

Stable Diffusion 原理、介绍及 WebUI 安装指南

一、Stable Diffusion 原理及介绍

Stable Diffusion 是一种基于潜在扩散模型(Latent Diffusion Model)的文本到图像生成人工智能模型,由 Stability AI 主导开发,于 2022 年发布。其核心原理是通过“扩散过程”的逆过程实现图像生成:

  1. 扩散过程:从一张清晰图像开始,逐步添加高斯噪声,最终将图像转化为完全随机的噪声
  2. 逆扩散过程:模型学习从纯噪声中逐步去除噪声,结合文本提示(Prompt)的语义信息,最终生成符合描述的清晰图像

该模型的优势在于:

  • 开源可访问性:允许研究者和开发者自由使用和修改
  • 高质量生成:能生成具有细节和艺术感的图像
  • 灵活性:支持文本生成图像、图像修复、风格迁移等多种任务
  • 资源友好性:相比早期扩散模型,通过潜在空间(Latent Space)计算大幅降低了硬件需求

Stable Diffusion WebUI 是基于 Stable Diffusion 模型的可视化操作界面(以 AUTOMATIC1111 版本最为流行),提供了直观的参数调整、模型管理和图像生成功能,让非专业用户也能便捷使用该模型。

具体可以参见这篇文章,原理介绍的比较清晰:https://zhuanlan.zhihu.com/p/628714183

二、Stable Diffusion WebUI 安装步骤

1. Conda 设置清华源

conda config --show channels conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes

2. 创建并激活 conda 环境

conda create -n sdw python=3.10 conda activate sdw 

3. pip 设置清华源

pip config list pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple 

4. 下载源码并切换分支

# 国内源克隆(推荐)git clone https://mirror.ghproxy.com/https://github.com/AUTOMATIC1111/stable-diffusion-webui.git # 进入目录并切换版本cd stable-diffusion-webui/ git checkout v1.10.1 

5. 配置模型下载路径

修改 ./modules/sd_models.py 文件,指定模型下载地址(解决网络限制问题):

161else:162 model_url =f"http://192.168.1.10/data/model/SD/v1-5-pruned-emaonly.safetensors"163 expected_sha256 ='6ce0161689b3853acaa03779ec93eafe75a02f4ced659bee03f50797806fa2fa'

模型可通过以下方式获取:

  • 官方地址:https://huggingface.co/runwayml/stable-diffusion-v1-5/resolve/main/v1-5-pruned-emaonly.safetensors
  • 局域网地址:http://192.168.1.10/data/model/SD/v1-5-pruned-emaonly.safetensors

6. 安装 CLIP 模型

# 创建目录mkdir -p ./openai/ cd ./openai/ # 下载 CLIP 模型(局域网方式)wget http://192.168.1.10/data/model/SD/clip-vit-large-patch14.tar.gz # 解压tar -zxvf clip-vit-large-patch14.tar.gz # 返回主目录cd..

7. 安装 Python 依赖

pip install -r requirements_versions.txt 

8. 允许 root 用户执行

修改 webui.sh 第 74 行:

73# this script cannot be run as root by default74can_run_as_root=1

9. 解决 CLIP 安装超时问题

由于网络限制,直接安装 CLIP 可能失败,可通过以下方式解决:

# 方法1:手动下载并安装wget http://192.168.1.10/data/soft/CLIP-d50d76daa670286dd6cacf3bcd80b5e4823fc8e1.zip pip install CLIP-d50d76daa670286dd6cacf3bcd80b5e4823fc8e1.zip # 方法2:修改源码中的下载地址vi ./modules/launch_utils.py # 将第345-346行修改为:# clip_package = os.environ.get('CLIP_PACKAGE', "http://192.168.1.10/data/soft/CLIP-d50d76daa670286dd6cacf3bcd80b5e4823fc8e1.zip")

10. 解决 TCMalloc 依赖问题

# 安装依赖apt-get update apt-getinstall google-perftools -y # 配置环境变量echo"export LD_PRELOAD=\"/usr/lib/x86_64-linux-gnu/libtcmalloc.so.4.5.3\"">> /etc/profile source /etc/profile 

11. 执行安装

bash webui.sh 

成功安装后会显示类似以下信息:

Loading weights [6ce0161689] from /root/stable-diffusion-webui/models/Stable-diffusion/v1-5-pruned-emaonly.safetensors Running on local URL: http://127.0.0.1:7860 Creating model from config: /root/stable-diffusion-webui/configs/v1-inference.yaml Applying attention optimization: Doggettx... done. Model loaded in 3.5s (load weights from disk: 0.8s, create model: 0.8s, apply weights to model: 1.5s, calculate empty prompt: 0.2s). 

三、服务配置与访问

1. 设置开机启动

创建服务文件 /etc/systemd/system/sdw.service

[Unit] Description=Stable Diffusion WebUI Service After=network.target [Service] Type=simple User=root StandardOutput=file:/var/log/sdw.log StandardError=file:/var/log/sdw.log WorkingDirectory=/root/stable-diffusion-webui/ ExecStart=/bin/bash -c 'source /root/miniconda3/bin/activate && conda activate sdw && bash /root/stable-diffusion-webui/webui.sh' Restart=on-failure [Install] WantedBy=multi-user.target 

启用服务:

systemctl daemon-reload systemctl restart sdw systemctl enable sdw 

2. 端口转发配置

方法1:SSH 端口转发
ssh -L 192.168.1.63:7860:127.0.0.1:7860 [email protected] 
方法2:HAProxy 转发
# 安装 HAProxyaptinstall haproxy -y 

修改配置文件 /etc/haproxy/haproxy.cfg,添加以下内容:

listen haihe_proxy_gateway_https mode tcp bind 192.168.1.64:80 # 替换为实际IP balance roundrobin option tcpka option tcplog server hostname 127.0.0.1:7860 check inter 2000 rise 2 fall 5 

启动服务:

systemctl enable haproxy systemctl start haproxy 

通过 http://192.168.1.64/ 访问(替换为实际IP)

四、模型管理与使用

1. 模型下载与安装

推荐从以下平台下载高质量模型:

  • Hugging Face:https://huggingface.co/models
  • Civitai:https://civitai.com/models

下载后将模型文件(通常为 .safetensors.ckpt 格式)放入目录:

/root/stable-diffusion-webui/models/Stable-diffusion/ 

在 WebUI 界面中刷新模型列表即可选择使用。

2. 基础使用示例

  • 正向提示词(Prompts)1girl, face, white background
  • 反向提示词(Negative Prompts)(worst quality:2), (low quality:2), lowres, watermark

反向提示词用于排除不想要的特征(如低质量、水印等)。

五、常见问题解决

1. 缺少 xdg-open 错误

aptinstall xdg-utils desktop-file-utils -y 

2. 本地访问代理问题

exportno_proxy="localhost, 127.0.0.1, ::1"

六、汉化配置

  1. 进入 WebUI 的 “Extensions” 选项卡
  2. 点击 “Install from URL”,输入仓库地址:https://github.com/VinsonLaro/stable-diffusion-webui-chinese
  3. 点击 “Install”,安装完成后重启界面
  4. 进入 “Settings” → “User interface”,在 “Localization” 中选择 “Chinese-All” 或 “Chinese-English”
  5. 点击 “Apply settings” 并 “Reload UI” 完成汉化

Read more

前端分层架构实战:DDD 与 Clean Architecture 在大型业务系统中的落地路径与项目实践

引言 在某电商后台管理系统的迭代中,我们曾陷入典型的前端业务膨胀困境:修改 “订单拦截规则” 的状态校验逻辑时,需要同时调整 5 个关联组件的代码 —— 业务逻辑散落在组件的 setup 或 methods 中,耦合严重;后续扩展至小程序端时,核心业务逻辑无法复用,需重新编写 60% 的代码;新成员接手时,需花 1 周才能理清 “拦截规则从查询到展示” 的全链路逻辑。 这些问题的核心是 “业务逻辑与技术实现的耦合”。领域驱动设计(DDD)与整洁架构(Clean Architecture) 为解决这些问题提供了思路 —— 通过分层解耦,将 “稳定的业务规则” 与 “多变的技术工具(框架、UI 组件)” 分离,让前端系统具备长期可维护性与可扩展性。 本文结合实际项目实践,详解这两种架构在前端的落地路径。 一、前端 DDD 分层架构:

cocotb平台用VCS仿Xilinx FPGA

cocotb平台用VCS仿Xilinx FPGA

文章目录 * 概要 * 建立cocotb仿真VIP库 * 调用VIP库仿Xilinx IP * 1. VIVIDO生成IP,完成设计。 * 2. 写python仿真代码 * 3、编写Makefile * 4、运行仿真,看波形 概要 本文介绍了基于cocotb框架的AXI Stream接口验证方法。主要内容包括:1)开发AXIS VIP库,实现字节级数据发送(axis_tx_byte)、随机接收(axis_rx)和总线监控(axis_monitor_byte)功能;2)以Xilinx AXIS FIFO为例,展示VIP库的调用方法,包括测试平台搭建、数据生成和自动验证机制。该方案支持LSB配置,能模拟真实硬件背压情况,适用于AXIS接口模块的功能验证。代码提供完整的仿真环境,包含时钟复位控制、参考模型和计分板等组件,详细解析完整代码和Makefile文件。 建立cocotb仿真VIP库 例如新增一个axis.

【花雕学编程】Arduino BLDC 之基于超声波与PID控制的简单跟随机器人

【花雕学编程】Arduino BLDC 之基于超声波与PID控制的简单跟随机器人

基于 Arduino 的无刷直流电机(BLDC)超声波与 PID 控制简单跟随机器人,是一个将经典自动控制理论与现代高效驱动技术相结合的典型机电一体化项目。该系统通过超声波传感器获取环境距离信息,利用 PID 算法实时解算运动指令,并由 Arduino 驱动 BLDC 电机执行,从而实现对目标物体的稳定、平滑跟随。 1、主要特点 三角测量与单发双收架构 这是实现“定向”跟随而非“盲目”避障的核心感知逻辑。 单发双收拓扑: 系统通常采用一个手持式超声波发射模块和两个安装在机器人前端左右两侧的接收模块(单发双收)。这种布局构成了一个简单的三角形测量系统。 偏差解算原理: 当目标(人)正对机器人时,左右两个接收模块测得的距离 ,系统可以精确判断目标的偏航角度,从而实现方向控制。 双环 PID 串级控制 为了实现平稳的跟随效果,系统通常采用速度环(内环)与方向环(外环)的串级 PID 控制结构。 方向环(

带可二次开发的管理配置端 + 非低代码 + 原生支持标准化 Skill框架选择

「带可二次开发的管理配置端 + 非低代码 + 原生支持标准化 Skill」的开源 Agent 框架,筛选 3款完全匹配的框架(均为代码级可扩展、自带 Skill 管理后台、支持 SKILL.md/MCP 标准),附核心特性、二次开发要点和部署步骤,都是企业级/开发者友好的选型: 一、首选:LangGraph + LangServe(LangChain 官方生态,Python 栈,极致可扩展) 核心定位 LangChain 官方推出的「Agent 编排 + 服务化」框架,自带可二次开发的 Skill/Tool 管理后台(LangServe Dashboard),纯代码开发、无低代码封装,是 Python 生态的最佳选择。 关键特性