Stable Diffusion + kohya_ss 的安装教程

优质文章学习记录

08 Apr 2026 — 6 min read

工具简介

Stable Diffusion (SD): 开源的文本到图像生成模型，支持通过提示词生成高质量图像，内置自动标注功能（如BLIP、DeepBooru等）。
kohya_ss (KS): 基于SD的轻量级微调工具，支持LoRA、DreamBooth等训练方法，优化显存占用与训练效率。

一.SD的安装

对于SD大家可以通过github链接来下载

https://git-scm.com/ Automatic 1111：https://github.com/AUTOMATIC1111

这里提供的链接，下载的SD是最基础的，如果大家想要让他有其他的扩展功能就需要下载相关的插件（后面会写一个关于下载插件的教程请大家持续关注）。

1.准备 Conda 环境

1.1 创建并激活 Conda 环境

# 创建名为 sd-webui 的环境（Python 3.10 推荐，需匹配仓库要求） conda create -n sd-webui python=3.10 -y # 激活环境 conda activate sd-webui

1.2确认 Python 路径

记录当前 Conda 环境的 Python 路径（后续配置需要）

which python # 示例输出：/home/用户名/miniconda3/envs/sd-webui/bin/python

2. 下载仓库代码

# 克隆仓库 git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui #指定下载路径 git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git 你指定的下载路径

3. 配置 webui 以使用 Conda 环境

3.1 编辑配置文件

在 webui-user.sh 中添加 / 修改以下内容（根据实际路径调整）：

# 复制默认配置文件（若不存在） cp webui-user.sh webui-user.sh.bak # 备份（可选，不过建议还是备份一下） nano webui-user.sh

3.2 修改关键配置

在 webui-user.sh 中添加 / 修改以下内容（根据实际路径调整）：

# 指定 Conda 环境的 Python 路径（替换为步骤 1.2 中获取的路径） python_cmd="/home/用户名/miniconda3/envs/sd-webui/bin/python" # 禁用自动创建虚拟环境（使用 Conda 环境而非 venv） venv_dir="-" # 可选：添加启动参数（如低显存模式） export COMMANDLINE_ARGS="--medvram --opt-split-attention"

3.3 保存并退出

按 Ctrl+O 保存，Ctrl+X 退出编辑器。

4. 安装依赖并启动

4.1 运行安装脚本

./webui.sh

运行完这个命令后该脚本会自动检测 Conda 环境并安装 requirements.txt 和 requirements_versions.txt 中的依赖，针对 PyTorch 适配问题（如 AMD 显卡）会根据 GPU 型号自动设置 TORCH_COMMAND，安装完成后终端将显示访问地址（通常为http://127.0.0.1:7860），用户可通过浏览器直接使用。

下面的图片就是我通过地址访问的SD界面，不过我安装了一些插件，所以你们的可能跟我的长的不一样，但是不会影响使用。

5. 安装好之后的启动步骤

# 每次启动前激活 Conda 环境 conda activate sd-webui # 进入仓库目录并启动 cd stable-diffusion-webui ./webui.sh

这几行代码建议大家写到一个txt文本里面，这样需要用的时候直接复制粘贴进去就可以了。

二.kohya_ss的安装

这个是Kohya_ss的库的下载链接：https://github.com/bmaltais/kohya_ss

方法一：uv 安装

1. 克隆仓库（含子模块）

# 克隆仓库并进入目录 git clone --recursive https://github.com/bmaltais/kohya_ss.git cd kohya_ss

2. 运行安装脚本

# 执行 uv 安装脚本 ./gui-uv.sh

方法二：pip 安装

1. 克隆仓库（含子模块）

git clone --recursive https://github.com/bmaltais/kohya_ss.git cd kohya_ss

2. 安装依赖（可选 Conda 环境）

选项 A：使用系统 Python 或 venv

# 赋予脚本执行权限并运行 setup.sh chmod +x setup.sh ./setup.sh

选项 B：使用 Conda 环境（推荐）

# 创建并激活 Conda 环境（Python 3.11） conda create -n kohyass python=3.11 conda activate kohyass # 运行安装脚本 chmod +x setup.sh ./setup.sh

3. 启动 GUI

# 赋予执行权限并启动 chmod +x gui.sh ./gui.sh

启动后，若看到类似 Running on http://0.0.0.0:7860 的输出，说明安装成功，可通过浏览器访问该地址使用 GUI。

可能出现的问题

1.缺少 `python3-tk` 依赖包

Skipping git operations. Ubuntu detected. This script needs YOU to install the missing python3-tk packages. Please install with: sudo apt update -y && sudo apt install -y python3-tk

如果出现上面的错误，只需要下载缺失的包就行了，命令如下：

sudo apt update -y && sudo apt install -y python3-tk

2.不支持 `socks` 协议的代理 URL

ValueError: Unknown scheme for proxy URL URL('socks://127.0.0.1:7897/')

通过终端配置环境变量

1.确定你的shell是bash还是zsh

在终端执行以下命令，会显示当前 shell 的进程名： echo $SHELL

输出 /bin/bash → 当前默认是 bash
输出 /bin/zsh → 当前默认是 zsh

2.编辑配置文件

bash 用户：nano ~/.bashrc zsh 用户：nano ~/.zshrc

3.添加 HTTP 代理配置

# 设置 HTTP 代理 export http_proxy="http://127.0.0.1:7897" export https_proxy="http://127.0.0.1:7897"

将最后的“7897”换成你自己的代理地址的端口号，换好之后保存退出就行。

4.生效配置

# bash 用户 source ~/.bashrc # zsh 用户 source ~/.zshrc

5.编辑gui.sh文件

nano gui.sh

在脚本最顶部（第一行 #!/bin/bash 下方）添加这些内容：

#!/bin/bash # 清除可能的残留代理 unset http_proxy https_proxy HTTP_PROXY HTTPS_PROXY all_proxy ALL_PROXY # 强制设置 HTTP 代理（按实际端口修改，比如你的代理 HTTP 端口是 7897 就改这里） export http_proxy="http://127.0.0.1:7890" export https_proxy="http://127.0.0.1:7890" export export # 脚本原本的其他内容（保持不变） ...

保存退出

重新运行gui.sh就可以了

./gui.sh

出现以下内容就表明运行成功了

* Running on local URL: http://127.0.0.1:7860 * To create a public link, set `share=True` in `launch()`. ^CKeyboard interruption in main thread... closing server.

Flutter 组件 tavily_dart 的适配鸿蒙Harmony 深度进阶 - 驾驭 AI 原生聚合搜索、实现鸿蒙端跨域知识发现与垂直领域语义降噪方案

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 tavily_dart 的适配鸿蒙Harmony 深度进阶 - 驾驭 AI 原生聚合搜索、实现鸿蒙端跨域知识发现与垂直领域语义降噪方案前言在前文中，我们领略了 tavily_dart 在鸿蒙（OpenHarmony）生态中实现基础互联网 AI 搜索集成的魅力。但在真正的“跨国科研智能辅助”、“政务决策舆情态势感知”以及“需要接入高精密专业数据库”的场景中。简单的单次查询往往不足以触达知识的核心。面对需要在大规模并发环境下，针对特定行业域名（如 .gov / .edu）执行深层内容的并行嗅探，并且要求对回显的数万字内容执行基于 AI 强语义的重排序（Re-ranking）与引用链路审计的高阶需求。如果缺乏一套完善的聚合搜索策略与语义降噪模型。不仅会导致 AI 智能体出现由于“信息泛滥”

【AI智能体】腾讯云服务器部署OpenClaw对接飞书实战详解

目录一、前言二、OpenClaw介绍 2.1 OpenClaw 是什么 2.2 OpenClaw 四大核心特点 2.3 OpenClaw 应用场景 2.3.1 个人生产力提升 2.3.2 一人公司/小微创业 2.3.3 企业级应用三、为什么使用云服务器部署四、基于腾讯云服务器部署OpenClaw 4.1 服务器选购 4.2 可视化配置OpenClaw 4.2.1 进入服务器控制台 4.2.2 配置全过程 4.3

【AI Coding 系列】——什么是AI Coding，怎么合理使用AI Coding，大模型上下文限制解决方案，任务拆解策略

AI Coding 并非简单的"让 AI 写代码"，而是一种使用大型语言模型（LLM）为核心驱动力的新型软件编程方式。要求开发者不仅要理解编程语言，更要掌握模型边界感知、上下文工程、认知负载管理等新兴技能。随着 Claude、GPT-4、Kimi 等模型的能力跃升，我们正从"AI 辅助编码"（Copilot 模式）变成"AI 主导架构，开发人员主导决策"的代理编程（Agentic Coding）。这一转变要求建立全新的工作流、质量控制体系和知识管理方法。第一部分：核心概念、认知框架——小白扫盲（可直接看第二部分） 1.1 模型边界感知 AI Coding 的首要原则是清醒认知模型的能力边界。就是我们蒸米饭加多少水类似，

Qwen2.5-7B+Stable Diffusion组合镜像：多模态一站体验

Qwen2.5-7B+Stable Diffusion组合镜像：多模态一站体验你是不是也遇到过这样的情况：写文案时想配图，却要切换到另一个工具；画好了图又想加点描述，还得打开聊天模型；来回切换软件、管理多个部署环境，不仅麻烦还容易出错。尤其对内容创作者来说，语言 + 图像的协同创作本该是常态，但现实中却常常被技术门槛卡住。现在，有了 Qwen2.5-7B + Stable Diffusion 组合镜像，这一切变得简单了。这是一套专为内容创作者打造的“多模态全能环境”——一次部署，同时拥有强大的中文对话能力与高质量图像生成能力，无需再分别配置两个系统，也不用担心依赖冲突或资源浪费。这个镜像预装了： - Qwen2.5-7B-Instruct：通义千问最新版本，支持流畅中文对话、文案撰写、脚本生成、逻辑推理等任务 - Stable Diffusion WebUI（如SDXL或1.5版本）：业界主流图像生成框架，支持文生图、图生图、局部重绘等功能

工具简介

一.SD的安装

1.准备 Conda 环境

1.1 创建并激活 Conda 环境

1.2确认 Python 路径

2. 下载仓库代码

3. 配置 webui 以使用 Conda 环境

3.1 编辑配置文件

3.2 修改关键配置

3.3 保存并退出

4. 安装依赖并启动

4.1 运行安装脚本

5. 安装好之后的启动步骤

二.kohya_ss的安装

方法一：uv 安装

1. 克隆仓库（含子模块）

2. 运行安装脚本

方法二：pip 安装

1. 克隆仓库（含子模块）

2. 安装依赖（可选 Conda 环境）

3. 启动 GUI

可能出现的问题

1.缺少 python3-tk 依赖包

2.不支持 socks 协议的代理 URL

1.确定你的shell是bash还是zsh

2.编辑配置文件

3.添加 HTTP 代理配置

4.生效配置

5.编辑gui.sh文件

Read more

Flutter 组件 tavily_dart 的适配 鸿蒙Harmony 深度进阶 - 驾驭 AI 原生聚合搜索、实现鸿蒙端跨域知识发现与垂直领域语义降噪方案

【AI智能体】腾讯云服务器部署OpenClaw对接飞书实战详解

【AI Coding 系列】——什么是AI Coding，怎么合理使用AI Coding，大模型上下文限制解决方案，任务拆解策略

Qwen2.5-7B+Stable Diffusion组合镜像：多模态一站体验

1.缺少 `python3-tk` 依赖包

2.不支持 `socks` 协议的代理 URL

Flutter 组件 tavily_dart 的适配鸿蒙Harmony 深度进阶 - 驾驭 AI 原生聚合搜索、实现鸿蒙端跨域知识发现与垂直领域语义降噪方案