Stable Diffusion 秋叶大神2025最新整合一键安装包

优质文章学习记录

09 Apr 2026 — 7 min read

这段时间我在折腾 Stable Diffusion，期间试过很多安装方式。有手动安装的，也有别人做好的整合包。手动安装的方式对环境要求高，步骤也多，系统要装 Python，要装依赖，还要配好运行库，哪一步出错都要重新查资料，挺消耗时间。后来了解到秋叶大神做的整合一键安装包，这个版本省掉了很多折腾，对新手比较友好。

我自己把安装流程整理了一遍，又结合网上的信息，把一些需要注意的地方写下来，希望能帮到想尝试 Stable Diffusion 的人。

这里完整下载链接

秋叶整合包是什么

这个整合包属于别人已经帮你配好的版本，里面把 Stable Diffusion WebUI、模型管理、插件、运行环境都准备好了。下载之后按照提示解压，点一下启动脚本就能跑起来，不需要另外去折腾环境。

整合包里放的 WebUI 是常见的 AUTOMATIC1111 版本，所以大部分教程都能直接用。适合想直接出图、想先体验一下模型效果的人。

系统环境方面

我现在用的是 Windows 电脑，所以下面写的内容主要基于 Windows。
秋叶整合包一般都是针对 Windows 整理的，解压之后直接运行，不需要管理员安装，也不会改系统环境变量。

需要注意设备条件：

显卡支持 CUDA 会更顺畅
显卡显存越大，生成大图越稳定
没有独显也能跑，但速度会慢

我用的是有独显的电脑，跑 txt2img 基本能正常运行。

下载方式和注意点

秋叶大神把安装包放在公开渠道，一般会提供网盘链接、夸克链接等。
文件比较大，下载的时候要耐心一点。

下载时建议注意版本号。秋叶整合包会 periodically 更新，有些版本加入新的插件，有些版本会修 bug。选择最新版本通常更省事。

下载完成后，建议把压缩包放在普通路径，比如 D 盘或 E 盘，不要放在中文路径，也不要放在桌面太深的目录。这样能避免脚本识别路径时出错。

解压和文件结构

把压缩包解压后，会看到主目录，里面包含：

webui
models
环境文件
启动脚本

结构比较清晰。
不用修改文件位置，也不需要先安装 Python。整合包里已经准备好了运行环境，用的都是独立目录，对系统没影响。

运行 WebUI 的方式

在主目录里会看到一个“启动 WebUI”的脚本文件（通常是 .bat）。
双击运行它，命令行窗口会自动加载环境。
等命令行显示链接，例如 http://127.0.0.1:7860，就可以在浏览器里打开界面。

我自己的经验是第一次启动会加载时间稍长，之后启动就快很多。

模型放在哪里

整合包将模型目录整理好了。常见路径是：

stable-diffusion-webui\models\Stable-diffusion

如果你要添加新的模型，把 .ckpt 文件或者 .safetensors 文件放进这个目录就行。重新打开 WebUI 后，模型选择栏会自动出现。

例如常见的

chilloutmix
anything
国风模型
写真人模特的模型
都可以放进去使用。

Lora 的路径会不同，大概在：

models\Lora

VAE 的路径一般在：

models\VAE

整合包目录结构都整理好，基本不需要改动。

常用功能的使用方法整理一下

为了让内容更有帮助，我把自己常用的几个功能写一下。

1. txt2img

输入提示词出图，这是最常用的功能。
常填的内容包括：

正面提示词
负面提示词
分辨率
采样方法
步数
CFG 值

这些默认值一般都能用。
生成图像后可以立即保存，也能继续调整。

2. img2img

用一张图片作为基础再调整。
比如把原图风格换一下，替换人物，改背景，这些都用得上。
强度值可以调节变化程度，0.3~0.7 之间比较常用。

3. Lora 管理

整合包里带的插件可以管理 Lora，选择权重、合并、加载都会很方便。
使用 Lora 时只需要在提示词里写：

<lora:模型名:权重>

权重 0.6 左右比较常见。

4. 控制图（ControlNet）

秋叶整合包有附带 ControlNet 插件。
常用功能包括：

线稿
姿态
深度
分割

把提示词结合 ControlNet，可以大幅提高可控性。
比如指定一个姿势生成人物，指定一个场景保持透视不变。

插件方面

整合包里常见插件有：

ControlNet
Tagger
图片浏览插件
Prompt 工具
Lora 管理工具

这些插件的默认设置基本都能直接用，不需要提前配置。
如果有特别需要，也能添加其他插件，方式就是把插件文件放进 extensions 目录。

配置文件

如果想改默认值，可以修改根目录里的配置文件，比如运行参数、显存优化、线程数等。
新手阶段可以不用改。
如果遇到显存不足，可以在脚本里加上 --medvram 或 --lowvram 参数。

常见问题

把网上容易遇到的问题摘一下，并整理成实际可用的建议。

1. 启动后闪退

可能是路径有中文、路径太长，改到简短路径一般可以解决。

2. 出图时显存不足

可以打开低显存模式，或把图片尺寸调低一些。

3. 控制图不生效

检查插件是否启用，确认使用的控制模型是否加载成功。

4. 模型不显示

确认模型放在正确目录，文件格式没有拼错。

5. 启动时提示端口占用

修改端口即可，--port 7861 这种方式可行。

适合谁用

秋叶整合包比较适合想先体验 Stable Diffusion，又不想折腾环境的人。
不论工作、画图、做封面、写自媒体内容，只要需要生成图片，都可以用这个工具快速出图。
学习模型、调风格、做二次元、做真人照片风格，也都能用。
整合包已经把复杂的步骤准备好，用户只需要关心出图和模型本身。

使用后的体感

我自己用秋叶整合包最明显的感受是省时间，少折腾。
之前手动安装，常常因为 Python 版本、Torch 版本、显卡驱动等问题耽误很多时间。整合包把这些都打包好了，只要能跑脚本就能出图。

生成的速度也比较稳定，和手动安装性能差不多。
模型加载速度也可以接受。
插件比较全，不需要自己再找。

对我个人来说，这种整合包比自己安装更适合长期使用，不用担心哪天更新导致环境崩掉。

Llama-factory 详细学习笔记：第六章：DPO (直接偏好优化) 实战 (难点)

第六章：DPO (直接偏好优化) 实战 (难点) 在SFT之后，我们的模型学会了“说话”，但它的回答可能仍然是“正确的废话”，或者在面对开放性问题时，其回答的安全性、有用性和真实性仍有待提高。传统的解决方案是强化学习（RLHF），即先训练一个奖励模型（RM），再用这个RM作为环境，通过复杂的强化学习算法（如PPO）来优化语言模型。然而，RLHF流程复杂、训练不稳定、且对计算资源要求极高，令许多开发者望而却步。直接偏好优化 (Direct Preference Optimization, DPO) 的出现，如同一道曙光，彻底改变了这一局面。它以一种极其优雅和高效的方式，实现了与RLHF相媲美甚至更好的对齐效果，但训练成本和复杂度却大大降低。本章将深入剖析DPO的核心思想、重难点配置，并通过详尽的实战步骤，带你完整地跑通一个DPO训练流程，真正让你的模型“更懂人心”。 6.1 为什么需要 DPO？ (轻理论：替代 PPO，

intv_ai_mk11案例分享：用户用Llama模型10分钟完成原本需1小时的周报初稿

intv_ai_mk11案例分享：用户用Llama模型10分钟完成原本需1小时的周报初稿 1. 案例背景每周五下午，市场部的小张都要花1个多小时写周报。这已经成为他最头疼的工作之一 - 需要汇总各种数据、整理会议记录、提炼工作成果，还要写得专业得体。直到他发现了intv_ai_mk11这个基于Llama架构的文本生成工具。 "以前写周报就像挤牙膏，现在10分钟就能出初稿，再花20分钟润色就完成了。"小张分享了他的使用体验。这个案例展示了AI如何改变日常办公场景，让重复性文字工作变得高效轻松。 2. intv_ai_mk11简介 intv_ai_mk11是一个开箱即用的文本生成模型，基于流行的Llama架构开发。它特别适合处理以下场景： * 通用问答：解答专业问题或提供建议 * 文本改写：调整语气、简化或正式化表达 * 解释说明：用通俗语言解释复杂概念 * 简短创作：生成邮件、报告、方案等文本这个镜像已经完成本地部署，用户只需打开网页就能直接使用，无需任何技术配置。模型运行在独立的虚拟环境中，不会影响系统其他服务。

Llama-3.2V-11B-cot惊艳效果：工业流水线异常图的根因推理与处置建议生成

Llama-3.2V-11B-cot惊艳效果：工业流水线异常图的根因推理与处置建议生成 1. 项目概述 Llama-3.2V-11B-cot 是一款革命性的视觉语言模型，专为解决工业场景中的复杂视觉推理问题而设计。这个模型不仅能看懂图片，还能像经验丰富的工程师一样，对图像内容进行系统性分析和逻辑推理。想象一下，当工厂流水线出现异常时，传统方法需要工程师花费数小时检查监控画面、分析数据。而Llama-3.2V-11B-cot可以在几秒钟内完成同样的工作——识别异常、分析原因、甚至给出解决方案建议。 2. 核心能力解析 2.1 图像理解与推理能力 Llama-3.2V-11B-cot的核心优势在于它独特的推理架构： * SUMMARY：快速概括图像主要内容 * CAPTION：生成详细图像描述 * REASONING：进行多步逻辑推理 * CONCLUSION：得出最终结论和建议这种结构化的推理方式，使得模型在工业异常检测场景中表现尤为出色。 2.2 工业场景应用实例让我们看一个实际案例。当输入一张异常的工业流水线图片时，模型会这样工作： 1. 首

Spec-Kit+Copilot打造AI规格驱动开发

作者：算力魔方创始人/英特尔创新大使刘力一，什么是Spec-Kit？在传统的软件开发中，通常先有需求→ 写规格 → 再写代码；规格多数是“指导性文档”，而真正的业务逻辑和边界由程序员“翻译”出来。Spec-Driven Development（规格驱动开发）的理念是，将规格（spec）从“仅供参考”提升为可执行、可驱动的核心工件，直接引导后续设计、计划、任务拆解、实现等流程。spec-kit 是 GitHub 提供的一个工具集 / CLI / 模板库，用来在项目中落地这种流程！ Github: https://github.com/github/spec-kit 二，搭建运行环境本节将指导您从零开发搭建Spec-Kit的运行环境。第一步：在Ubuntu24.04上安装uv： curl -LsSf