windows stable-diffusion-webui 一键运行,无需配置教程(仅供学习)

windows stable-diffusion-webui 一键运行,无需配置教程(仅供学习)

一.一步完成启动


直接上完整文件 包含模型,python环境 下载结束直接运行 (夸克网盘)(需要有N卡支持)

链接:https://pan.quark.cn/s/c126b8ba78b8?pwd=6fpw
提取码:6fpw

解压后

 进入 Stable Diffusion WebUI 目录 解压目录所在位置 cd D:\notebook\AIGC\picture_ai\SDwebui\stable-diffusion-webui 激活python虚拟环境 .venv\Scripts\activate.bat 启动 WebUI 并使用暗色主题 webui.bat --theme dark



嫌启动麻烦的可以下一个 bat 处理命令


新建 文本文件 按照自己目录写入下列文件,保存后修改后缀txt 为 bat

@echo off REM 进入 Stable Diffusion WebUI 目录 cd /d D:\notebook\AIGC\picture_ai\SDwebui\stable-diffusion-webui REM 激活虚拟环境 call .venv\Scripts\activate.bat REM 启动 WebUI 并使用暗色主题 call webui.bat --theme dark REM 保持命令行窗口打开 pause 

,可以放到桌面,以后双击运行即可


二.自己git拉取配置运行
 

注意点:

选择位置 需要自己进行替换不然会出现报错 拉取仓库不存在 

 # stable_diffusion_repo = os.environ.get('STABLE_DIFFUSION_REPO', "https://github.com/Stability-AI/stablediffusion.git") stable_diffusion_repo = os.environ.get('STABLE_DIFFUSION_REPO', "https://github.com/joypaul162/Stability-AI-stablediffusion.git")


新建文件夹 ,

拉取git 镜像,git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

解压进入目录 ,

安装python环境,建议用 python uv管理环境安装

运行命令 

后续慢慢出详细教程。


三.运行结果

界面(http://127.0.0.1:7860/

示例:taxt to image   中文提示词不行毕竟模型不是国内的可以自己去试试,模型文件放入
​​​​​​​ stable-diffusion-webui\models\Stable-diffusion

正面提示词:Beautiful anime girl, facing forward, long silky hair, big sparkling eyes, flawless skin, delicate facial features, gentle smile, wearing a stylish modern outfit, elegant pose with one hand slightly raised, soft lighting, vibrant colors, high detail, clean line art, sharp focus, subtle blush on cheeks, flowing hair, ethereal and charming atmosphere, cinematic composition

负面提示词:blurry, low quality, out of focus, bad anatomy, extra limbs, mutated, distorted face, poorly drawn, ugly expression, deformed hands, messy hair, text, watermark, pixelated, overexposed, underexposed, cartoonish, exaggerated features




挺好玩的

Read more

GLM-4v-9b实战指南:用llama.cpp GGUF格式在消费级GPU部署多模态模型

GLM-4v-9b实战指南:用llama.cpp GGUF格式在消费级GPU部署多模态模型 1. 为什么你需要关注GLM-4v-9b 你有没有遇到过这样的场景:一张密密麻麻的财务报表截图发到工作群,大家却没人愿意花十分钟手动抄录数据;或者客户发来一张手机拍的电路板照片,问“这个元件型号是什么”,你只能回个尴尬的微笑;又或者团队正在做竞品分析,需要从几十份PDF产品手册里快速提取图表信息——这些不是小问题,而是每天真实消耗工程师、运营、产品经理大量时间的“视觉理解黑洞”。 过去,这类任务要么靠人工硬啃,要么得调用API付费接口,响应慢、成本高、隐私难保障。直到2024年,智谱AI开源了glm-4v-9b——一个真正能在你自己的RTX 4090上跑起来的90亿参数多模态模型。它不只是一张“能看图说话”的新名片,而是把高分辨率图像理解能力,塞进了一张消费级显卡的显存里。 重点来了:它支持原生1120×1120输入,这意味着你不用再把一张A4扫描件缩成模糊小图上传;它对中文表格、小字号OCR、技术类图表的理解,在公开评测中直接超过了GPT-4-turbo和Claude 3 Opus;

使用 VS Code 与 GitHub Copilot 高效 Vibe Coding 指南

欢迎大家关注「几米宋」的微信公众号,公众号聚焦于云原生、AI、服务网格、工具教程、技术观察以及日常感悟等内容,更多精彩内容请访问个人网站 jimmysong.io。 📄 文章摘要 掌握 VS Code 与 GitHub Copilot 的高效开发技巧,提升你的编程体验与效率,开启愉快的 vibe coding 之旅。 🔗 在 jimmysong.io 上 阅读原文 体验更佳。 最近一段时间笔者试用了众多的 vibe coding(氛围编程)工具,但是试用了一圈后,最终还是选择了 VS Code 与 GitHub Copilot 的组合。不为别的,就是因为最得心应手、性价比最高、最有可扩展性。本文将从环境配置、工作空间和插件、界面布局、

[AI工具箱] Vheer:免费、免登录,一键解锁AI绘画、视频生成和智能编辑

[AI工具箱] Vheer:免费、免登录,一键解锁AI绘画、视频生成和智能编辑

项目简介 今天偶然发现了个堪称“赛博活佛”的AI网站,名叫Vheer。它的作风相当大方,里面绝大部分功能都直接免费敞开用,就问你服不服。 文生图、图生视频、智能修图这些主流AI功能一个不落。点开就能用。而且非常的大气,比如抠图,别的网站按张收费,它直接让你一口气传20张照片自动处理,完全免费,甚至你去花时间不需要注册。 它几乎移除了所有上手障碍。网站首页清晰地排列着各种功能,没有晦涩的术语。你想把文字变成图片,或者让静态照片动起来,点开对应的按钮,输入你的想法,结果很快就能呈现在你面前。整个过程简单得就像在用一款普通的手机APP。 食用指南 访问地址 传送地址 官网的免费会员上面写的几个非常吸引人的地方,第一没有任何水印,第二生成图片视频这些是没有任何数量上的限制,只有高级别的模型和高速通道不能使用(但是实测下来,生成的速度也是相当不错)。 网站也提供了一些订阅模式,可以使用更高级的模型,但是这些高级模型需要消耗算力点。根据自己的需要看是否订阅。 由于功能实在太多了,强烈建议亲手测试一下 操作与体验——文生图 官网光一个文生图的功能就折腾出来了40多个功能,除了

从GAN到ChatGPT:AIGC技术演进与实战应用指南

快速体验 在开始今天关于 从GAN到ChatGPT:AIGC技术演进与实战应用指南 的探讨之前,我想先分享一个最近让我觉得很有意思的全栈技术挑战。 我们常说 AI 是未来,但作为开发者,如何将大模型(LLM)真正落地为一个低延迟、可交互的实时系统,而不仅仅是调个 API? 这里有一个非常硬核的动手实验:基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。 从0到1构建生产级别应用,脱离Demo,点击打开 从0打造个人豆包实时通话AI动手实验 从GAN到ChatGPT:AIGC技术演进与实战应用指南 技术背景:关键模型演进时间轴 2014年 - GAN横空出世 生成对抗网络(GAN)通过生成器与判别器的对抗训练,首次实现了高质量图像生成。核心突破在于: