Stable Diffusion WebUI本地部署全步骤(含CUDA,cuDNN,Pytorch GPU版安装过程)(Win 11 + RTX5060)

部署SD WebUI前,先安装CUDA+cuDNN+Pytorch

电脑配置:

系统:windows 11

显卡:NVIDIA GeForce RTX 5060 Laptop GPU

内存:24G

下载版本:

CUDA:13.0

cuDNN:9.13.1

Pytorch:12.9

第一步:安装CUDA

步骤一:查看CUDA version

win+R输入cmd,在命令提示符窗口中输入nvidia-smi,查看CUDA Version

我的CUDA version 为13.0,所以我下载的版本为13.0的(也可以向下安装低版本的,我建议下载最新的版本)。
CUDA下载网址:https://developer.nvidia.com/cuda-toolkit-archive

本文以13.0的安装为例。

步骤二:下载CUDA安装包

打开网站后,选择13.0版本,点击箭头指向的位置。

跳转到下图页面

选择对应的选项,我的是win11系统,所以选择的11,如果你是win10系统,则选择10;

Installer Type可以是本地下载exe(local),也可以是exe(network),这里我选择的是exe(network),点击download即可

步骤三:运行安装包

双击运行

点“同意并继续”

选择自定义,然后点击下一步

点击下一步

这里的安装路径,可以放在C盘,也可以放在D盘,可以自定义路径,我是C盘空间不足,所以放到了D盘,路径选择好之后,点击下一步。

继续点击下一步

关闭

CUDA的安装完成

第二步:安装cuDNN

步骤一:下载cuDNN安装包

打开网址https://docs.nvidia.com/deeplearning/cudnn/backend/latest/index.html

点击cuDNN 9.13.1后下载安装包

双击运行安装包

下一步选择自定义,自定义路径选择D:\Program Files\NVIDIA\CUDNN\v9.13,然后下一步

点击关闭

cuDNN的安装完毕

第三步:安装Pytorch

步骤一:打开pytorch官网

打开pytorch官网:https://pytorch.org/get-started/locally/

下载stable版本的 CUDA 12.9
复制这串代码:pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu129

步骤二:全局环境下安装pytorch

注意,这里要在全局环境下安装pytorch,不要在虚拟环境下安装pytorch。

按win+R,输入cmd打开命令提示符,

输入D: ,进入D盘

输入pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu129

pytorch安装成功

第四步:本地部署Stable Diffusion WebUI

 按win+R,输入cmd打开命令提示符,

输入D: ,进入D盘

输入git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

按下Enter回车

在D盘根目录下就有一个stable-diffusion-webui文件夹

然后在项目中创建一个虚拟python环境:

cd stable-diffusion-webui //进入刚才下载项目 python -m venv .\venv //创建一个虚拟python环境

创建完成以后,我们进入到venv目录中的Scripts文件夹,执行activate:

cd .\venv\Scripts .\activate.bat

执行完成后,Windows命令行会自动清屏(之前执行的所有命令及输出结果清空),首会出现“(venv)”的字样 ,表示我们已经进入了虚拟环境。

开始安装项目的依赖项:

cd ../.. pip install -r requirements_versions.txt

等待安装完成后,运行项目:

.\webui-user.bat

还需要修改一下 webui-user.bat 这个文件, 设置PYTHON路径安装的路径/stable-diffusion-webui\venv\Scripts\python.exe:

set PYTHON=G:\StableDiffusion\stable-diffusion-webui\venv\Scripts\python.exe

后边再启动,直接双击执行webui-user.bat即可,可以发送桌面快捷方式到桌面,后面再启动,可以直接在桌面启动。

Read more

Llama-3.2V-11B-cot部署避坑指南:视觉权重加载致命Bug修复原理与验证方法

Llama-3.2V-11B-cot部署避坑指南:视觉权重加载致命Bug修复原理与验证方法 1. 项目背景与核心价值 Llama-3.2V-11B-cot是基于Meta最新多模态大模型开发的高性能视觉推理工具,专为双卡RTX 4090环境深度优化。该工具最大的突破是彻底解决了困扰开发者的视觉权重加载致命Bug,同时保留了完整的Chain of Thought(CoT)逻辑推演能力。 对于想要体验Llama多模态大模型的开发者而言,这个工具解决了三个核心痛点: * 视觉权重加载失败导致模型"失明"的问题 * 双卡环境显存分配不合理的OOM报错 * 复杂参数配置带来的高学习门槛 2. 致命Bug修复原理详解 2.1 视觉权重加载Bug现象 在原始版本中,当尝试加载视觉编码器权重时,会出现以下典型错误: RuntimeError: Error(s) in loading state_dict for CLIPVisionModel: size mismatch for vision_model.embeddings.position_embedding.weight

2026必备10个降AIGC工具,继续教育学生必看

2026必备10个降AIGC工具,继续教育学生必看

2026必备10个降AIGC工具,继续教育学生必看 AI降重工具的崛起,重塑学术写作新规则 在人工智能技术日益渗透到各个领域的今天,学术写作也面临着前所未有的挑战。尤其是在继续教育领域,越来越多的学生和研究人员发现,使用AI生成的内容容易被检测出高AIGC率,导致论文查重不合格甚至被认定为抄袭。因此,如何有效降低AIGC率、去除AI痕迹、同时保持文章的语义通顺和逻辑严谨,成为当前学术写作中亟需解决的问题。 针对这一痛点,AI降重工具应运而生,它们通过先进的自然语言处理技术和深度学习算法,帮助用户对文本进行高效、精准的修改。这些工具不仅能显著降低论文的AIGC率,还能在不改变原意的前提下,优化语言表达,提升整体质量。无论是初稿的快速处理,还是定稿前的细致调整,AI降重工具都能提供强大的支持,成为现代学术写作不可或缺的助手。 工具名称主要功能适用场景千笔强力去除AI痕迹、保语义降重AI率过高急需降重云笔AI多模式降重初稿快速处理锐智 AI综合查重与降重定稿前自查文途AI操作简单片段修改降重鸟同义词替换小幅度修改笔杆在线写作辅助辅助润色维普官方查重最终检测万方数据库查重数据对比

ROG-Map:一种高效的以机器人为中心的大场景高分辨率LiDAR运动规划网格地图(论文阅读)

ROG-Map:一种高效的以机器人为中心的大场景高分辨率LiDAR运动规划网格地图(论文阅读)

论文:ROG-Map: An Efficient Robocentric Occupancy Grid Map for Large-scene and High-resolution LiDAR-based Motion Planning 论文主要创新点: 1.本文旨在解决将激光雷达与OGM集成的挑战,ROG-Map是一种均匀的基于网格的OGM,可以保持局部地图与机器人一起移动,从而实现高效的地图操作,并降低大场景自主飞行的内存成本 2.此外,我们提出了一种新的增量障碍膨胀方法,该方法显着降低了膨胀的计算成本。该方法在各种公共数据集上优于最先进的(SOTA)方法。 3.0拷贝地图滑动策略,该策略仅维护机器人周围的局部地图,使ROG-Map适用于大场景任务 论文特点:只是用于避障的局部地图,最求计算效率最大化 第一部分:介绍 INTRODUCTION                视觉:测量范围短(35m);激光雷达:精确和远程(避开小障碍物和大场景感知)。由于要避开小障碍物,分辨率足够高的OGM能够感知小障碍物,从而在复杂环境中实现导航和避障。充分利用激光雷达提供远

【优质开源项目】AIGC开源推荐-全球情报监控平台worldmonitor

【优质开源项目】AIGC开源推荐-全球情报监控平台worldmonitor

1.概述 World Monitor 是一个开源的实时情报/监测仪表盘,聚合多类数据源(新闻、地理/卫星、航运/空中、财经、威胁情报等),提供交互式地理视图、AI 摘要、事件聚合与报警,支持 Web / PWA / Tauri 桌面三种运行方式,并可通过变体(WORLD / TECH / FINANCE)切换功能集。 2. 总体技术架构(分层视角) 客户端层(Browser / PWA / Tauri desktop) * • React + TypeScript + Vite 构建。 * • 地图/可视化:deck.gl(WebGL 3D globe)、MapLibre GL、D3