AMD 显卡笔记本windows11满血玩转Stable Diffusion

AMD 显卡笔记本windows11满血玩转Stable Diffusion

电脑配置:

AMD Ryzen R7 6800H,16G内存,核显Radeon 680M,共享内存8G。

测试了direct-ml版,还是zluda版本速度快,大概是direct-ml版本的5倍以上。以下正文。

一,安装 AMD HIP SDK

HIP
HIP(Heterogeneous-Compute Interface for Portability)是AMD开发的一种GPU编程模型,旨在实现GPU代码的可移植性。
AI应用里,N卡几乎可以说一统江湖,N卡的GPU是运行在CUDA平台上的。
HIP 可以说是 CUDA API 的”山寨克隆“版,几乎全盘拷贝 CUDA API,是 CUDA 的一个子集。
HIP可以运行在ROCm平台,也可以运行在CUDA平台(即可以运行在A卡,也可以运行在N卡上)。

ROCm介绍
ROCm是AMD的开源GPU计算软件堆栈,旨在提供一个可移植、高性能的GPU计算平台。
ROCm支持AMD的GPU和APU,以及x86和ARM架构的处理器,提供了与CUDA相似的编程模型,使得在AMD GPU上编写和运行GPU计算应用程序变得更加容易。

A卡上编程模型使用的是HIP或者OpenCL,而运行环境是ROCm
N卡上,编程模型是CUDA,运行环境也是CUDA

下载页面
https://www.amd.com/en/developer/resources/rocm-hub/hip-sdk.html

下载链接。要下载HIP 5.7.1版本,(安装界面看起来还是5.7)。只有这个版本的ZLUDA支持AMD Radeon 680M。780M的就可以用6.1了。
https://download.amd.com/developer/eula/rocm-hub/AMD-Software-PRO-Edition-23.Q4-Win10-Win11-For-HIP.exe

【ZLUDA】
注意,ZLUDA不完全支持pytorch,并且可能会有不稳定的现象。
这里是原版,3.7.2还是支持ROCm5的:
https://github.com/lshqqytiger/ZLUDA/releases
https://github.com/lshqqytiger/ZLUDA/releases/download/rel.4f12e8cfe9fa53bd29637c0bfe6fc88494d2b10f/ZLUDA-windows-amd64.zip

锐龙R7 6800H里内置的核显是AMD Radeon 680M,其架构是gfx1035(R5 6600H也是一样的),所以要下载这两个:
https://github.com/likelovewant/ROCmLibs-for-gfx1103-AMD780M-APU/releases/download/v0.5.7/rocblas.for.gfx1035.AMD.680M.rembrandt.V2.7z
https://github.com/likelovewant/ROCmLibs-for-gfx1103-AMD780M-APU/releases/download/v0.5.7/Rocm.rocblas.HIP5.7.0.V2.7z

其中第一个是只给AMD 680M用的,第二个是给多个AMD显卡用的。使用方法:

找到HIP的安装目录%HIP_PATH%\bin\rocblas,通常是C:\Program Files\AMD\ROCm\5.7\bin,使用压缩包里的rocblas.dll替换掉目录里的同名文件,然后修改同一目录下的library目录名为oldlibrary,再把压缩包里的library目录拷贝过来。如果可能的话,重新启动一下。

二,安装stable-diffusion + webui

【安装git】
git-scm.com/download/win

【安装Python】
www.python.org/downloads/
选择3.10.6~3.10.11版本,安装的时候,一定要勾选,配置环境变量。

【下载工程】
找一个空间足够大的盘,然后创建一个文件夹,比如git,打开cmd窗口
cd git
git clone https://github.com/lshqqytiger/stable-diffusion-webui-amdgpu amdgpu

或国内镜像:
git clone https://gitee.com/ranxv/stable-diffusion-webui-amdgpu.git amdgpu

安装完后,在文件夹amdgpu下,继续打开终端窗口,分别执行以下两个命令

git clone https://github.com/lshqqytiger/k-diffusion-directml repositories/k-diffusion
git clone https://github.com/stability-AI/stablediffusion repositoriesable-diffusion-stability-ai

【安装torch】
进入venv,安装
pip install torch==2.2.1+cu118 torchvision==0.17.1+cu118 --index-url https://download.pytorch.org/whl/cu118
或修改requirements,不要用默认的torch和torchvision,也不要用cuda12版本(cu121),会崩溃。

如果之后不小心安装了torch的其它版本,也可以像上面一样换回来。

【修改配置】

找到stable-diffusion-webui-amdgpu\webui-user.bat文件,然后用记事本打开,添加属性:
set PYTORCH_CUDA_ALLOC_CONF=garbage_collection_threshold:0.9,max_split_size_mb:512
set COMMANDLINE_ARGS=--precision full --disable-nan-check --upcast-sampling --opt-sub-quad-attention --medvram --use-zluda

【最后一步】
在stable-diffusion-webui-amdgpu文件夹下找到webui-user.bat文件,然后双击执行。

这里第一次运行要等zluda自己配置很久,而且没有进度条,所以别着急。即便

http://127.0.0.1:7860/

的页面打开后,还要等上10分钟(我这里加载模型就用了614秒),但只有第一遍慢,别着急。

等页面加载完,生个图试试吧!13.15it/s的速度,还可以吧?

这里面最关键的是ROCm能否识别GPU,因为官方驱动是不支持gfx1035的。看到下面的ROCm: agents=['gfx1035']就是成功了。

Read more

硬核:如何用大疆 SRT 数据实现高精度 AR 视频投射?

硬核:如何用大疆 SRT 数据实现高精度 AR 视频投射?

随着行业无人机的普及,“视频 + GIS”(Video AR)的需求在安防、巡检、应急指挥场景中越来越高频。 所谓 Video AR,简单说就是把无人机实时/回放的视频,“贴”在三维地图(如 Cesium)的对应位置上。让操作员既能看到真实的视频画面,又能看到视频中对应的地理信息(路网、标注、POI)。 听起来原理很简单:拿到无人机的位置和姿态,把地图摄像机摆过去不就行了? “能做出来”和“能用”是两码事。 今天我们就来复盘一下,如何从零实现一个 Video GIS 系统,以及如何解决那些让开发者头秃的“对不准、飘移、画面乱转”等核心痛点。 第一部分:如何实现?(基础篇) 实现一套视频融合系统,核心在于 “双层叠加”与“时空同步”。我们的技术栈选用 Vue3

Microi吾码:开源低代码,微服务开发的利器

Microi吾码:开源低代码,微服务开发的利器

前言 在微服务架构的应用中,服务的灵活性和可扩展性至关重要。Microi吾码作为一个高效的微服务框架,凭借其轻量级、可插拔的特性,已经成为开发者构建分布式应用的首选工具。除了基础的微服务开发功能外,Microi吾码还提供了丰富的扩展功能,其中表单引擎是一个重要亮点。本篇博客将详细介绍Microi吾码的特点,以及如何使用其表单引擎和其他实用功能。 一. Microi吾码简介 Microi吾码是一个基于Spring Boot构建的微服务框架,致力于为开发者提供简单、灵活的解决方案,帮助他们高效构建分布式应用。它整合了常用的微服务功能,如服务注册与发现、负载均衡、熔断器、API网关、配置中心等,使得开发者无需从零开始构建基础设施,从而专注于业务逻辑。 1.1 核心特点 Microi吾码的核心特点: * 轻量级:基于Spring Boot,极大地简化了项目配置和开发流程。 * 高度可扩展:提供丰富的插件支持,可以根据需要定制功能。 * 开箱即用:内置常见的微服务功能,减少了开发者的重复工作。 * 开发友好:支持热部署和自动化构建,提升开发效率。 1.2 功能介绍

低空经济新实践:无人机如何革新光伏电站巡检

低空经济新实践:无人机如何革新光伏电站巡检

引言:当低空经济遇见新能源革命 在“双碳”战略引领下,光伏电站如雨后春笋般遍布神州大地。截至2023年底,我国光伏发电装机容量已突破6亿千瓦,连续多年位居全球首位。然而,随着光伏电站规模的急剧扩大,传统人工巡检方式已难以满足高效、精准的运维需求。此时,低空经济的崛起为这一痛点带来了创新解法——无人机光伏巡检技术正在重新定义新能源设施的运维模式。 一、传统光伏巡检之困:低效、高风险、不精准 传统光伏巡检主要依赖人工方式,运维人员需要手持红外热像仪等设备,在光伏板阵列中徒步检查。这种方式存在明显短板: 1. 效率低下:一个100MW的光伏电站,人工全面巡检往往需要数周时间 2. 安全风险:高温、高电压环境下作业,人员安全隐患不容忽视 3. 漏检率高:人工目视检查难以发现细微缺陷,问题检出率通常不足70% 4. 数据离散:检查结果依赖个人经验,难以形成标准化数据资产 二、无人机智能巡检系统架构 现代无人机光伏巡检已形成完整的系统解决方案,主要由以下核心模块组成: 2.1 硬件配置 * 飞行平台:

AI绘画——即梦AI基础操作入门教程

AI绘画——即梦AI基础操作入门教程

即梦AI基础操作入门教程: 文章转载自:即梦AI基础操作入门教程 - AI智研社 目录 即梦AI基础操作入门教程: 一、即梦AI是什么?   二、注册与登录步骤 三、即梦AI界面介绍 四、基础功能详细操作步骤 (一)AI绘画功能详细操作 (二)AI视频生成详细操作 一、即梦AI是什么?   即梦AI 是由字节跳动开发的一款AI创作工具,主要功能包括AI绘画、AI视频生成、AI数字人制作等。它能帮助用户快速生成高质量的视觉内容,广泛应用于内容创作、短视频制作、营销宣传和教育培训等领域。 二、注册与登录步骤 访问官网: 进入https://jimeng.jianying.com,点击页面上的“登录”按钮。(也可以下载即梦APP) (备用入口:即梦AI - AI智研社) 账号注册: 使用抖音账号扫码,即可注册登录 三、即梦AI界面介绍