AMD 核显笔记本 Windows 11 运行 Stable Diffusion 实战
硬件环境与方案对比
本次测试平台为 AMD Ryzen R7 6800H,16G 内存,核显 Radeon 680M,共享内存 8G。在 Windows 11 环境下,我们主要对比了 DirectML 版与 ZLUDA 版本的性能表现。实测发现,ZLUDA 版本速度约为 DirectML 的 5 倍以上,对于 APU 用户来说,这是目前较为理想的解决方案。
一、环境准备:HIP SDK 与 ROCm
1. 理解 HIP 与 ROCm
HIP(Heterogeneous-Compute Interface for Portability)是 AMD 开发的 GPU 编程模型,旨在实现代码的可移植性。简单来说,它是对 CUDA API 的高度兼容克隆,几乎全盘拷贝了 CUDA 接口,但作为 CUDA 的子集存在。HIP 既可以运行在 ROCm 平台上,也能适配 CUDA 环境,这意味着它既能在 A 卡上跑,理论上也能在 N 卡上跑。
ROCm 则是 AMD 的开源 GPU 计算软件堆栈,提供了与 CUDA 相似的编程模型,让在 AMD GPU 上编写和运行计算应用变得更加容易。
- A 卡:编程模型使用 HIP 或 OpenCL,运行环境为 ROCm。
- N 卡:编程模型与运行环境均为 CUDA。
2. 下载与安装
访问 AMD 开发者资源页面获取 HIP SDK。注意版本选择:
- 版本要求:需下载 HIP 5.7.1 版本(安装界面显示为 5.7)。只有这个版本支持 AMD Radeon 680M 的 ZLUDA 加速。如果是 780M 核显,则可以使用 6.1 版本。
- 安装包:AMD Software PRO Edition
3. 关键库替换(针对 680M)
锐龙 R7 6800H 内置的 Radeon 680M 核显架构为 gfx1035(R5 6600H 同款)。由于官方驱动不支持该架构,我们需要手动替换部分库文件。
从 GitHub 仓库下载以下两个压缩包:
rocblas.for.gfx1035.AMD.680M.rembrandt.V2.7z(专用于 680M)Rocm.rocblas.HIP5.7.0.V2.7z(通用多显卡支持)
操作步骤:
- 找到 HIP 安装目录下的
bin\rocblas文件夹,路径通常为C:\Program Files\AMD\ROCm\5.7\bin。 - 将压缩包内的
rocblas.dll复制并覆盖原目录下的同名文件。 - 将原目录下的
library文件夹重命名为oldlibrary。 - 将压缩包内的
library文件夹复制到同一目录下。 - 建议重启电脑以确保生效。
注意:ZLUDA 不完全支持 PyTorch,运行时可能会出现不稳定现象,请做好心理准备。
二、Stable Diffusion WebUI 部署
1. 基础工具安装
- Git:前往 git-scm.com 下载安装。
- Python:推荐版本 3.10.6 ~ 3.10.11。安装时务必勾选'配置环境变量'。


