AMDGPU 驱动架构概览 | 极客日志

CAI

AMDGPU 驱动架构概览

综述由AI生成AMDGPU 驱动由图形驱动 AMDGPU 和计算驱动 KFD 组成，SVM 功能主要在 KFD 中实现。文章阐述了驱动的层次结构、关键组件及 SVM 在其中的位置。KFD 负责进程管理、设备管理及 SVM 逻辑，通过字符设备接口暴露给用户空间。TTM 框架管理 VRAM 和 GTT 内存，Buffer Object 用于显存分配。GART 表允许 GPU 访问系统内存，是页面迁移的关键桥梁。SVM 利用 TTM 管理显存，结合 GART 实现 CPU 与 GPU 间的统一地址空间管理。理解这些架构有助于深入 SVM 具体实现。

PentesterX发布于 2026/2/7更新于 2026/5/2924 浏览

难度: 🟡 进阶
预计学习时间: 1-1.5 小时
前置知识: Linux 驱动基础、前两章内容

📋 概述

在深入 SVM 实现细节之前，我们需要理解 AMDGPU 驱动的整体架构。AMDGPU 是一个复杂的驱动系统，包含显卡驱动（AMDGPU）和计算驱动（KFD）两大部分。SVM 功能主要在 KFD 中实现，但与 AMDGPU 的其他组件紧密协作。

本章将介绍驱动的层次结构、关键组件以及 SVM 在其中的位置。

3.1 AMDGPU 驱动整体架构

AMD GPU 驱动实际上包含两个主要部分：

┌─────────────────────────────────────────┐
│ 用户空间应用 │
│ [OpenGL] [Vulkan] [OpenCL] [HIP] │
└─────────────────────────────────────────┘
↓ ↓ ↓
┌────────┐ ┌─────────┐ ┌─────────┐
│Mesa/驱动│ │libdrm │ │ROCm RT │
└────────┘ └─────────┘ └─────────┘
↓ ↓ ======================================
内核空间 ======================================
↓ ↓
┌──────────┐ ┌──────────┐
│ AMDGPU │ │ KFD │
│ (DRM) │ ←──────→ │ (Compute)│
│ 图形驱动 │ │ 计算驱动 │
└──────────┘ └──────────┘
↓ ↓
┌────────────────────────────┐
│ GPU 硬件 │
│ [GFX] [Compute] [SDMA] │
└────────────────────────────┘

AMDGPU 驱动

位置: drivers/gpu/drm/amd/amdgpu/
作用:
- 图形渲染支持
- 显示输出（DisplayPort, HDMI 等）
- GPU 内存管理（TTM）
- GPU 电源管理
- 基础硬件抽象

KFD 驱动（Kernel Fusion Driver）

位置: drivers/gpu/drm/amd/amdkfd/
作用:
- HSA 支持（Heterogeneous System Architecture）
- 计算队列管理
- 进程管理
- SVM 实现 ← 我们关注的重点
- 调试支持

目录结构

drivers/gpu/drm/amd/
├── amdgpu/ # AMDGPU 核心驱动
│   ├── amdgpu_vm.c # 虚拟内存管理
│   ├── amdgpu_ttm.c # TTM 内存管理
│   ├── amdgpu_device.c # 设备初始化
│   └── ...
├── amdkfd/ # KFD 计算驱动 ★ SVM 在这里
│   ├── kfd_module.c 
│   ├── kfd_device.c 
│   ├── kfd_process.c 
│   ├── kfd_svm.c 
│   ├── kfd_svm.h 
│   ├── kfd_migrate.c 
│   └── ...
├── include/
│   └── kgd_kfd_interface.h 
└── ...

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

┌───────────────────────────────────────┐
│ KFD 驱动 │
├───────────────────────────────────────┤
│ ┌────────────┐ ┌────────────┐ │
│ │进程管理 │ │设备管理 │ │
│ │kfd_process │ │kfd_device │ │
│ └────────────┘ └────────────┘ │
│ ┌────────────┐ ┌─────────────┐ │
│ │队列管理 │ │中断处理 │ │
│ │kfd_queue │ │kfd_interrupt│ │
│ └────────────┘ └─────────────┘ │
│ ┌────────────┐ ┌────────────┐ │
│ │内存管理 │ │拓扑管理 │ │
│ │kfd_svm │ │kfd_topology│ │
│ └────────────┘ └────────────┘ │
│ ┌────────────┐ ┌────────────┐ │
│ │事件管理 │ │调试支持 │ │
│ │kfd_events │ │kfd_debug │ │
│ └────────────┘ └────────────┘ │
└───────────────────────────────────────┘

struct kfd_process {
    struct mm_struct *mm; // 进程的内存管理结构
    struct mutex mutex;
    uint32_t pasid; // Process Address Space ID
    struct kfd_process_device *pdds[MAX_GPU_INSTANCE];
    struct svm_range_list svms; // ★ SVM 范围列表
    // 其他成员...
};

struct kfd_dev {
    struct amdgpu_device *adev; // 指向 AMDGPU 设备
    struct kfd_device_info device_info; // 与 AMDGPU 交互的接口
    const struct kfd2kgd_calls *kfd2kgd; // 设备内存信息
    struct dev_pagemap pgmap; // ★ 设备内存页面映射
    // 其他成员...
};

GPU 硬件探测
↓
amdgpu 驱动加载
↓
调用 kgd2kfd_probe() ← AMDGPU 通知 KFD
↓
创建 kfd_dev 结构
↓
kgd2kfd_device_init() ← 初始化 KFD 设备
↓
注册到拓扑系统
↓
设备就绪

/dev/kfd # 主要接口

#define AMDKFD_IOC_CREATE_QUEUE // 创建计算队列
#define AMDKFD_IOC_DESTROY_QUEUE // 销毁队列
#define AMDKFD_IOC_SET_MEMORY_POLICY // 设置内存策略
#define AMDKFD_IOC_SVM // ★ SVM 操作
// ... 更多

用户空间调用: ioctl(kfd_fd, AMDKFD_IOC_SVM, &args)
↓
kfd_ioctl() 分发
↓
kfd_ioctl_svm() ← kfd_chardev.c
↓
svm_ioctl() ← kfd_svm.c
↓
处理具体的 SVM 操作（添加范围、设置属性等）

┌────────────────────────────────────┐
│ TTM 框架 │
├────────────────────────────────────┤
│ • 管理 VRAM 和 GTT 内存 │
│ • Buffer Object (BO) 管理 │
│ • 内存驱逐和交换 │
│ • 与系统内存交互 │
└────────────────────────────────────┘
↓ ↓
┌─────────┐ ┌─────────┐
│ VRAM │ │ GTT │
│(GPU 显存) │ │(系统内存)│
└─────────┘ └─────────┘

// TTM 定义的内存类型
#define TTM_PL_SYSTEM 0 // 系统 RAM
#define TTM_PL_TT 1 // GTT (Graphics Translation Table)
#define TTM_PL_VRAM 2 // GPU 显存
#define TTM_PL_PRIV 3 // 驱动私有

struct amdgpu_bo {
    struct ttm_buffer_object tbo; // TTM BO 基类
    // VRAM 位置
    u64 vram_offset;
    // 偏好域
    u32 preferred_domains;
    // 允许的域
    u32 allowed_domains;
    // 其他成员...
};

1. 创建 BO amdgpu_bo_create()
↓
分配 TTM 资源
↓
2. 放置 BO（可能在 VRAM 或系统内存）
amdgpu_bo_pin() / ttm_bo_validate()
↓
3. CPU 访问
amdgpu_bo_kmap() ← 建立内核映射
↓
4. GPU 访问
通过 GPU 页表映射
↓
5. 驱逐（内存不足时）
ttm_bo_evict()
↓
移动到系统内存
↓
6. 销毁
amdgpu_bo_unref()

// kfd_svm.c 中
struct svm_range_bo {
    struct amdgpu_bo *bo; // ← 使用 TTM BO
    // ...
};

// 分配 VRAM 给 SVM 范围
int svm_range_vram_node_new(...) {
    // 创建 amdgpu_bo
    ret = amdgpu_bo_create(...);
    // ...
}

没有 GART: GPU 只能访问 VRAM ✗
有 GART: GPU 可以通过 GART 访问系统 RAM ✓

GPU 视角的地址空间:
┌──────────────────────┐
│ 0x0000_0000 │
│ ... │ ← VRAM (直接映射)
│ VRAM End │
├──────────────────────┤
│ GART Start │
│ ... │ ← GART 窗口（映射系统 RAM）
│ GART End │
└──────────────────────┘

GART 映射表:
GPU 地址 → DMA 地址（系统内存物理地址）

// 系统内存页面的 DMA 地址：0x8000_1000
// GART 映射：GPU 地址 0xF000_0000 → DMA 0x8000_1000
// GPU 执行：load R1,[0xF000_0000]
// GPU 地址 ↓ GART 查表 ↓ 通过 PCIe 访问 0x8000_1000 // 系统内存

// kfd_migrate.c
// 使用 GART 映射系统内存页面
svm_migrate_gart_map(ring, npages, dma_addr, &gart_addr, flags);

// 使用 SDMA 在 GART 地址和 VRAM 间复制
amdgpu_copy_buffer(ring, gart_addr, vram_addr, size,...);

系统内存页面
↓
建立 GART 映射 → GPU 可见地址
↓
SDMA 从 GPU 地址拷贝 → VRAM

kfd_svm.c # SVM 核心逻辑
├─ 范围管理
│  ├─ svm_range_add()
│  ├─ svm_range_unlink()
│  └─ svm_range_split()
├─ 页面映射
│  ├─ svm_range_map_to_gpu()
│  ├─ svm_range_unmap_from_gpu()
│  └─ svm_range_validate_and_map()
├─ 缺页处理
│  ├─ svm_range_restore_pages()
│  └─ 页面恢复逻辑
├─ MMU Notifier
│  └─ svm_range_cpu_invalidate_pagetables()
├─ IOCTL 接口
│  └─ svm_ioctl()
└─ 其他辅助功能

kfd_migrate.c # 页面迁移
├─ RAM → VRAM 迁移
├─ VRAM → RAM 迁移
├─ GART 映射管理
└─ SDMA 复制操作

kfd_svm.h # SVM 数据结构定义

┌──────────────────────────────┐
│ 用户空间 │
│ (ROCm Runtime) │
└──────────────────────────────┘
↓ IOCTL
========================
内核空间 ========================
↓
┌──────────────┐
│ kfd_chardev │ ← IOCTL 分发
└──────────────┘
↓
┌──────────────┐
│ kfd_svm │ ← SVM 核心
└──────────────┘
↓ ↓ ↓
┌────┐ ┌────┐ ┌────┐
│HMM │ │TTM │ │VM │ ← 内核子系统
└────┘ └────┘ └────┘
↓ ↓ ↓
┌──────────────────┐
│ kfd_migrate │ ← 页面迁移
└──────────────────┘
↓
┌──────────────────┐
│ AMDGPU 驱动 │
│ (SDMA, VM, ...) │
└──────────────────┘
↓
┌──────────────────┐
│ GPU 硬件 │
└──────────────────┘

// include/kgd_kfd_interface.h
struct kfd2kgd_calls {
    // GPU VM 操作
    int (*map_memory_to_gpu)(...);
    int (*unmap_memory_from_gpu)(...);
    // SDMA 操作
    int (*submit_ib)(...);
    // 其他...
};

// kfd_svm.c 中使用 HMM
// 查询 CPU 页表
ret = hmm_range_fault(&range);

// 迁移页面
ret = migrate_vma_setup(&migrate);
// ...
ret = migrate_vma_finalize(&migrate);

// kfd_process.c
struct kfd_process {
    struct svm_range_list svms; // SVM 范围列表
    // ...
};

// 进程初始化时
svm_range_list_init(p);

// 进程退出时
svm_range_list_fini(p);

# 查看 KFD 设备（需要 AMD GPU 和 ROCm）
ls -l /dev/kfd

# 查看 GPU 拓扑
cat /sys/class/kfd/kfd/topology/nodes/*/name

# 查看 SVM 支持（如果 CONFIG_HSA_AMD_SVM=y）
dmesg | grep -i svm

cd drivers/gpu/drm/amd/amdkfd
# 查看模块初始化
grep -n "module_init\|module_exit" kfd_module.c

# 查看 KFD 与 AMDGPU 的接口
grep -n "kgd2kfd" kfd_device.c | head -20

# 统计 SVM 代码量
wc -l kfd_svm.c kfd_migrate.c

AMDGPU 驱动架构概览

📋 概述

3.1 AMDGPU 驱动整体架构

AMDGPU 驱动

KFD 驱动（Kernel Fusion Driver）

目录结构

更多推荐文章

相关免费在线工具

3.2 KFD (Kernel Fusion Driver) 简介

KFD 的历史

KFD 的核心组件

1. 进程管理（kfd_process.c）

2. 设备管理（kfd_device.c）

3. 字符设备接口（kfd_chardev.c）

3.3 TTM (Translation Table Maps)

什么是 TTM

TTM 的内存域（Memory Domain）

Buffer Object (BO)

TTM 与 SVM 的关系

3.4 GART 表的作用

什么是 GART

GART 的工作原理

GART 在 SVM 中的使用

3.5 SVM 在驱动中的位置

SVM 的模块划分

SVM 与其他组件的交互

关键接口

1. KFD ↔ AMDGPU 接口

2. SVM ↔ HMM 接口

3. SVM ↔ 进程管理接口

💡 重点提示

⚠️ 常见误区

📝 实践练习

📚 本章小结

📖 扩展阅读

更多推荐文章

相关免费在线工具

AMDGPU 驱动架构概览

📋 概述

3.1 AMDGPU 驱动整体架构

AMDGPU 驱动

KFD 驱动（Kernel Fusion Driver）

目录结构

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 KFD (Kernel Fusion Driver) 简介

KFD 的历史

KFD 的核心组件

1. 进程管理（kfd_process.c）

2. 设备管理（kfd_device.c）

3. 字符设备接口（kfd_chardev.c）

3.3 TTM (Translation Table Maps)

什么是 TTM

TTM 的内存域（Memory Domain）

Buffer Object (BO)

TTM 与 SVM 的关系

3.4 GART 表的作用

什么是 GART

GART 的工作原理

GART 在 SVM 中的使用

3.5 SVM 在驱动中的位置

SVM 的模块划分

SVM 与其他组件的交互

关键接口

1. KFD ↔ AMDGPU 接口

2. SVM ↔ HMM 接口

3. SVM ↔ 进程管理接口

💡 重点提示

⚠️ 常见误区

📝 实践练习

📚 本章小结

📖 扩展阅读

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具