MS-S1 MAX、AI MAX 395 在 Ubuntu 24 利用 Vulkan 版 llama.cpp 运行 gpt-oss 120b | 极客日志

Shell / BashAI算法

MS-S1 MAX、AI MAX 395 在 Ubuntu 24 利用 Vulkan 版 llama.cpp 运行 gpt-oss 120b

在 Ubuntu 24 系统下，针对 MS-S1 MAX 和 AI MAX 395 硬件，通过安装 AMD GPU 驱动、ROCm 环境及调整 GRUB 参数解锁显存，最终利用 Vulkan 版 llama.cpp 成功运行 gpt-oss 120b 大模型的完整流程。包含驱动安装、显存解锁、模型下载及服务启动步骤，并通过 amdgpu_top 验证 GPU 加速效果。

草莓泡芙发布于 2026/4/5更新于 2026/5/2330 浏览

MS-S1 MAX、AI MAX 395 在 Ubuntu 24 利用 Vulkan 版 llama.cpp 运行 gpt-oss 120b

1. 安装 AMD GPU 驱动和 ROCm

wget https://repo.radeon.com/amdgpu-install/7.1.1/ubuntu/noble/amdgpu-install_7.1.1.70101-1_all.deb
sudo apt install ./amdgpu-install_7.1.1.70101-1_all.deb
sudo apt update
sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"
sudo apt install amdgpu-dkms
sudo apt install python3-setuptools python3-wheel
sudo usermod -a -G render,video $LOGNAME
sudo apt install rocm

AMD ROCm 官方文档

2. 通过 GTT 解锁 96G 显存

进入 BIOS -> Setup -> Advanced -> NBIO common options -> GFX configuration -> UMA Frame buffer size 修改显存大小。
修改 GRUB 配置：

vim /etc/default/grub
# 设置 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=27648000 ttm.page_pool_size=27648000 amdttm.pages_limit=27648000 amdttm.page_pool_size=27648000 apparmor=0"
update-grub

重启生效。

3. 安装 Vulkan

sudo apt install vulkan-tools

4. 下载并运行 llama.cpp

llama.cpp Release 页面

wget https://github.com/ggml-org/llama.cpp/releases/download/b7503/llama-b7503-bin-ubuntu-vulkan-x64.tar.gz
# 解压并进入目录
tar -xzf llama-b7503-bin-ubuntu-vulkan-x64.tar.gz
cd llama-b7503-bin-ubuntu-vulkan-x64

从 Hugging Face Mirror 获取模型（例如：ggml-org/gpt-oss-120b-GGUF），并将文件下载到 ~/.cache/llama.cpp/ 目录。

启动服务：

./llama-server -hf ggml-org/gpt-oss-120b-GGUF -c 0 --jinja

5. 安装 amdgpu_top

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

sudo dpkg -i amdgpu-top_0.11.0-1_amd64.deb
sudo amdgpu_top

MS-S1 MAX、AI MAX 395 在 Ubuntu 24 利用 Vulkan 版 llama.cpp 运行 gpt-oss 120b

1. 安装 AMD GPU 驱动和 ROCm

2. 通过 GTT 解锁 96G 显存

3. 安装 Vulkan

4. 下载并运行 llama.cpp

5. 安装 amdgpu_top

更多推荐文章

相关免费在线工具

6. 效果验证

更多推荐文章

相关免费在线工具

MS-S1 MAX、AI MAX 395 在 Ubuntu 24 利用 Vulkan 版 llama.cpp 运行 gpt-oss 120b

1. 安装 AMD GPU 驱动和 ROCm

2. 通过 GTT 解锁 96G 显存

3. 安装 Vulkan

4. 下载并运行 llama.cpp

5. 安装 amdgpu_top

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

6. 效果验证

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具