昇腾设备部署 llama.cpp

综述由AI生成在昇腾 Atlas 800I A2 设备上部署 llama.cpp 的环境配置。硬件包含 KunPeng920 CPU 及 Atlas 910B4 NPU。软件基于 OpenEuler 22.03 LTS，使用 Docker 容器化方案以避免影响物理环境。提供了具体的镜像拉取命令及容器启动参数，涉及 davinci_manager 等设备挂载，适用于 Atlas 300I Duo 及 Ascend 910B4 系列设备。

涅槃凤凰发布于 2026/4/6更新于 2026/5/2133 浏览

硬件环境

Atlas 800I A2

CPU：KunPeng920 × 192

NPU：Atlas 910B4-1 × 8

内存：1000G

软件环境

操作系统：OpenEuler 22.03 LTS

内核：5.10.0-186.0.0.2.1.oe2203sp3.galaxy.aarch64

驱动：24.1.rc2

Docker：26.1.3

为避免影响物理环境，建议在 Docker 容器中进行安装。目前 llama.cpp 支持 OpenEuler 22.03 和 Ubuntu 22.04，可下载对应操作系统的镜像。

示例镜像：vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64（支持 Atlas 300I Duo, Atlas 300T A2/Ascend 910B4）

拉取镜像

docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/openeuler/vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64

启动容器

docker run -it -d --net=host --shm-size=500g \
  --privileged \
  --name vllm-ascend \
  --device=/dev/davinci_manager \
  --device=/dev/hisi_hdc \
  --device=/dev/devmm_svm \
  -v /usr/local/Ascend/driver:/usr/local/

昇腾设备部署 llama.cpp

硬件环境

软件环境

拉取镜像

启动容器

更多推荐文章

相关免费在线工具

更多推荐文章

相关免费在线工具

昇腾设备部署 llama.cpp

硬件环境

软件环境

拉取镜像

启动容器

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具