跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
C++AI算法

昇腾设备部署 llama.cpp

综述由AI生成在昇腾 Atlas 800I A2 设备上部署 llama.cpp 的软硬件环境配置。硬件包含 KunPeng920 CPU 和 Atlas 910B4-1 NPU,软件基于 OpenEuler 22.03 LTS。通过 Docker 容器运行特定镜像以隔离物理环境,提供了拉取镜像及启动容器的命令示例,支持 Atlas 300I Duo 等型号。

灰度发布发布于 2026/4/5更新于 2026/5/2632 浏览

硬件环境

Atlas 800I A2

CPU:KunPeng920 * 192

NPU:Atlas 910B4-1 * 8

内存:1000G

软件环境

操作系统:OpenEuler22.03 LTS

内核:5.10.0-186.0.0.2.1.oe2203sp3.galaxy.aarch64

驱动:24.1.rc2

docker:26.1.3

为了不影响物理环境,安装是在 docker 容器环境中进行。

由于目前 llama.cpp 只支持 openeuler22.03 和 ubuntu 22.04,可以下载一个对应操作系统的镜像。

此处以 vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64 镜像为例。

拉取镜像:

docker pull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/openeuler/vllm-ascend:0.9.1rc1-torch_npu2.5.1-cann8.1.rc1-python3.10-oe2203lts-linuxarm64

支持 Atlas 300I Duo Atlas 300T A2(Ascend 910B4)

起容器:

docker run -it -d --net=host --shm-size=500g \
  --privileged \
  --name vllm-ascend \
  --device=/dev/davinci_manager \
  --device=/dev/hisi_hdc \
  --device=/dev/devmm_svm \
  -v /usr/local/Ascend/driver:/usr/local/

目录

  1. 硬件环境
  2. 软件环境
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Apache Arrow FFI 接口详解:C 与 Rust 数据零拷贝交互
  • AI 民用化需要一场耐心的进化
  • Telegram 中文搜索机器人@letstgbot 技术解析与开发实践
  • MySQL 运维实战:常见问题排查与解决方案
  • Python 开发者如何利用心理洞察突破 AI 需求预测局限
  • 大模型在教育领域的典型应用场景与技术展望
  • WebLogic 中间件高危漏洞应急响应案例分析
  • HTML 语言基础与常用标签详解
  • 基于 Python 的币安期货交易机器人实战
  • GitHub 日榜:AI 工具链与工程化实践热点
  • 前端代码可读性优化:提升可维护性与团队协作
  • 前端安全实战:密码加密、XSS 与 CSRF 防护指南
  • 飞书机器人发送图片消息配置及常见报错解决方案
  • ChatGPT Prompt Hacker 技巧:优化简历通过 AI 筛选
  • Flutter Web 开发:构建跨平台 Web 应用
  • AI 视频生成技术迈入实用阶段:解析央视短片背后的技术路径
  • Stable Diffusion 本地部署与常见问题解决方案
  • Android 技术体系化进阶指南:从基础到架构的全方位解析
  • Django 入门:如何使用 Django 开发 Web 项目
  • DeepSeek 深度使用指南:提示词技巧与本地知识库搭建

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online