
引言
随着大语言模型(LLM)技术的飞速发展,底层算力支撑硬件的重要性日益凸显。除了传统的 GPU 方案,以华为昇腾(Ascend)为代表的 NPU 正成为业界关注的焦点。为了全面评估昇腾 NPU 在实际 LLM 应用中的性能表现,我们选用开源模型 Llama-2-7b,在 Atlas 800T A2 训练卡平台上进行部署、测试与分析,旨在为开发者和决策者提供一份详实的核心性能数据及可靠的硬件选型参考。
一、测评环境搭建与准备
扎实的前期准备是确保测评数据准确可靠的基石。本章节记录从激活昇腾 NPU 计算环境到完成所有依赖库安装的全过程。
1.1 激活 NPU Notebook 实例
进入项目环境并激活一个 Notebook 实例,这是进行一切操作的起点。

图 1:进入项目环境界面
在配置实例时,明确了本次测评的硬件规格,这对后续性能数据的解读至关重要:
- 计算类型: NPU
- 硬件规格: NPU basic · 1* Atlas 800T A2 · 32v CPU · 64GB
- 存储大小: 50G

图 2 & 3:选择并确认 NPU 硬件规格为昇腾 910B
配置确认无误后,点击'立即启动',系统开始分配资源。数分钟后,一个搭载 Atlas 800T A2 的专属开发环境便准备就绪。

图 4:Notebook 实例启动中
通过点击'终端'进入命令行界面,这是执行后续所有环境检查和代码运行的主要入口。


















