Pi0 机器人 VLA 大模型在昇腾 A2 平台测评
随着人形机器人产业的快速发展,算力在提升运动控制精度与实时响应能力方面的作用日益凸显。为实现降本增效,国产化算力替代需求不断攀升。本文基于适配后的 Pi0 视觉 - 语言 - 动作(VLA)模型,在昇腾 Atlas 800I A2 服务器上完成部署与测试。
实测结果表明:该模型在推理性能、精度及功能完整性等方面,不仅实现了与英伟达同级别硬件相当的表现,更在部分场景下展现出更优的运行效率。这充分说明经过深度适配的国产大模型与算力平台,已具备支撑高端人形机器人智能化发展的核心技术能力。
一、测试环境
1.1 硬件配置
- 处理器:昇腾 Atlas 800I A2 NPU
- 操作系统:Linux (CentOS 7/8 或 Ubuntu 18.04/20.04)
1.2 软件栈
| 组件 | 版本 | 备注 |
|---|---|---|
| Python | 3.10 | Conda 虚拟环境 |
| PyTorch | 2.1.0 | 适配 NPU |
| torch_npu | 2.1.0.post12 | NPU 加速库 |
| CANN | 8.3.RC1 | 计算架构 |
| lerobot | 最新版 | Pi0 模型实现 |
二、环境准备与验证
准备工作就绪后,我们开始搭建运行环境。这里建议直接使用 Conda 管理依赖,避免系统库冲突。
2.1 创建并激活环境
conda create -y -n lerobot python=3.10
conda activate lerobot
2.2 安装核心依赖
进入项目目录后,安装 lerobot 及相关算子。
cd lerobot
pip install -e .
pip install ml-dtypes
2.3 配置昇腾环境
加载 CANN 环境变量是 NPU 调用的关键步骤。请根据实际安装路径调整 setenv.bash 的位置。
source /usr/local/Ascend/ascend-toolkit/set_env.sh
pip install torch-npu==2.1.0.post12
2.4 环境验证
运行以下脚本确认 NPU 是否被正确识别。
import torch
import torch_npu
print(f"PyTorch 版本:{torch.__version__}")
print(f"torch_npu 版本:{torch_npu.__version__}")
print()


