华为昇腾 910B(Ascend 910B)上 LLaMA-Factory 对 Qwen3.5-32B 模型进行 LoRA 微调
**华为昇腾 910B(Ascend 910B)**上使用 LLaMA-Factory 对 Qwen3.5-32B 模型进行 LoRA 微调,包含环境配置、依赖安装、数据准备、训练启动、验证与推理等完整步骤。本教程基于 Ubuntu 20.04 + CANN 8.0 + MindSpore/PyTorch NPU + LLaMA-Factory v0.9.3+ 环境,适用于 8 卡昇腾 910B 服务器。
✅ 前提条件
| 项目 | 要求 |
|---|---|
| 硬件 | 华为 Atlas 800/900 服务器,8×Ascend 910B(64GB HBM) |
| OS | Ubuntu 20.04 LTS |
| 驱动 | CANN 8.0.RC1 或更高(已预装) |
| Python | 3.10.x(推荐 3.10.16) |
| 存储 | ≥ 2TB SSD(模型 + 数据集 + 缓存) |
第一步:创建并激活虚拟环境
# 安装 Miniconda(若未安装)
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda3
source ~/.bashrc
# 创建虚拟环境
conda create -n llama-factory python=3.10.16 -y
conda activate llama-factory
第二步:安装 PyTorch NPU + CANN 兼容库
⚠️ 不要用 pip install torch!必须用华为官方 PyTorch NPU 包
# 添加清华镜像加速(可选)
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
# 安装昇腾专用 PyTorch(CANN 8.0 对应 torch-npu 2.4.0)
pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 \
--extra-index-url https://pypi.tuna.tsinghua.edu.cn/simple
# 安装 torch_npu(关键!)
pip install torch_npu==2.4.0.post1 -f https://pypi.tuna.tsinghua.edu.cn/simple
# 验证 NPU 可见性
python -c "import torch; print(torch.npu.is_available()); print(torch.npu.device_count())"
# 应输出:True 和 8(或你的卡数)
第三步:安装 LLaMA-Factory(昇腾适配版)
# 克隆 LLaMA-Factory(国内推荐 Gitee 镜像)
git https://gitee.com/hiyouga/LLaMA-Factory.git
LLaMA-Factory
pip install -e
pip install --upgrade pillow
llamafactory-cli


