华为昇腾 910B 上基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战

华为昇腾 910B 环境下基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战流程。涵盖环境搭建、PyTorch NPU 适配、数据准备、多卡训练及推理验证。重点解决 CANN 兼容性与显存优化，提供关键配置参数与脚本示例，助力国产算力下的模型定制开发。

XiaoPingzi发布于 2026/4/10更新于 2026/7/2537 浏览

华为昇腾 910B 上基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战

在国产算力环境下，利用华为昇腾 910B 配合 LLaMA-Factory 框架对 Qwen3.5-32B 大模型进行 LoRA 微调，已成为许多团队降低训练成本、适配业务场景的主流方案。本文基于 Ubuntu 20.04 + CANN 8.0 + PyTorch NPU 环境，梳理从环境配置、数据准备到多卡分布式训练及推理验证的全流程。

环境准备与依赖安装

硬件要求：建议 Atlas 800/900 服务器，配备 8×Ascend 910B（64GB HBM）。 系统要求：Ubuntu 20.04 LTS，CANN 8.0.RC1 或更高版本驱动已预装。 Python 版本：推荐 3.10.x（如 3.10.16）。

创建虚拟环境

使用 Conda 隔离依赖，避免污染系统环境。

# 若未安装 Miniconda，先执行以下命令
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda3
source ~/.bashrc

# 创建并激活环境
conda create -n llama-factory python=3.10.16 -y
conda activate llama-factory

安装 PyTorch NPU 与 CANN 库

⚠️ 注意：切勿直接使用 pip install torch，必须安装华为官方适配的 PyTorch NPU 包。

# 设置清华镜像加速（可选）
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

# 安装昇腾专用 PyTorch（对应 CANN 8.0 版本）
pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 \
    --extra-index-url https://pypi.tuna.tsinghua.edu.cn/simple

# 安装 torch_npu（关键依赖）
pip install torch_npu==2.4.0.post1 -f https://pypi.tuna.tsinghua.edu.cn/simple

# 验证 NPU 可见性
python -c "import torch; print(torch.npu.is_available()); print(torch.npu.device_count())"
# 预期输出：True 和 8（根据实际卡数）

安装 LLaMA-Factory

克隆代码仓库并安装昇腾适配版依赖。

git clone https://gitee.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

# 安装依赖，指定 torch-npu 分支
pip install -e ".[torch-npu,metrics]"

# 升级 Pillow 以避免兼容问题
pip install --upgrade pillow

# 验证安装状态
llamafactory-cli env

华为昇腾 910B 上基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战

环境准备与依赖安装

创建虚拟环境

使用 Conda 隔离依赖，避免污染系统环境。

# 若未安装 Miniconda，先执行以下命令
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda3
source ~/.bashrc

# 创建并激活环境
conda create -n llama-factory python=3.10.16 -y
conda activate llama-factory

安装 PyTorch NPU 与 CANN 库

⚠️ 注意：切勿直接使用 pip install torch，必须安装华为官方适配的 PyTorch NPU 包。

# 设置清华镜像加速（可选）
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

# 安装昇腾专用 PyTorch（对应 CANN 8.0 版本）
pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 \
    --extra-index-url https://pypi.tuna.tsinghua.edu.cn/simple

# 安装 torch_npu（关键依赖）
pip install torch_npu==2.4.0.post1 -f https://pypi.tuna.tsinghua.edu.cn/simple

# 验证 NPU 可见性
python -c "import torch; print(torch.npu.is_available()); print(torch.npu.device_count())"
# 预期输出：True 和 8（根据实际卡数）

安装 LLaMA-Factory

克隆代码仓库并安装昇腾适配版依赖。

git clone https://gitee.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

# 安装依赖，指定 torch-npu 分支
pip install -e ".[torch-npu,metrics]"

# 升级 Pillow 以避免兼容问题
pip install --upgrade pillow

# 验证安装状态
llamafactory-cli env

问题	解决方案
`torch not compiled with npu support`	重新安装 `torch_npu==2.4.0.post1`
显存不足 OOM	减小 `per_device_train_batch_size=1`，增大 `gradient_accumulation_steps`
tokenizer 报错	确保 `template: qwen`（Qwen 必须指定）
多卡通信失败	检查 `ASCEND_RT_VISIBLE_DEVICES` 是否包含所有卡号
模型下载慢	使用 `modelscope` + 国内网络

华为昇腾 910B 上基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战

华为昇腾 910B 上基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战

环境准备与依赖安装

创建虚拟环境

安装 PyTorch NPU 与 CANN 库

安装 LLaMA-Factory

华为昇腾 910B 上基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战

华为昇腾 910B 上基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战

环境准备与依赖安装

创建虚拟环境

安装 PyTorch NPU 与 CANN 库

安装 LLaMA-Factory

更多推荐文章

模型下载与数据准备

下载 Qwen3.5-32B 模型

准备微调数据集

配置训练参数

启动多卡微调训练

验证效果与模型导出

Chat 测试

合并模型（可选）

常见问题排查

更多推荐文章

相关免费在线工具

华为昇腾 910B 上基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战

华为昇腾 910B 上基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战

环境准备与依赖安装

创建虚拟环境

安装 PyTorch NPU 与 CANN 库

安装 LLaMA-Factory

华为昇腾 910B 上基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战

华为昇腾 910B 上基于 LLaMA-Factory 微调 Qwen3.5-32B 的 LoRA 实战

环境准备与依赖安装

创建虚拟环境

安装 PyTorch NPU 与 CANN 库

安装 LLaMA-Factory

微信扫一扫，关注极客日志

更多推荐文章

模型下载与数据准备

下载 Qwen3.5-32B 模型

准备微调数据集

配置训练参数

启动多卡微调训练

验证效果与模型导出

Chat 测试

合并模型（可选）

常见问题排查

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具