我原来也是'非 NVIDIA 不用'的人,直到发现昇腾 NPU 的达芬奇架构、开源生态和 GitCode 的免费算力,才决定拿 Llama-2-7B 试试水。整个过程踩了不少坑,但最后跑通了,记录一下,给想试国产 NPU 的同学参考。
为什么选昇腾?
其实起初我手里没硬件,纯靠云上免费实例。昇腾的达芬奇架构自主可控,开源仓库(https://gitcode.com/ascend)里 PyTorch、TensorFlow 适配齐全,还有 MindSpeed-LLM 这种专门的大模型框架,生态比想象中好。正好 GitCode 能申请免费的昇腾 Notebook 实例,零成本就能跑起来。

环境准备:白嫖 GitCode 实例
没有 GPU 经费,云上按小时租是最划算的。GitCode 的免费资源正好用来验证方案。创建 Notebook 实例时,有几个配置容易踩坑:

- 计算类型必须选 NPU——我第一次手滑选了 CPU,跑起来卡半天才发现。
- 规格选 'NPU basic'(1*NPU 800T A2, 32vCPU, 64GB 内存),足够跑 7B 模型。
- 镜像:选 'euler2.9-py38-torch2.1.0-cann8.0-openmind0.6-notebook',预装了 PyTorch 2.1.0、CANN 8.0,省去自己装环境的麻烦。
- 存储用免费的 50G,模型文件 13GB 左右,够用。

等一分钟实例启动,进入 Jupyter Notebook。环境自带 Python 3.8、torch_npu 2.1.0,基本不用额外折腾。










