1. 环境配置
- 使用 Anaconda(Python 的环境管理工具),这样就不需要一个一个单独下载 python 的版本,并且使用起来很方便。
- 使用 PyCharm(Python 的集成开发环境),可以在这里面编辑、运行.py 文件等操作。
- 使用 Git(分布式版本控制系统),用于克隆 GitHub 上的优秀项目,不用也没事,可以直接下载.zip 文件。
- 使用 CUDA 和 cuDNN(用于 GPU 训练加速),需要注意这里面的版本关系,别下错了。
- 使用 PyTorch(深度学习框架),这个版本要与你自己电脑的 CUDA 版本对应。
以上就是环境配置需要的全部内容,接下来我们就进行项目复刻。
2. 初始化环境
打开 Anaconda Prompt(从 Windows 开始菜单找到),执行以下命令。
创建新的虚拟环境
conda create -n llama python=3.10
激活虚拟环境
conda activate llama
安装 PyTorch(我的 CUDA 是 12.4,选择支持你们自己电脑的 CUDA 的版本)
conda install pytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=12.4 -c pytorch -c nvidia
克隆 GitHub 项目
git clone https://github.com/hiyouga/LLaMA-Factory.git
或者直接下载压缩包,在 PyCharm 中打开项目。
在使用安装指令时出现问题,可以添加镜像源:
pip install -e ".[torch,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple/
验证安装(出现版本号就成功了)
llamafactory-cli version
3. 下载模型
在终端输入如下指令,修改大模型存放位置(选择一个合适足够大的存储位置)
echo :HF_HOME=


