LLaMA3 微调教程：LLaMA Factory 安装部署、模型微调与 GGUF 转换 | 极客日志

PythonAI算法

LLaMA3 微调教程：LLaMA Factory 安装部署、模型微调与 GGUF 转换

基于 LLaMA Factory 进行 LLaMA3 模型微调的完整流程。内容包括开发环境搭建（Conda、PyTorch）、模型下载、LLaMA Factory 安装与启动、自定义数据集制作与注册、微调训练参数配置及导出。此外，还涵盖了模型合并、GGUF 格式转换及量化操作（如 q4_0），最后通过 Ollama 验证微调效果。文中解决了 bitsandbytes GPU 支持、ModelProto 解析等常见问题。

雪落无声发布于 2026/4/6更新于 2026/7/1950 浏览

LLaMA3 微调教程：LLaMA Factory 安装部署、模型微调与 GGUF 转换

一安装开发环境

1 创建环境

首先请确保已经安装好 Conda 工具。在命令行中键入如下指令创建 Python 环境：

conda create -n llama_factory python=3.10 -y

创建成功后切换到新环境：

conda activate llama_factory

安装 CUDA、PyTorch 等核心工具：

conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install llmtuner

2 下载可微调的模型

创建用于存放模型的文件夹，取名为 models。
将 LLaMA3 8B 的模型文件下载到此处。下载时间稍长，请耐心等待。

git clone https://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B-Instruct.git

3 安装 LLaMA Factory

回到上层目录，将 LLaMA Factory 源代码拉取至此处。

git clone https://github.com/hiyouga/LLaMA-Factory.git

完成后进入项目目录：cd LLaMA-Factory
安装环境依赖：

pip install -e .[metrics,modelscope,qwen]
pip install -r requirements.txt --index-url https://mirrors.huaweicloud.com/repository/pypi/simple

4 运行 LLaMA Factory

回到上层目录，修改下面的代码，将刚才下载的模型目录替换进来，然后把这一堆代码复制后，在命令行中敲入。

python src/web_demo.py \
--model_name_or_path E:\my\ai\llama3\models\Meta-Llama-3-8B-Instruct \
--template llama3 \
--infer_backend vllm \
--vllm_enforce_eager

如果看到界面就说明成功了。复制里面的端口号组成地址：localhost:7860，复制到浏览器打开。

![图片]

成功打开训练页面。

如果运行失败，提示 The installed version of bitsandbytes was compiled without GPU support.，那说明你的环境出现了问题。请检查 bitsandbytes 是否编译支持 GPU。

二数据微调

1 制作训练数据

进入 llama-factory/data 目录，新建一个 json 文件起名为 my_data_zh.json。

按下面的格式填入你的训练数据后保存即可，条数不限。

数据集参数说明：

instruction：该数据的说明，比如'你是谁'这种问题就属于'自我介绍'，'你吃屎么'这种问题属于'业务咨询'。
input：向他提的问题。
output：他应该回答的内容。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

"a_my_data":{"file_name":"my_data_zh.json"},

git clone https://github.com/ollama/ollama.git

git clone https://github.com/ggerganov/llama.cpp.git
# 如果上面那个下不了就用这个：
# git clone https://github.com/Rayrtfr/llama.cpp

# 注释：python convert.py --outfile 要导出的文件地址.gguf 微调后的模型来源目录
python convert.py --outfile E:\my\ai\llama3\models\my-llama-3-8b-0517\my8b.gguf E:\my\ai\llama3\models\my-llama-3-8b-0517

python convert.py --outfile E:\my\ai\llama3\models\my-llama-3-8b-0517\my8b.gguf E:\my\ai\llama3\models\my-llama-3-8b-0517 --vocab-type hfft

cd llama.cpp
mkdir build
cd build

cmake ..
cmake --build . --config Release

# 注释：quantize 源文件路径 导出文件路径 量化参数
quantize E:\my\ai\llama3\models\my8b.gguf E:\my\ai\llama3\models\my8b_q4.gguf q4_0

ollama run 注册的模型名

LLaMA3 微调教程：LLaMA Factory 安装部署、模型微调与 GGUF 转换

一安装开发环境

1 创建环境

2 下载可微调的模型

3 安装 LLaMA Factory

4 运行 LLaMA Factory

二数据微调

1 制作训练数据

更多推荐文章

相关免费在线工具

2 注册数据集

3 开始微调训练

4 合并模型

5 模型量化

6 测试训练结果

更多推荐文章

相关免费在线工具

LLaMA3 微调教程：LLaMA Factory 安装部署、模型微调与 GGUF 转换

一 安装开发环境

1 创建环境

2 下载可微调的模型

3 安装 LLaMA Factory

4 运行 LLaMA Factory

二 数据微调

1 制作训练数据

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2 注册数据集

3 开始微调训练

4 合并模型

5 模型量化

6 测试训练结果

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

一安装开发环境

二数据微调