跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

LLaMaFactory 基于免费 GPU 环境微调大模型教程

综述由AI生成介绍在魔搭社区免费 GPU 环境下使用 LLaMaFactory 微调大模型的方法。内容包括环境配置、虚拟环境搭建、模型选择、数据集准备、执行微调训练及结果导出。最后演示如何将 Hugging Face 格式转换为 GGUF 以便在 ollama 或 llama.cpp 中使用。解决了依赖冲突、Tokenizer 加载异常等常见问题。

星落发布于 2026/4/5更新于 2026/5/2035 浏览
LLaMaFactory 基于免费 GPU 环境微调大模型教程

一、环境

本文介绍在魔搭社区免费 GPU 环境下使用 LLaMaFactory 微调大模型的方法。

注册魔搭社区并绑定阿里云账号,可获得 36 小时免费 GPU 环境。

环境配置包括:

  • CPU:8 核心,负责数据调度和预处理
  • 内存:32GB
  • 显存:24G
  • 操作系统:Ubuntu 22.04
  • CUDA:12.x(支持最新显卡)
  • Python:3.11
  • PyTorch:2.x
  • ModelScope:1.35.0

安装 LLaMaFactory

克隆 llama-factory 项目,执行 pip install -e .。若出现依赖冲突提示,推荐使用虚拟环境(venv)解决。

python -m venv llmVenv
source llmVenv/bin/activate
pip install --upgrade pip
pip install -e .
pip install -r requirements/metrics.txt
llamafactory-cli webui

启动后访问 http://127.0.0.1:7860 完成浏览器访问。

二、模型选择

2.1. 模型分类和区别

Base 模型仅完成预训练,擅长续写文本,不擅长直接理解指令;Instruct 模型经过指令微调,能够正确理解并遵循人类指令。Qwen3.5 系列通常具备对话能力。

2.2. 加载模型对话

2.2.1. 推理引擎
  • Hugging Face:transformers 库,通用原生框架,适合调试开发。
  • vLLM:高性能服务框架,专为高吞吐低延迟设计,适合生产环境。
  • SGLang:专注于结构化生成和复杂推理任务。
2.2.2. 推理数据类型
  • auto:自动选择最优精度。
  • float32:最精确,显存占用最大。
  • float16:显存减半,速度更快。
  • bfloat16:动态范围更大,稳定性好。
2.2.3. 额外参数

注意调整推理引擎相关参数,避免 JSON 格式错误。例如 vLLM 专用参数需根据实际引擎配置。

加载模型后等待控制台输出,支持手动下载魔搭社区模型。

三、数据集

魔搭社区提供大量数据集供下载使用。

3.1. 获取源数据

下载 CSV 格式数据,例如语义相似度数据集。字段包含 sentence1、sentence2 和 label。

3.2. 编写转换脚本

将 CSV 转换为 LLaMaFactory 所需的 JSON 格式。

3.3. 生成数据集

执行脚本生成目标文件,移动至 LLaMA-Factory 项目的 data 文件夹中。修改 dataset_info.json 配置文件以注册新数据集。

四、训练

4.1. 加载并预览数据集

选中配置的数据集,点击预览查看示例。

4.2. 执行微调

点击开始微调,监控控制台日志。注意 GPU 环境超过 1 小时无操作可能触发自动关闭。

若训练时间较长,建议减少数据量以缩短演示周期。损失值 Loss 曲线用于监控模型学习情况,包含原始曲线和平滑曲线。

4.3. 导出微调结果

训练完毕后,在检查点路径找到微调后的模型文件。尝试加载微调后的模型进行对话测试。

五、转换 GGUF

为了在 ollama 或 llama.cpp 中使用,需将 Hugging Face 格式转换为 GGUF 格式。

5.1. 创建环境

创建独立 Python 环境并克隆 llama.cpp 仓库。

python -m venv cppVenv
source cppVenv/bin/activate
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
pip install -r requirements.txt

5.2. 执行转换

运行转换命令指定输入输出路径及量化类型。

python convert_hf_to_gguf.py /path/to/model --outfile /path/to/output.gguf --outtype q8_0

若遇到 Tokenizer 加载异常,检查 tokenizer_config.json 中的 tokenizer_class 配置,必要时替换为正确的类名(如 Qwen2Tokenizer)。

六、总结

本文完成了从环境搭建到模型微调及格式转换的完整流程。

目录

  1. 一、环境
  2. 安装 LLaMaFactory
  3. 二、模型选择
  4. 2.1. 模型分类和区别
  5. 2.2. 加载模型对话
  6. 2.2.1. 推理引擎
  7. 2.2.2. 推理数据类型
  8. 2.2.3. 额外参数
  9. 三、数据集
  10. 3.1. 获取源数据
  11. 3.2. 编写转换脚本
  12. 3.3. 生成数据集
  13. 四、训练
  14. 4.1. 加载并预览数据集
  15. 4.2. 执行微调
  16. 4.3. 导出微调结果
  17. 五、转换 GGUF
  18. 5.1. 创建环境
  19. 5.2. 执行转换
  20. 六、总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Spring Cloud Gateway 内置 Filter 实战:AddRequestHeader 与 RewritePath
  • 滑动窗口算法实战:串联所有单词与最小覆盖子串
  • Milvus 安装指南:Docker、Docker Compose 与 Kubernetes 部署方式
  • 数据结构在不同领域的应用场景解析
  • 使用 rclone 将远程 WebDAV 存储映射为本地磁盘
  • Claude Code 本地环境配置与使用指南
  • QGroundControl 跨平台安装指南:Windows/macOS/Linux/Android
  • Ollama 模型下载慢?国内镜像 + LLama-Factory 微调方案
  • IntelliJ IDEA GitLab 登录失败:检查 API Token 或版本兼容性
  • Git 局域网协作教程
  • JavaScript 实现 HTTPS SSE 连接
  • C++ 哈希表核心机制:冲突处理与负载因子
  • Python 兼职接单指南:需求评估与平台选择
  • 基于 LlamaFactory 微调 Qwen3.5-4B 模型实战指南
  • Python 基础语法完全指南:变量、数据类型与运算符
  • llama.cpp Docker 部署:容器化推理服务搭建
  • C++ STL list 容器详解:使用与模拟实现
  • LeetCode 22:括号生成问题的 Python 回溯解法
  • AIGC 浪潮下的 Model Context Protocol (MCP) 详解
  • Llama 3 大模型:快速体验推理及微调指南

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online