LLaMaFactory 基于魔搭社区免费 GPU 微调大模型实战 | 极客日志

PythonAI算法

LLaMaFactory 基于魔搭社区免费 GPU 微调大模型实战

综述由AI生成利用魔搭社区提供的免费 GPU 环境部署 LLaMaFactory 进行大模型微调的完整流程。内容包括环境配置、虚拟环境创建、模型选择与加载、数据集准备与转换、模型微调训练以及结果导出与 GGUF 格式转换。通过实际操作演示了如何在不消耗本地硬件资源的情况下完成从基座模型到指令微调模型的构建过程，并解决了训练过程中可能遇到的依赖冲突及 Tokenizer 配置问题。

GopherDev发布于 2026/4/6更新于 2026/5/2426 浏览

一、环境

如果你还在为本地设备问题而烦恼，可以利用魔搭社区提供的免费 GPU 环境。

首先注册魔搭社区，绑定个人阿里云账号即可，详情见：https://www.modelscope.cn/my/mynotebook；然后可获取 36 小时 GPU 环境。

配置如下：

CPU：8 核，负责数据调度和预处理
内存：32GB，临时存放加载的数据
显存：24G
操作系统：Ubuntu 22.04
CUDA：12.8.1，支持最新显卡
Python：3.11
PyTorch：2.9.1
ModelScope：1.35.0

文章配图

安装 LLaMaFactory

克隆 llama-factory 项目，执行 pip install -e .。若出现依赖冲突提示，建议使用虚拟环境（venv）以避免权限混乱。

创建虚拟环境

python -m venv llmVenv
source llmVenv/bin/activate

退出虚拟环境：deactivate

在虚拟环境中执行升级：pip install --upgrade pip

后续执行 pip install -e . 和 pip install -r requirements/metrics.txt，运行 llamafactory-cli webui 启动服务，并在浏览器访问 http://127.0.0.1:7860。

二、模型选择

2.1. 模型分类和区别

此处选择一个模型 Qwen3-4B-Base，系统会弹出告警提示。这是因为【Base】表示基座模型，而非经过指令微调的【Instruct】模型。

两者区别在于：

Base：基座模型，只完成预训练，擅长续写文本，不擅长直接理解并回答人类指令。
Instruct：指令模型，在基座基础上使用大量用户指令数据进行微调，能够正确理解并遵循人类指令。

文章配图

后续选择 Qwen3.5-2B-Base，此时虽带【Base】但无告警。Qwen3.5 是后训练模型，已经历指令微调或强化学习（RL），具备对话能力。

文章配图

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

python -m venv cppVenv
source cppVenv/bin/activate

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
pip install -r requirements.txt

python convert_hf_to_gguf.py /mnt/workspace/models/Qwen3.5-2B-output --outfile /mnt/workspace/gguf/Qwen3.5-2B-output.gguf --outtype q8_0

ValueError: Tokenizer class TokenizersBackend does not exist or is not currently imported.

cat /mnt/workspace/models/Qwen3.5-2B-output/tokenizer_config.json | grep tokenizer_class

sed -i 's/"tokenizer_class": "TokenizersBackend"/"tokenizer_class": "Qwen2Tokenizer"/g' /mnt/workspace/models/Qwen3.5-2B-output/tokenizer_config.json

LLaMaFactory 基于魔搭社区免费 GPU 微调大模型实战

一、环境

安装 LLaMaFactory

创建虚拟环境

二、模型选择

2.1. 模型分类和区别

更多推荐文章

相关免费在线工具

2.2. 加载模型对话

2.2.1. 【推理引擎】

2.2.2. 【推理数据类型】

2.2.3. 【额外参数】

三、数据集

3.1. 获取源数据

3.2. 编写转换脚本

3.3. 生成数据集

四、训练

4.1. 加载并预览数据集

4.2. 执行微调

4.3. 导出微调结果

五、转换 GGUF

5.1. 创建环境

5.2. 执行转换

更多推荐文章

相关免费在线工具

LLaMaFactory 基于魔搭社区免费 GPU 微调大模型实战

一、环境

安装 LLaMaFactory

创建虚拟环境

二、模型选择

2.1. 模型分类和区别

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2. 加载模型对话

2.2.1. 【推理引擎】

2.2.2. 【推理数据类型】

2.2.3. 【额外参数】

三、数据集

3.1. 获取源数据

3.2. 编写转换脚本

3.3. 生成数据集

四、训练

4.1. 加载并预览数据集

4.2. 执行微调

4.3. 导出微调结果

五、转换 GGUF

5.1. 创建环境

5.2. 执行转换

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具