LLaMaFactory 基于魔搭社区免费 GPU 微调大模型实战 | 极客日志

PythonAI算法

LLaMaFactory 基于魔搭社区免费 GPU 微调大模型实战

综述由AI生成利用魔搭社区免费 GPU 环境部署 LLaMA-Factory 进行大模型微调的完整流程。内容包括环境配置、虚拟环境搭建、模型选择与加载、数据集获取与格式转换、模型训练监控及结果导出，以及将模型转换为 GGUF 格式的后续步骤。该方案解决了本地硬件限制问题，实现了从数据处理到模型推理的全流程实践。

邪神洛基发布于 2026/4/6更新于 2026/5/2138 浏览

环境

在本地部署 LLaMA-Factory 微调平台需要较高硬件配置，可通过魔搭社区免费 GPU 环境进行替代。

首先注册魔搭社区，绑定个人阿里云账号即可，详情见：https://www.modelscope.cn/my/mynotebook；然后可免费获得 36 小时 GPU 环境。

环境配置：

CPU：8 核，负责数据的调度和预处理
内存：32GB，数据从硬盘加载后暂存于此
显存：24GB
操作系统：Ubuntu 22.04
CUDA：12.8.1，支持最新 RTX 40 系列或 H 系列显卡
Python：3.11
PyTorch：2.9.1
ModelScope：1.35.0

环境截图

安装 LLaMaFactory

克隆 llama-factory 项目，执行以下命令：

pip install -e .

若出现依赖冲突提示，为避免权限混乱，推荐使用虚拟环境（venv）。

创建虚拟环境

python -m venv llmVenv
source llmVenv/bin/activate
pip install --upgrade pip
pip install -e .
pip install -r requirements/metrics.txt

启动 WebUI：

llamafactory-cli webui

在控制台点击 http://127.0.0.1:7860 完成浏览器访问。

模型选择

模型分类和区别

此处选中模型 Qwen3-4B-Base，系统弹出告警提示。这是因为【Base】表示基座模型，而非经过指令微调【Instruct】的模型。

Base：基座模型，只完成了预训练，擅长续写文本，不擅长直接理解并回答人类的问题或指令。
Instruct：指令模型，在基座模型基础上使用大量【用户指令和期望回答】的数据进行微调，能够正确理解并遵循人类指令。

模型告警

后续选择 Qwen3.5-2B-Base，名称虽带【Base】但未弹出告警。Qwen3.5 是后训练模型，已经历至少一轮指令微调或强化学习（RL），具备对话能力。

模型选择

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

modelscope download --model Qwen/Qwen3.5-2B

python -m venv cppVenv
source cppVenv/bin/activate

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
pip install -r requirements.txt

python convert_hf_to_gguf.py /mnt/workspace/models/Qwen3.5-2B-output --outfile /mnt/workspace/gguf/Qwen3.5-2B-output.gguf --outtype q8_0

ValueError: Tokenizer class TokenizersBackend does not exist or is not currently imported.

cat /mnt/workspace/models/Qwen3.5-2B-output/tokenizer_config.json | grep tokenizer_class

sed -i 's/"tokenizer_class": "TokenizersBackend"/"tokenizer_class": "Qwen2Tokenizer"/g' /mnt/workspace/models/Qwen3.5-2B-output/tokenizer_config.json

LLaMaFactory 基于魔搭社区免费 GPU 微调大模型实战

环境

安装 LLaMaFactory

创建虚拟环境

模型选择

模型分类和区别

更多推荐文章

相关免费在线工具

加载模型对话

推理引擎

推理数据类型

额外参数

数据集

获取源数据

编写转换脚本

生成数据集

训练

加载并预览数据集

执行微调

导出微调结果

转换 GGUF

创建环境

执行转换

总结

更多推荐文章

相关免费在线工具

LLaMaFactory 基于魔搭社区免费 GPU 微调大模型实战

环境

安装 LLaMaFactory

创建虚拟环境

模型选择

模型分类和区别

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

加载模型对话

推理引擎

推理数据类型

额外参数

数据集

获取源数据

编写转换脚本

生成数据集

训练

加载并预览数据集

执行微调

导出微调结果

转换 GGUF

创建环境

执行转换

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具