基于魔搭社区免费 GPU 使用 LLaMaFactory 微调大模型 | 极客日志

PythonAI算法

基于魔搭社区免费 GPU 使用 LLaMaFactory 微调大模型

利用魔搭社区免费 GPU 资源，结合 LLaMaFactory 进行大模型微调的完整流程。涵盖环境配置、模型选择、数据集处理、训练执行及 GGUF 格式转换。通过虚拟环境隔离依赖，解决 pip 冲突问题；区分 Base 与 Instruct 模型差异；提供 CSV 转 JSON 脚本示例。最终实现从云端环境搭建到模型量化导出的全链路操作，无需本地高性能硬件支持。

二进制发布于 2026/4/9更新于 2026/7/539 浏览

一、环境

之前介绍过本地部署 LLaMaFactory 微调平台的方法，如果你还在为设备问题而烦恼，可以尝试使用云端免费 GPU 资源。

首先注册魔搭社区，绑定个人阿里云账号即可，详情见：https://www.modelscope.cn/my/mynotebook；然后就可免费获得 36 小时 GPU 环境。

配置参数如下：

CPU：8 核，主要负责数据的调度和预处理
内存：32GB，数据从硬盘加载后会暂时存放这里
显存：24G
操作系统：Ubuntu 22.04
CUDA：12.8.1，英伟达的并行计算平台，支持最新的 RTX 40 系列或 H 系列显卡
Python：3.11
PyTorch：2.9.1，目前最主流的深度学习框架
ModelScope：1.35.0（预装版本）

文章配图

安装 LLaMaFactory

执行 git 克隆 llama-factory 项目，运行 pip install -e .。若出现依赖冲突提示，为避免 pip 导致权限混乱，推荐使用虚拟环境（venv）。

创建虚拟环境

python -m venv llmVenv
source llmVenv/bin/activate
deprecate

在虚拟环境中执行升级：pip install --upgrade pip

后续执行 pip install -e . 和 pip install -r requirements/metrics.txt。运行 llamafactory-cli webui 可以启动，并在控制台点击 http://127.0.0.1:7860/ 完成浏览器访问。

二、模型选择

2.1. 模型分类和区别

此处选中一个模型 Qwen3-4B-Base，跳出告警提示。这是因为 Base 表示基座模型，而不是经过指令微调 Instruct 的模型。

两者区别在于：

Base：基座模型，只完成了预训练，擅长续写文本，不擅长直接理解并回答人类的问题或指令。
Instruct：指令模型，在基座模型的基础上，使用大量用户指令和期望回答的数据进行微调，能够正确理解并遵循人类指令。

文章配图

后续选择 Qwen3.5-2B-Base，此时模型名称同样带 Base，却没有弹出告警提示。Qwen3.5 是后训练模型，已经经历了至少一轮指令微调或强化学习（RL），具备对话能力。RL 训练的模型其指令遵循能力通常优于单纯的监督微调（SFT）模型。

文章配图

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

python -m venv cppVenv
source cppVenv/bin/activate

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
pip install -r requirements.txt

python convert_hf_to_gguf.py /mnt/workspace/models/Qwen3.5-2B-output --outfile /mnt/workspace/gguf/Qwen3.5-2B-output.gguf --outtype q8_0

cat /mnt/workspace/models/Qwen3.5-2B-output/tokenizer_config.json | grep tokenizer_class

sed -i 's/"tokenizer_class": "TokenizersBackend"/"tokenizer_class": "Qwen2Tokenizer"/g' /mnt/workspace/models/Qwen3.5-2B-output/tokenizer_config.json

基于魔搭社区免费 GPU 使用 LLaMaFactory 微调大模型

一、环境

安装 LLaMaFactory

创建虚拟环境

二、模型选择

2.1. 模型分类和区别

更多推荐文章

相关免费在线工具

2.2. 加载模型对话

2.2.1. 推理引擎

2.2.2. 推理数据类型

2.2.3. 额外参数

三、数据集

3.1. 获取源数据

3.2. 编写转换脚本

3.3. 生成数据集

四、训练

4.1. 加载并预览数据集

4.2. 执行微调

4.3. 导出微调结果

五、转换 GGUF

5.1. 创建环境

5.2. 执行转换

更多推荐文章

相关免费在线工具

基于魔搭社区免费 GPU 使用 LLaMaFactory 微调大模型

一、环境

安装 LLaMaFactory

创建虚拟环境

二、模型选择

2.1. 模型分类和区别

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2. 加载模型对话

2.2.1. 推理引擎

2.2.2. 推理数据类型

2.2.3. 额外参数

三、数据集

3.1. 获取源数据

3.2. 编写转换脚本

3.3. 生成数据集

四、训练

4.1. 加载并预览数据集

4.2. 执行微调

4.3. 导出微调结果

五、转换 GGUF

5.1. 创建环境

5.2. 执行转换

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具