基于魔搭与 LLaMA Factory 的大模型微调全流程
1、理解大模型「微调」概念
在动手实操前,先了解核心概念——微调。常规大语言模型的训练分为三个关键阶段:

1. 预训练(通识教育)
- 模型层面:通过自监督学习,读取海量文本数据,掌握基础的语言规则、词汇逻辑。
- 通俗类比:孩子积累基本的词汇和生活常识,但还不会完整表达自己的观点。
2. 微调(专项训练)
- 模型层面:用提前准备好的 Q&A 问答对训练模型,教会它如何组织语言、贴合需求。
- 通俗类比:类似家长或老师通过「问答练习」引导孩子成长,让回答更专业清晰。
3. RLHF(品德与规范教育)
- 模型层面:根据人类的反馈调整模型的回答,让回答更符合社会偏好。
- 通俗类比:当孩子回答不靠谱时,家长耐心纠正,让孩子明白「不仅要会回答,还要回答得靠谱」。
2、搭建微调环境
使用魔搭平台的免费 GPU 实例,搭配 LLaMA Factory 开源工具,零成本搭建微调环境。
1. 创建免费 GPU 实例
第一步:打开魔搭实例创建地址:https://modelscope.cn/my/mynotebook/preset 第二步:关联阿里云账号,选择「第二个 GPU 环境」(免费且适配后续操作)。 第三步:等待 2-3 分钟,实例创建完成后,点击「查看 notebook」,进入云端操作界面。


点击「终端」,进入终端界面,接下来开始配置环境、下载工具。

2. 下载 LLaMA Factory 工具并配置依赖
直接克隆开源代码,然后配置相关依赖。
# 克隆 LLaMA Factory 开源框架
git https://github.com/hiyouga/LLaMA-Factory.git
LLaMA-Factory
python -m venv .venv
.venv/bin/activate
pip install -e






















