环境
在本地部署 LLaMA-Factory 微调平台需要较高硬件配置,可通过魔搭社区免费 GPU 环境进行替代。
首先注册魔搭社区,绑定个人阿里云账号即可,详情见:https://www.modelscope.cn/my/mynotebook;然后可免费获得 36 小时 GPU 环境。
环境配置:
- CPU:8 核,负责数据的调度和预处理
- 内存:32GB,数据从硬盘加载后暂存于此
- 显存:24GB
- 操作系统:Ubuntu 22.04
- CUDA:12.8.1,支持最新 RTX 40 系列或 H 系列显卡
- Python:3.11
- PyTorch:2.9.1
- ModelScope:1.35.0

安装 LLaMaFactory
克隆 llama-factory 项目,执行以下命令:
pip install -e .
若出现依赖冲突提示,为避免权限混乱,推荐使用虚拟环境(venv)。
创建虚拟环境
python -m venv llmVenv
source llmVenv/bin/activate
pip install --upgrade pip
pip install -e .
pip install -r requirements/metrics.txt
启动 WebUI:
llamafactory-cli webui
在控制台点击 http://127.0.0.1:7860 完成浏览器访问。
模型选择
模型分类和区别
此处选中模型 Qwen3-4B-Base,系统弹出告警提示。这是因为【Base】表示基座模型,而非经过指令微调【Instruct】的模型。
- Base:基座模型,只完成了预训练,擅长续写文本,不擅长直接理解并回答人类的问题或指令。
- Instruct:指令模型,在基座模型基础上使用大量【用户指令和期望回答】的数据进行微调,能够正确理解并遵循人类指令。

后续选择 Qwen3.5-2B-Base,名称虽带【Base】但未弹出告警。Qwen3.5 是后训练模型,已经历至少一轮指令微调或强化学习(RL),具备对话能力。





















