一、环境
如果你还在为本地设备问题而烦恼,可以利用魔搭社区提供的免费 GPU 环境。
首先注册魔搭社区,绑定个人阿里云账号即可,详情见:https://www.modelscope.cn/my/mynotebook;然后可获取 36 小时 GPU 环境。
配置如下:
- CPU:8 核,负责数据调度和预处理
- 内存:32GB,临时存放加载的数据
- 显存:24G
- 操作系统:Ubuntu 22.04
- CUDA:12.8.1,支持最新显卡
- Python:3.11
- PyTorch:2.9.1
- ModelScope:1.35.0

安装 LLaMaFactory
克隆 llama-factory 项目,执行 pip install -e .。若出现依赖冲突提示,建议使用虚拟环境(venv)以避免权限混乱。
创建虚拟环境
python -m venv llmVenv
source llmVenv/bin/activate
退出虚拟环境:deactivate
在虚拟环境中执行升级:pip install --upgrade pip
后续执行 pip install -e . 和 pip install -r requirements/metrics.txt,运行 llamafactory-cli webui 启动服务,并在浏览器访问 http://127.0.0.1:7860。
二、模型选择
2.1. 模型分类和区别
此处选择一个模型 Qwen3-4B-Base,系统会弹出告警提示。这是因为【Base】表示基座模型,而非经过指令微调的【Instruct】模型。
两者区别在于:
- Base:基座模型,只完成预训练,擅长续写文本,不擅长直接理解并回答人类指令。
- Instruct:指令模型,在基座基础上使用大量用户指令数据进行微调,能够正确理解并遵循人类指令。

后续选择 Qwen3.5-2B-Base,此时虽带【Base】但无告警。Qwen3.5 是后训练模型,已经历指令微调或强化学习(RL),具备对话能力。





















