**核心工具链:**LLaMA-Factory + Qwen3.5-4B + 医疗问答数据集
Qwen3.5 是阿里发布的千问系列模型,4B 参数量兼顾效果与显存友好;LLaMA-Factory 是开源社区成熟的微调框架。
准备工作
硬件要求:
| 微调方式 | 4B 模型显存需求 | 推荐显卡 |
|---|---|---|
| LoRA (16-bit) | ~10-12 GB | RTX 4070 / RTX 3090 |
| QLoRA (8-bit) | ~6-8 GB | RTX 4060 / RTX 3070 |
| QLoRA (4-bit) | ~4-6 GB | RTX 3060 |
软件环境建议 Python 3.11+,PyTorch 2.0 以上,CUDA 12.x。
下载 Qwen3.5-4B 模型
# 安装 modelscope
pip install modelscope
# 方式一:Python 代码下载
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen3.5-4B')
print(f"模型已下载到:{model_dir}")
# 方式二:命令行下载
# modelscope download --model Qwen/Qwen3.5-4B --local_dir ./models/Qwen3.5-4B
搭建 LLaMA-Factory 环境
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .
pip install -r requirements/metrics.txt
# 如果需要 DeepSpeed 加速(可选)
pip install -r requirements/deepspeed.txt
运行测试命令确认环境:
llamafactory-cli version
准备医疗数据集
数据集格式示例如下:
[
{
"instruction": "你是一个专业的医疗助手,请根据患者描述给出建议。",
"input": "我最近总是头痛,尤其是下午的时候,已经持续一周了。",
"output":


