Qwen3.5-4B 微调实战：基于 LLaMA-Factory 构建医疗 AI 助手

最近在帮一个医疗创业团队做技术支持，他们想把通用大模型改造成能回答专业医疗问题的智能助手。今天就把整个过程整理出来，希望对有类似需求的朋友有所帮助。 **核心工具链：** LLaMA-Factory + Qwen3.5-4B + 医疗问答数据集 Qwen3.5 是阿里最新发布的千问系列模型，4B 参数量刚好卡在"效果够用 + 显存友好"的甜蜜点；LLaMA-Factory 则是目前开源社区最成熟的…

不羁发布于 2026/4/6更新于 2026/5/2457K 浏览

最近在帮一个医疗创业团队做技术支持，他们想把通用大模型改造成能回答专业医疗问题的智能助手。今天就把整个过程整理出来，希望对有类似需求的朋友有所帮助。

核心工具链： LLaMA-Factory + Qwen3.5-4B + 医疗问答数据集

Qwen3.5 是阿里最新发布的千问系列模型，4B 参数量刚好卡在"效果够用 + 显存友好"的甜蜜点；LLaMA-Factory 则是目前开源社区最成熟的微调框架，上手简单，坑也相对少。

准备工作

先说硬件要求。4B 模型用 LoRA 微调的话，一张 12GB 显存的显卡就够了（比如 RTX 4070）。如果手头只有 8GB 显存的卡，可以上 QLoRA 量化方案，牺牲一点精度换显存空间。

微调方式	4B 模型显存需求	推荐显卡
LoRA (16-bit)	~10-12 GB	RTX 4070 / RTX 3090
QLoRA (8-bit)	~6-8 GB	RTX 4060 / RTX 3070
QLoRA (4-bit)	~4-6 GB	RTX 3060

软件环境这边，建议 Python 3.11+，PyTorch 2.0 以上。CUDA 版本最好 12.x，兼容性更好。

下载 Qwen3.5-4B 模型

模型从魔搭社区下载，国内速度很快：

# 安装 modelscope
pip install modelscope

# 方式一：Python 代码下载
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen3.5-4B')
print(f"模型已下载到：{model_dir}")

# 方式二：命令行下载
# modelscope download --model Qwen/Qwen3.5-4B --local_dir ./models/Qwen3.5-4B

💡 小贴士： 模型大约 9.3GB，建议挂个代理或者选择网络好的时间段下载。下载完记得检查一下文件完整性。

搭建 LLaMA-Factory 环境

LLaMA-Factory 的安装很直接：

# 克隆仓库
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

# 安装依赖
pip install -e .
pip install -r requirements/metrics.txt

# 如果需要 DeepSpeed 加速（可选）
pip install -r requirements/deepspeed.txt

装完之后可以跑一下测试命令确认环境没问题：

llamafactory-cli version

准备医疗数据集

数据集是微调效果的关键。这里用的是开源的中文医疗问答数据，主要来自几个渠道：

数据来源推荐：

GitHub 上有个 llm-medical-data 仓库，整理了几十万条医疗问答数据，覆盖内科、外科、妇产科、儿科等科室。另外 HuggingFace 上的数据集也不错，格式比较规范。

核心工具链： LLaMA-Factory + Qwen3.5-4B + 医疗问答数据集

准备工作

微调方式	4B 模型显存需求	推荐显卡
LoRA (16-bit)	~10-12 GB	RTX 4070 / RTX 3090
QLoRA (8-bit)	~6-8 GB	RTX 4060 / RTX 3070
QLoRA (4-bit)	~4-6 GB	RTX 3060

软件环境这边，建议 Python 3.11+，PyTorch 2.0 以上。CUDA 版本最好 12.x，兼容性更好。

下载 Qwen3.5-4B 模型

模型从魔搭社区下载，国内速度很快：

# 安装 modelscope
pip install modelscope

# 方式一：Python 代码下载
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen3.5-4B')
print(f"模型已下载到：{model_dir}")

# 方式二：命令行下载
# modelscope download --model Qwen/Qwen3.5-4B --local_dir ./models/Qwen3.5-4B

💡 小贴士： 模型大约 9.3GB，建议挂个代理或者选择网络好的时间段下载。下载完记得检查一下文件完整性。

搭建 LLaMA-Factory 环境

LLaMA-Factory 的安装很直接：

# 克隆仓库
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

# 安装依赖
pip install -e .
pip install -r requirements/metrics.txt

# 如果需要 DeepSpeed 加速（可选）
pip install -r requirements/deepspeed.txt

装完之后可以跑一下测试命令确认环境没问题：

llamafactory-cli version

准备医疗数据集

数据集是微调效果的关键。这里用的是开源的中文医疗问答数据，主要来自几个渠道：

数据来源推荐：

Qwen3.5-4B 微调实战：基于 LLaMA-Factory 构建医疗 AI 助手

准备工作

下载 Qwen3.5-4B 模型

搭建 LLaMA-Factory 环境

准备医疗数据集

Qwen3.5-4B 微调实战：基于 LLaMA-Factory 构建医疗 AI 助手

准备工作

下载 Qwen3.5-4B 模型

搭建 LLaMA-Factory 环境

准备医疗数据集

更多推荐文章

相关免费在线工具

开始微调

测试效果

导出和部署

踩坑记录

更多推荐文章

相关免费在线工具

Qwen3.5-4B 微调实战：基于 LLaMA-Factory 构建医疗 AI 助手

准备工作

下载 Qwen3.5-4B 模型

搭建 LLaMA-Factory 环境

准备医疗数据集

Qwen3.5-4B 微调实战：基于 LLaMA-Factory 构建医疗 AI 助手

准备工作

下载 Qwen3.5-4B 模型

搭建 LLaMA-Factory 环境

准备医疗数据集

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

开始微调

测试效果

导出和部署

踩坑记录

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具