跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonNode.jsAI

用 LLaMA-Factory 微调 Qwen3.5-4B 做医疗助手

基于 Qwen3.5-4B 和 LLaMA-Factory,可以用 LoRA 或 QLoRA 把通用模型微调成医疗问答助手。文章给出了显存与显卡建议、模型下载、LLaMA-Factory 环境搭建、医疗数据集格式与 dataset_info 注册方式,以及一套可直接运行的 SFT 配置、训练命令、TensorBoard 监控、推理测试、LoRA 合并导出和 vLLM/API 部署示例。最后也提醒了医疗场景必须保留免责声明和人工审核,模型输出不能替代医生诊断。

安卓系统发布于 2026/6/300 浏览
用 LLaMA-Factory 微调 Qwen3.5-4B 做医疗助手

**核心工具链:**LLaMA-Factory + Qwen3.5-4B + 医疗问答数据集

Qwen3.5 是阿里发布的千问系列模型,4B 参数量在效果和显存之间比较均衡;LLaMA-Factory 则是开源社区里用得很成熟的微调框架。这个组合的优点很直接:上手成本不高,能比较快地把一个通用模型调成偏医疗问答的版本。

准备工作

硬件要求:

微调方式4B 模型显存需求推荐显卡
LoRA (16-bit)~10-12 GBRTX 4070 / RTX 3090
QLoRA (8-bit)~6-8 GBRTX 4060 / RTX 3070
QLoRA (4-bit)~4-6 GBRTX 3060

软件环境建议 Python 3.11+,PyTorch 2.0 以上,CUDA 12.x。

下载 Qwen3.5-4B 模型

# 安装 modelscope
pip install modelscope
# 方式一:Python 代码下载
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen3.5-4B')
print(f"模型已下载到:{model_dir}")
# 方式二:命令行下载
# modelscope download --model Qwen/Qwen3.5-4B --local_dir ./models/Qwen3.5-4B

搭建 LLaMA-Factory 环境

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .
pip install -r requirements/metrics.txt
# 如果需要 DeepSpeed 加速(可选)
pip install -r requirements/deepspeed.txt

运行测试命令确认环境:

llamafactory-cli version

准备医疗数据集

数据集格式示例如下:

[
  {
    "instruction": "你是一个专业的医疗助手,请根据患者描述给出建议。",
    "input": "我最近总是头痛,尤其是下午的时候,已经持续一周了。",
    "output": "持续性头痛需要关注。建议您先排除以下几个常见原因:1)睡眠质量,2)用眼过度,3)颈椎问题。如果休息后仍不缓解,建议到医院神经内科就诊,做个头部 CT 检查。"
  }
]

把处理好的数据放到 data/ 目录下,再在 data/dataset_info.json 里注册:

{
  "medical_qa": {
    "file_name": "medical_qa.json",
    "columns": {
      "prompt": "instruction",
      "query": "input",
      "response": "output"
    }
  }
}

开始微调

配置文件位于 examples/train_lora/qwen35_medical_lora.yaml:

### 模型配置 ###
model_name_or_path: ./models/Qwen3.5-4B
trust_remote_code: true
### 微调方法 ###
stage: sft
do_train: true
finetuning_type: lora
lora_rank: 64
lora_alpha: 128
lora_target: all
### 数据集配置 ###
dataset: medical_qa
template: qwen3
cutoff_len: 2048
preprocessing_num_workers: 8
### 训练参数 ###
output_dir: ./output/qwen35_medical_lora
per_device_train_batch_size: 2
gradient_accumulation_steps: 8
learning_rate: 1.0e-4
num_train_epochs: 3.0
lr_scheduler_type: cosine
warmup_ratio: 0.1
logging_steps: 10
save_steps: 500
### 显存优化 ###
bf16: true
gradient_checkpointing: true

启动训练:

llamafactory-cli train examples/train_lora/qwen35_medical_lora.yaml

监控 loss 曲线:

tensorboard --logdir=./output/qwen35_medical_lora/runs

测试效果

快速测试命令:

llamafactory-cli chat examples/inference/qwen35_medical_lora.yaml

推理配置文件 qwen35_medical_lora.yaml:

model_name_or_path: ./models/Qwen3.5-4B
adapter_name_or_path: ./output/qwen35_medical_lora
template: qwen3
finetuning_type: lora

导出和部署

合并 LoRA 权重:

llamafactory-cli export examples/merge_lora/qwen35_medical_merge.yaml

合并配置:

model_name_or_path: ./models/Qwen3.5-4B
adapter_name_or_path: ./output/qwen35_medical_lora
template: qwen3
finetuning_type: lora
export_dir: ./models/Qwen35-Medical
export_size: 2
export_device: cuda
export_legacy_format: false

vLLM 部署示例:

pip install vllm
vllm serve ./models/Qwen35-Medical --port 8000

或者直接用 LLaMA-Factory 内置的 API 服务:

API_PORT=8000 llamafactory-cli api examples/inference/qwen35_medical.yaml

常见问题

  1. 显存不够用:先把 per_device_train_batch_size 调小,再开 gradient_checkpointing,实在不行就换 4-bit 量化。这个顺序比较省时间。
  2. Loss 不下降:先查数据格式和字段映射,很多时候问题不在模型,而在数据没喂对;学习率可以在 1e-4 到 5e-5 之间试。
  3. 微调后模型变差:通常是数据质量不稳或者过拟合,减少 epoch,或者混一点通用对话数据,能缓一缓。

医疗领域的 AI 应用要留一道安全边界,模型输出只能作为参考,不能替代医生诊断。产品里最好保留免责声明和人工审核机制。

目录

  1. 准备工作
  2. 下载 Qwen3.5-4B 模型
  3. 安装 modelscope
  4. 方式一:Python 代码下载
  5. 方式二:命令行下载
  6. modelscope download --model Qwen/Qwen3.5-4B --local_dir ./models/Qwen3.5-4B
  7. 搭建 LLaMA-Factory 环境
  8. 如果需要 DeepSpeed 加速(可选)
  9. 准备医疗数据集
  10. 开始微调
  11. 模型配置
  12. 微调方法
  13. 数据集配置
  14. 训练参数
  15. 显存优化
  16. 测试效果
  17. 导出和部署
  18. 常见问题
  • 免费图片AI生成工具免费生成了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 免费图片视频在线生成30秒,将你的创意变成现实开始设计
  • X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
  • 100+免费在线小游戏爽一把
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Spatial Joy 2025 AR/AI 赛事参赛指南
  • Claude 4.6 的 Agent Teams 与 Python 接入思路
  • STM32H743 用定时器触发 ADC 和 DMA 做多通道采样
  • 通义万相 2.1 上手与效果观察
  • 无人机检测数据集整理:11998 张图像与多格式标注
  • Web 端 3D 开发的实用技术栈梳理
  • Seedance 2.0 实测:AI 视频从“能看”走向“能用”
  • Python 3.11 新特性:性能、异常与类型系统的变化
  • IntelliJ IDEA 2026.1 EAP:Java 26、Spring Boot 4 与 Gradle 9 适配
  • NWPU VHR-10 遥感目标检测与 YOLO 实践
  • 文心一言 4.5:中文能力实测与本地部署记录
  • 在 WSL2 上部署 OpenClaw 的实操记录
  • Vue 3 常用编程技巧整理
  • 在 Ubuntu 22.04 上部署 llama.cpp 和 llama-server
  • Pencil.dev 安装与实战:在 VS Code 里做设计
  • PaddleNLP 3.0:大模型训推一体与多硬件适配实践
  • Unreal Engine 集成 VRM4U 的实战方案
  • Kali Linux 2025.4 发布:Wayland 默认、桌面与工具链更新
  • Linux 下安装 libwebkit2gtk-4.1-0 的方法与作用
  • CASIC MOTOR 14.8V 无刷减速电机拆解记录

相关免费在线工具

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online

  • Base64 文件转换器

    将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online