基于 ChatGLM-6B 的医疗领域大模型微调实战指南

基于 ChatGLM-6B 的医疗领域大模型微调实战指南 | 极客日志

conda create -n glm_env python=3.9
conda activate glm_env
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install transformers peft accelerate datasets sentencepiece

git clone https://github.com/THUDM/ChatGLM-Finetuning.git
cd ChatGLM-Finetuning
pip install -r requirements.txt

from modelscope import snapshot_download
import os

# 设置缓存目录
model_dir = snapshot_download('ZhipuAI/ChatGLM-6B', cache_dir='./models')
print(f"模型已下载至：{model_dir}")

{
  "instruction": "一名年龄在 70 岁的女性，出现了晕厥、不自主颤抖、情绪不稳等症状，请详细说明其手术治疗和术前准备。",
  "input": "",
  "output": "该病需要进行电极导线、脉冲发生器和永久心脏起搏器置入术，并需要使用镇静药物和局麻对病人进行手术治疗。术前准备包括 1-3 天的时间进行术前检查和生活方式的调整。"
}

#!/bin/bash
export CUDA_VISIBLE_DEVICES=0,1

python finetune.py \
    --model_name_or_path ./models/ChatGLM-6B \
    --data_path ./data/train.json \
    --output_dir ./output/glm-lora \
    --per_device_train_batch_size 4 \
    --gradient_accumulation_steps 4 \
    --learning_rate 1e-4 \
    --num_train_epochs 3 \
    --do_train \
    --use_lora \
    --lora_r 8 \
    --lora_alpha 32 \
    --lora_dropout 0.1

python merge_lora.py

import argparse
import torch
from model import MODE
import os

os.environ['CUDA_VISIBLE_DEVICES'] = '0'

def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument("--device", type=str, default="0")
    parser.add_argument("--mode", type=str, default="glm")
    parser.add_argument("--model_path", type=str, default="./output/glm-merged")
    parser.add_argument("--max_length", type=int, default=500)
    parser.add_argument("--do_sample", type=bool, default=True)
    parser.add_argument("--top_p", type=float, default=0.8)
    parser.add_argument("--temperature", type=float, default=0.8)
    return parser.parse_args()

def predict_one_sample(instruction, input, model, tokenizer, args):
    result, _ = model.chat(tokenizer, instruction + input, max_length=args.max_length, 
                           do_sample=args.do_sample, top_p=args.top_p, temperature=args.temperature)
    return result

if __name__ == '__main__':
    args = parse_args()
    # 加载合并后的模型
    model = MODE[args.mode]["model"].from_pretrained(args.model_path, device_map="auto", 
                                                     torch_dtype=torch.float16)
    tokenizer = MODE[args.mode]["tokenizer"].from_pretrained(args.model_path)
    
    instruction = "一位年轻女性患者出现了风团性斑块、丘疹等症状，请问此病可以由哪些科室进行治疗？"
    input = ""
    r = predict_one_sample(instruction, input, model, tokenizer, args)
    print(r)

基于 ChatGLM-6B 的医疗领域大模型微调实战指南

基于 ChatGLM-6B 的医疗领域大模型微调实战指南

1. 背景与概述

2. 服务器环境准备

2.1 硬件要求

2.2 软件环境

2.3 依赖库安装

3. 开源库下载与配置

4. 模型下载

5. 指令数据集准备

5.1 数据格式规范

5.2 数据清洗与增强

6. 模型训练配置

6.1 训练脚本说明

6.2 监控训练过程

7. 合并 LoRA 参数文件

8. 推理与测试

8.1 推理脚本

8.2 生成参数调优

9. 常见问题与优化

9.1 显存溢出 (OOM)

9.2 模型幻觉

9.3 量化部署

10. 总结

更多推荐文章

相关免费在线工具

基于 ChatGLM-6B 的医疗领域大模型微调实战指南

基于 ChatGLM-6B 的医疗领域大模型微调实战指南

1. 背景与概述

2. 服务器环境准备

2.1 硬件要求

2.2 软件环境

2.3 依赖库安装

3. 开源库下载与配置

4. 模型下载

5. 指令数据集准备

5.1 数据格式规范

5.2 数据清洗与增强

6. 模型训练配置

6.1 训练脚本说明

6.2 监控训练过程

7. 合并 LoRA 参数文件

8. 推理与测试

8.1 推理脚本

8.2 生成参数调优

9. 常见问题与优化

9.1 显存溢出 (OOM)

9.2 模型幻觉

9.3 量化部署

10. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具