基于 LLaMA-Factory 的 DeepSeek-R1 模型微调实战指南 | 极客日志

PythonAI算法

基于 LLaMA-Factory 的 DeepSeek-R1 模型微调实战指南

介绍如何使用 LLaMA-Factory 框架对 DeepSeek-R1 模型进行可视化微调。涵盖环境搭建、数据集准备（包括聊天记录清洗与格式转换）、训练参数配置、模型评估及导出等全流程步骤。通过 LoRA 量化技术降低资源需求，实现个性化对话模型的快速部署。

赛博朋克发布于 2026/4/10更新于 2026/7/2130 浏览

LLaMA-Factory 模型微调基础教程

概述

使用 LLaMA-Factory 进行模型微调具有多方面优势。它简化了大模型微调的过程，支持多种训练方法（如全量调参、LoRA）及对齐方案（如 DPO、PPO），用户可根据需求灵活选择策略。

LLaMA-Factory 提供一站式服务，从微调到量化再到运行，无需在不同工具间切换。它支持多种流行语言模型，涵盖广泛应用场景。在量化方面，能有效压缩模型规模，降低计算量和存储需求，使模型能在性能稍弱的设备上流畅运行。

此外，训练过程记录全面，除同步输出 loss 曲线图外，还自带 BLEU 等评测指标，有助于监控和评估模型性能。

环境搭建

依赖安装

首先确保软硬件环境满足要求。Python 版本建议至少 3.9，推荐 3.10。

创建虚拟环境并导航至项目目录。
安装基础依赖：

pip install -r requirements.txt

安装 PyTorch 及相关组件（以 CUDA 11.8 为例）：

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c nvidia

如需开启量化 LoRA（QLoRA），需安装预编译的 bitsandbytes 库。请根据 CUDA 版本选择合适的发布版本。

启动 WebUI

使用以下命令启动可视化界面：

llamafactory-cli webui

若遇到无法访问 localhost 的问题，可能需要修改 interface.py 中的 share 参数为 True，以便生成可分享的链接。

数据集准备

数据提取与合并

使用数据提取工具获取聊天记录，导出为 JSON 或 TXT 格式。将导出的数据文件统一存放于指定文件夹。

创建一个 merge.py 脚本合并所有聊天记录：

import os
import json

folder_path = r'<your_data_folder>'
json_files = []
for root, dirs, files in os.walk(folder_path):
    for file in files:
        if file.endswith('.json'):
            json_files.append(os.path.join(root, file))

merged_data = []
for file in json_files:
    with open(file, 'r', encoding='utf-8') as f:
        try:
            data = json.load(f)
            merged_data.append(data)
        except json.JSONDecodeError:
            ()

merged_file_path = os.path.join(folder_path, )
 (merged_file_path, , encoding=)  merged_file:
    json.dump(merged_data, merged_file, indent=, ensure_ascii=)
()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

import json
import re

with open('merged_data.json', 'r', encoding='utf-8') as file:
    data = json.load(file)

converted_data = []

def clean_data(dataset):
    cleaned_data = []
    for example in dataset:
        messages = example['messages']
        cleaned_messages = []
        for message in messages:
            if not message['content'].strip():
                continue
            message['content'] = message['content'].replace("\n", " ").strip()
            cleaned_messages.append(message)
        if cleaned_messages:
            cleaned_data.append({'messages': cleaned_messages})
    return cleaned_data

def replace_sensitive_info(text):
    text = re.sub(r'\d{3}[-]?\d{4}[-]?\d{4}', '[PHONE_NUMBER]', text)
    text = re.sub(r'\S+@\S+', '[EMAIL]', text)
    text = re.sub(r'\d{4}-\d{2}-\d{2}', '[DATE]', text)
    return text

def anonymize_data(dataset):
    anonymized_data = []
    for example in dataset:
        messages = example['messages']
        anonymized_messages = []
        for message in messages:
            if message['role'] == 'user':
                message['content'] = message['content'].replace("用户", "用户 X")
            message['content'] = replace_sensitive_info(message['content'])
            anonymized_messages.append(message)
        anonymized_data.append({'messages': anonymized_messages})
    return anonymized_data

for item_list in data:
    for item in item_list:
        if 'messages' not in item:
            continue
        conversation = {"conversations": []}
        for message in item['messages']:
            role = message['role']
            content = message['content']
            content = replace_sensitive_info(content)
            if role == "system":
                continue
            elif role == "user":
                from_role = "human"
            elif role == "assistant":
                from_role = "gpt"
            else:
                continue
            conversation['conversations'].append({"from": from_role, "value": content})
        converted_data.append(conversation)

with open('converted_data.json', 'w', encoding='utf-8') as file:
    json.dump(converted_data, file, ensure_ascii=False, indent=2)
print("数据转换完成，结果已保存为 converted_data.json")

"converted_data":{"file_name":"converted_data.json","formatting":"sharegpt","columns":{"messages":"conversations"}},

基于 LLaMA-Factory 的 DeepSeek-R1 模型微调实战指南

LLaMA-Factory 模型微调基础教程

概述

环境搭建

依赖安装

启动 WebUI

数据集准备

数据提取与合并

更多推荐文章

相关免费在线工具

数据预处理

配置数据集

模型微调

基础设置

训练监控

评估与导出

模型评估

对话测试

模型导出

更多推荐文章

相关免费在线工具

基于 LLaMA-Factory 的 DeepSeek-R1 模型微调实战指南

LLaMA-Factory 模型微调基础教程

概述

环境搭建

依赖安装

启动 WebUI

数据集准备

数据提取与合并

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

数据预处理

配置数据集

模型微调

基础设置

训练监控

评估与导出

模型评估

对话测试

模型导出

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具