LLaMA-Factory 微调 DeepSeek-R1 模型实战指南 | 极客日志

PythonAI算法

LLaMA-Factory 微调 DeepSeek-R1 模型实战指南

介绍使用 LLaMA-Factory 对 DeepSeek-R1 模型进行可视化的微调流程。内容包括环境搭建（Anaconda、CUDA）、数据集准备与预处理（聊天记录清洗、格式转换）、模型配置与训练参数设置、评估指标解读以及模型导出部署。通过 LoRA 技术实现高效微调，适用于个人风格化对话模型的构建。

未来可期发布于 2026/4/5更新于 2026/5/2334 浏览

LLaMA-Factory 模型微调基础教程

LLaMA-Factory 概述

使用 LLaMA-Factory 进行模型微调具有多方面的好处。首先，它简化了大模型微调的过程，使得用户能够轻松进行模型的优化和改进。此外，LLaMA-Factory 支持多种训练方法，如全量调参、LoRA 等，以及不同的对齐方案，如 DPO、PPO 等。这为用户提供了灵活性，可以根据具体需求选择合适的微调策略。

LLaMA-Factory 还提供了一站式服务，从模型微调到量化处理，再到运行，整个过程一气呵成。此外，它支持多种流行的语言模型，如 LLaMA、BLOOM、Mistral、Baichuan 等，涵盖了广泛的应用场景。

在模型量化方面，LLaMA-Factory 能够有效地压缩模型规模，减少模型运行所需的计算量和存储空间，使得模型能够在性能稍弱的设备上也能流畅运行。这不仅提高了模型的可访问性，也降低了运行成本。

此外，LLaMA-Factory 的训练过程中记录的内容比较全面，除了同步输出 loss 曲线图以外，还自带 BLEU 等评测指标，这有助于用户更好地监控和评估模型的性能。

LLaMA-Factory 安装

环境依赖详情

官方建议 Python 版本至少为 3.9，推荐 3.10。

依赖安装

进入 LLaMA-Factory 目录后执行以下命令：

pip install -r requirements.txt

执行完整依赖安装：

pip install -e ".[torch,metrics]"

CUDA 安装

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c nvidia

记得输入 y 继续安装。

量化 BitsAndBytes 安装

如果要在 Windows 平台上开启量化 LoRA（QLoRA），需要安装预编译的 bitsandbytes 库。支持 CUDA 11.1 到 12.2，请根据您的 CUDA 版本情况选择适合的发布版本。

pip install https://github.com/jllllll/bitsandbytes-windows-webui/releases/download/wheels/bitsandbytes-0.41.2.post2-py3-none-win_amd64.whl

可视化微调启动

启动命令：

llamafactory-cli webui

如果出现无法访问 localhost 的错误，可能需要修改 interface.py 代码中的 share 参数。
找到 run_web_ui() 和 run_web_demo() 方法，将 share=gradio_share 修改为 share=True。
再次运行即可成功。注意此时不要使用代理工具，否则界面可能加载不出来。

数据集准备

所需工具下载

使用数据导出工具进行聊天记录解析。例如可以使用 MemoTrace 或其他类似工具（如 finetune_dataset_maker）。

使用教程

点击导出数据，按照步骤操作。
解压后找到可执行文件双击执行。
登录账号，在工具中点击解析数据。
选择 AI 对话 txt 和 json 格式按需导出。
仅勾选文本数据以获取纯文本内容。
记录导出目录路径。
导出完毕后，相对路径文件夹下会有生成的数据文件。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

import os
import json

# 设置目标文件夹路径
folder_path = r'D:\软件\留痕\data\聊天记录'

# 获取文件夹及其所有子文件夹中的所有 .json 文件
json_files = []
for root, dirs, files in os.walk(folder_path):
    for file in files:
        if file.endswith('.json'):
            json_files.append(os.path.join(root, file))

# 合并所有 .json 文件
merged_data = []
for file in json_files:
    with open(file, 'r', encoding='utf-8') as f:
        try:
            data = json.load(f)
            merged_data.append(data)
        except json.JSONDecodeError:
            print(f"Error decoding {file}. Skipping.")

# 保存合并后的数据到一个新的 .json 文件
merged_file_path = os.path.join(folder_path, 'merged_data.json')
with open(merged_file_path, 'w', encoding='utf-8') as merged_file:
    json.dump(merged_data, merged_file, indent=4, ensure_ascii=False)
print(f"合并后的文件已保存至：{merged_file_path}")

import json
import re

# 读取 merged_data.json 文件
with open('merged_data.json', 'r', encoding='utf-8') as file:
    data = json.load(file)

# 转换后的数据格式
converted_data = []

# 数据清洗：去除空消息，清除特殊字符，统一格式
def clean_data(dataset):
    cleaned_data = []
    for example in dataset:
        messages = example['messages']
        cleaned_messages = []
        for message in messages:
            # 去除内容为空的消息
            if not message['content'].strip():
                continue
            # 清除多余的空格、换行符等
            message['content'] = message['content'].replace("\n", " ").strip()
            cleaned_messages.append(message)
        if cleaned_messages:
            cleaned_data.append({'messages': cleaned_messages})
    return cleaned_data

# 脱敏处理：替换敏感信息
def replace_sensitive_info(text):
    # 匹配手机号、邮箱等敏感信息
    text = re.sub(r'\d{3}[-]?\d{4}[-]?\d{4}', '[PHONE_NUMBER]', text) # 替换手机号
    text = re.sub(r'\S+@\S+', '[EMAIL]', text) # 替换邮箱
    text = re.sub(r'\d{4}-\d{2}-\d{2}', '[DATE]', text) # 替换日期
    return text

# 匿名化数据：替换用户角色
def anonymize_data(dataset):
    anonymized_data = []
    for example in dataset:
        messages = example['messages']
        anonymized_messages = []
        for message in messages:
            # 匿名化用户角色
            if message['role'] == 'user':
                message['content'] = message['content'].replace("用户", "用户 X")
            # 替换敏感信息
            message['content'] = replace_sensitive_info(message['content'])
            anonymized_messages.append(message)
        anonymized_data.append({'messages': anonymized_messages})
    return anonymized_data

# 处理每一条对话
for item_list in data:
    for item in item_list:
        # 确保每个条目中包含 'messages' 字段
        if 'messages' not in item:
            print("跳过：没有找到 'messages' 字段")
            continue
        # 如果没有 'messages' 字段，跳过当前数据项
        print(f"正在处理数据项：{item}")
        # 打印当前处理的项
        conversation = {"conversations": []}
        # 处理消息数据
        for message in item['messages']:
            role = message['role']
            content = message['content']
            print(f"处理消息：role={role}, content={content}")
            # 打印消息内容
            # 清洗和脱敏处理
            content = replace_sensitive_info(content)
            # 映射 role 到 from 字段
            if role == "system":
                continue # 忽略 system 消息
            elif role == "user":
                from_role = "human"
            elif role == "assistant":
                from_role = "gpt"
            # 添加转换后的消息
            conversation['conversations'].append({"from": from_role, "value": content})
        # 将转换后的会话添加到最终结果中
        converted_data.append(conversation)

# 保存转换后的数据为新的文件
with open('converted_data.json', 'w', encoding='utf-8') as file:
    json.dump(converted_data, file, ensure_ascii=False, indent=2)
print("数据转换完成，结果已保存为 converted_data.json")

"converted_data": {
    "file_name": "converted_data.json",
    "formatting": "sharegpt",
    "columns": {
        "messages": "conversations"
    }
},

transformers>=4.41.2,<=4.48.3,!=4.46.*,!=4.47.*,!=4.48.0,!=4.48.1,!=4.48.2;python_version<'3.10'
transformers>=4.41.2,<=4.48.3,!=4.46.*,!=4.47.*,!=4.48.0;python_version>='3.10'
datasets>=2.16.0,<=3.2.0
accelerate>=0.34.0,<=1.2.1
peft>=0.11.1,<=0.12.0
trl>=0.8.6,<=0.9.6
tokenizers>=0.19.0,<=0.21.0
gradio>=4.38.0,<=5.12.0
pandas>=2.0.0
scipy
einops
sentencepiece
tiktoken
protobuf
uvicorn
pydantic
fastapi
sse-starlette
matplotlib>=3.7.0
fire
packaging
pyyaml
numpy<2.0.0
av
librosa
tyro<0.9.0

LLaMA-Factory 微调 DeepSeek-R1 模型实战指南

LLaMA-Factory 模型微调基础教程

LLaMA-Factory 概述

LLaMA-Factory 安装

环境依赖详情

依赖安装

CUDA 安装

量化 BitsAndBytes 安装

可视化微调启动

数据集准备

所需工具下载

使用教程

更多推荐文章

相关免费在线工具

所需数据合并

数据集预处理

DeepSeek-R1 可视化微调

数据集处理

数据详解

LLaMA-Factory 基础设置

模型评估与预测

训练模型对话

训练模型导出

更多推荐文章

相关免费在线工具

LLaMA-Factory 微调 DeepSeek-R1 模型实战指南

LLaMA-Factory 模型微调基础教程

LLaMA-Factory 概述

LLaMA-Factory 安装

环境依赖详情

依赖安装

CUDA 安装

量化 BitsAndBytes 安装

可视化微调启动

数据集准备

所需工具下载

使用教程

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

所需数据合并

数据集预处理

DeepSeek-R1 可视化微调

数据集处理

数据详解

LLaMA-Factory 基础设置

模型评估与预测

训练模型对话

训练模型导出

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具