本地训练专属大模型指南：基于 LLaMA-Factory 微调 DeepSeek-R1 | 极客日志

PythonAI算法

本地训练专属大模型指南：基于 LLaMA-Factory 微调 DeepSeek-R1

在本地电脑使用 LLaMA-Factory 框架微调 DeepSeek-R1 大模型的完整流程。内容包括环境配置（Anaconda、PyTorch、CUDA）、项目初始化、模型下载、训练集制作、可视化微调界面启动、模型导出以及基于 Gradio 的本地部署调用。通过该教程，用户可在个人设备上实现大模型的定制化训练与应用。

MqEngine发布于 2026/4/6更新于 2026/7/2460 浏览

本地训练专属大模型指南：基于 LLaMA-Factory 微调 DeepSeek-R1

1. 前言

本教程介绍如何在个人电脑上使用 LLaMA-Factory 框架对 DeepSeek-R1 大模型进行微调。环境配置需具备 NVIDIA GPU，建议显存充足。

2. 训练模型

2.1 基础配置

Anaconda：Python 环境管理工具。
- Anaconda 官网
PyCharm：Python 集成开发环境。
- PyCharm 官网
Git：版本控制系统，用于克隆项目。
- Git 官网
CUDA 和 cuDNN：GPU 加速驱动，注意版本匹配。
- CUDA 官网
- cuDNN 官网
PyTorch：深度学习框架，版本需与 CUDA 对应。
- PyTorch 官网

2.2 初始化环境

打开 Anaconda Prompt，创建并激活虚拟环境：

conda create -n llama python=3.10
conda activate llama

安装 PyTorch（示例为 CUDA 12.4）：

conda install pytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=12.4 -c pytorch -c nvidia

克隆 LLaMA-Factory 项目：

git clone https://github.com/hiyouga/LLaMA-Factory.git

进入项目目录安装依赖（建议使用镜像源）：

pip install -e "[torch,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple/

验证安装：

llamafactory-cli version

2.3 下载大模型

设置环境变量以修改 HuggingFace 下载路径（PowerShell）：

echo $env:HF_HOME ="E:\soft\Hugging-Face"
echo $env:HF_ENDPOINT="https://hf-mirror.com"

安装 huggingface_hub：

pip install -U huggingface_hub

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

huggingface-cli download --resume-download deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

{"instruction":"你叫什么？是谁发明了你？","input":"","output":"您好，我名为小白智能助手，是 AIOT 工作室发明的 AI 助手。我的任务是为用户提供有针对性的解答和支持。"}

llamafactory-cli webui

conda create -n deepseekApi python=3.10
conda activate deepseekApi 
conda install -c conda-forge fastapi uvicorn transformers torch
pip install safetensors sentencepiece protobuf

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
import gradio as gr

# 模型路径
model_path = r"E:\DeepSeek-merged"

# 加载模型和 tokenizer
tokenizer = AutoTokenizer.from_pretrained(model_path)
device = "cuda" if torch.cuda.is_available() else "cpu"
model = AutoModelForCausalLM.from_pretrained(
    model_path, torch_dtype=torch.float16 if device == "cuda" else torch.float32
).to(device)

def generate_response(message, history):
    try:
        prompt = "\n".join([f"用户：{h[0]}\n助手：{h[1]}" for h in history]) + f"\n用户：{message}\n助手："
        inputs = tokenizer(prompt, return_tensors="pt").to(device)
        outputs = model.generate(
            inputs.input_ids,
            max_length=1000,
            min_length=30,
            top_p=0.85,
            temperature=0.6,
            repetition_penalty=1.2,
            no_repeat_ngram_size=3,
            num_beams=4,
            do_sample=True,
            early_stopping=True
        )
        response = tokenizer.decode(outputs[0][inputs.input_ids.shape[-1]:], skip_special_tokens=True)
        return response
    except Exception as e:
        return f"生成回复时出错：{str(e)}"

demo = gr.ChatInterface(
    fn=generate_response,
    title="AI 问答助手",
    description="智能助手",
    examples=["你好！你是谁？", "你能做什么？"],
    theme="soft"
)

if __name__ == "__main__":
    demo.launch(server_name="localhost", server_port=7860)

本地训练专属大模型指南：基于 LLaMA-Factory 微调 DeepSeek-R1

1. 前言

2. 训练模型

2.1 基础配置

2.2 初始化环境

2.3 下载大模型

更多推荐文章

相关免费在线工具

2.4 制作训练集（json 格式）

2.5 启动可视化微调界面

2.6 在线使用

2.7 模型导出

2.8 本地使用

更多推荐文章

相关免费在线工具

本地训练专属大模型指南：基于 LLaMA-Factory 微调 DeepSeek-R1

1. 前言

2. 训练模型

2.1 基础配置

2.2 初始化环境

2.3 下载大模型

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.4 制作训练集（json 格式）

2.5 启动可视化微调界面

2.6 在线使用

2.7 模型导出

2.8 本地使用

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具