本地电脑训练专属大模型实战教程 | 极客日志

PythonAI算法

本地电脑训练专属大模型实战教程

综述由AI生成演示了在本地 NVIDIA 显卡环境下使用 LLaMA-Factory 工具微调 DeepSeek-R1 1.5B 大模型的全流程。涵盖 Anaconda 环境搭建、CUDA 配置、项目克隆、数据集制作、可视化界面启动及模型导出部署。通过 Gradio 框架实现本地 API 调用与交互，适合具备一定基础的开发者在消费级硬件上尝试私有化大模型训练。

星星泡饭发布于 2026/4/8更新于 2026/5/2217 浏览

1. 概述

本文介绍如何在个人电脑上使用 LLaMA-Factory 工具微调 DeepSeek-R1 1.5B 大模型。环境配置基于 NVIDIA GeForce RTX 3050 Ti Laptop GPU，适合具备一定基础的开发者尝试私有化大模型训练。

2. 训练模型

2.1 基础配置

安装以下必要工具：

Anaconda（Python 环境管理工具）
- Anaconda 官网
PyCharm（Python 集成开发环境）
- PyCharm 官网
Git（分布式版本控制系统）
- Git 官网
CUDA 和 cuDNN（GPU 训练加速，注意版本匹配）
- CUDA 官网
- cuDNN 官网
PyTorch（深度学习框架，需与 CUDA 版本对应）
- PyTorch 官网

2.2 初始化环境

打开 Anaconda Prompt，执行以下命令创建并激活虚拟环境：

conda create -n llama python=3.10
conda activate llama

安装 PyTorch（示例为 CUDA 12.4，请根据实际选择）：

conda install pytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=12.4 -c pytorch -c nvidia

克隆 GitHub 项目：

git clone https://github.com/hiyouga/LLaMA-Factory.git

或直接下载压缩包并在 PyCharm 中打开。安装依赖时建议添加镜像源：

pip install -e ".[torch,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple/

验证安装：

llamafactory-cli version

2.3 下载大模型

修改环境变量以指定 Hugging Face 下载路径及镜像源：

$env:HF_HOME = "E:\soft\Hugging-Face"
$env:HF_ENDPOINT = "https://hf-mirror.com"

安装 huggingface_hub：

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

pip install -U huggingface_hub

huggingface-cli download --resume-download deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

{"instruction":"你叫什么？是谁发明了你？","input":"","output":"您好，我名为小白智能助手，是 AIOT 工作室发明的 AI 助手。我的任务是为用户提供有针对性的解答和支持。"}

llamafactory-cli webui

conda create -n deepseekApi python=3.10

conda activate deepseekApi

conda install -c conda-forge fastapi uvicorn transformers torch
pip install safetensors sentencepiece protobuf

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
import gradio as gr

model_path = r"E:\DeepSeek-merged"
tokenizer = AutoTokenizer.from_pretrained(model_path)
device = "cuda" if torch.cuda.is_available() else "cpu"

model = AutoModelForCausalLM.from_pretrained(
    model_path,
    torch_dtype=torch.float16 if device == "cuda" else torch.float32
).to(device)

def generate_response(message, history):
    try:
        prompt = "\n".join([f"用户：{h[0]}\n助手：{h[1]}" for h in history]) + f"\n用户：{message}\n助手："
        inputs = tokenizer(prompt, return_tensors="pt").to(device)
        outputs = model.generate(
            inputs.input_ids,
            max_length=1000,
            min_length=30,
            top_p=0.85,
            temperature=0.6,
            repetition_penalty=1.2,
            no_repeat_ngram_size=3,
            num_beams=4,
            do_sample=True,
            early_stopping=True
        )
        response = tokenizer.decode(outputs[0][inputs.input_ids.shape[-1]:], skip_special_tokens=True)
        return response
    except Exception as e:
        return f"生成回复时出错：{str(e)}"

demo = gr.ChatInterface(
    fn=generate_response,
    title="AI 问答助手",
    description="AIOT 工作室开发的智能助手",
    examples=["你好！你是谁？", "你能做什么？"],
    theme="soft"
)

if __name__ == "__main__":
    demo.launch(server_name="localhost", server_port=7860)

本地电脑训练专属大模型实战教程

1. 概述

2. 训练模型

2.1 基础配置

2.2 初始化环境

2.3 下载大模型

更多推荐文章

相关免费在线工具

2.4 制作训练集（json 格式）

2.5 启动 LLaMA-Factory 的可视化微调界面

2.6 在线使用

2.7 模型导出

2.8 本地使用

更多推荐文章

相关免费在线工具

本地电脑训练专属大模型实战教程

1. 概述

2. 训练模型

2.1 基础配置

2.2 初始化环境

2.3 下载大模型

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.4 制作训练集（json 格式）

2.5 启动 LLaMA-Factory 的可视化微调界面

2.6 在线使用

2.7 模型导出

2.8 本地使用

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具