AI大模型的本地驯服——如何在自己电脑上训练一个专属大模型

优质文章学习记录

07 Apr 2026 — 7 min read

文章目录

1.前言
2.训练模型
3. 致谢

1.前言

2025年3月12日记这是我第一次实现大模型的微调训练，电脑的配置是显卡NVIDIA GeForce RTX 3050 Ti Laptop GPU，三年前的笔记本了，不过还是能跑起来的，训练的是Deep Seek-r1 的 1.5B 模型，之前跑 7B 的直接卡死了。如果大家有更好的显卡，可以尝试一下。在此非常感谢ZEEKLOG的大佬，在他们的基础上，我的博客进一步完善一些细节，文末会附上大佬的原文链接。那么废话不多说，直接开始！（默认大家有一定的基础）

2.训练模型

2.1 基础配置

（具体的安装和使用教程网上有很多，在这里就不做过多的赘述了）

使用Anaconda（Python的环境管理工具），这样就不需要一个一个单独下载python的版本，并且使用起来很方便。
- Anaconda官网
使用PyCharm（Python的集成开发环境），可以在这里面编辑、运行.py文件等操作。
- PyCharm官网
使用Git（分布式版本控制系统），用于克隆GitHub上的优秀项目，不用也没事，可以直接下载.zip文件。
- Git官网
使用CUDA和cuDNN（用于GPU训练加速），需要注意这里面的版本关系，别下错了。
- CUDA 官网
- cuDNN官网
使用PyTorch（深度学习框架），这个版本要与你自己电脑的CUDA版本对应。
- PyTorch官网

以上就是环境配置需要的全部内容，接下来我们就进行项目复刻。

2.2 初始化环境

打开Anaconda Prompt（从Windows开始菜单找到），执行

创建新的虚拟环境

conda create -n llama python=3.10

激活虚拟环境

conda activate llama

安装PyTorch（我的CUDA是12.4，选择支持你们自己电脑的CUDA的版本）

conda installpytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=12.4 -c pytorch -c nvidia

克隆GitHub项目

git clone https://github.com/hiyouga/LLaMA-Factory.git

或者直接下载压缩包，如图所示

下载完成后直接在PyCharm中打开项目

在使用大佬的安装指令时出现问题，AI教我加了一个镜像源，好用

pip install -e ".[torch,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple/

验证安装（出现版本号就成功了）

llamafactory-cli version

2.3下载大模型

在终端输入如下指令，修改大模型存放位置（选择一个合适足够大的存储位置）

echo$env:HF_HOME ="E:\soft\Hugging-Face"

修改大模型下载位置（这个一般不需要修改）

echo$env:HF_ENDPOINT="https://hf-mirror.com"

安装huggingface_hub（如果第一个下载爆红，可以试试第二个镜像源）

pip install -U huggingface_hub

pip install -U huggingface_hub -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

下载训练模型

huggingface-cli download --resume-download deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

2.4制作训练集（json格式）

{"instruction":"你叫什么？是谁发明了你？","input":"","output":"您好，我名为 小白智能助手，是 AIOT工作室 发明的 AI 助手。我的任务是为用户提供有针对性的解答和支持。"},

配置训练集

2.5启动LLama-Factory 的可视化微调界面（http://localhost:7860/）

llamafactory-cli webui

选择自己的训练数据集

训练的超参数根据自己的需求调整，这些参数设置是AI告诉我的，并不是最好的，可以自己摸索一下

点击开始训练

在pycharm和网页可以查看训练进度

训练完毕

2.6在线使用

驯服成功 DeepSeek-R1-1.5B模型！！！

2.7模型导出

选择一个内存足够的盘符进行导出

2.8本地使用

创建一个新环境，跟之前的训练环境隔开，如果不使用python做前端界面可以省略这一步

新建deepspeekApi虚拟环境

conda create -n deepspeekApi python=3.10

激活虚拟环境deepspeekApi

conda activate deepspeekApi

下载所需依赖

conda install -c conda-forge fastapi uvicorn transformers pytorch

pip install safetensors sentencepiece protobuf

现在就可以使用python代码进行本地调用，效果如下

使用python编程实现上述功能，采用gradio框架进行快速开发部署（http://localhost:7860/）

from transformers import AutoModelForCausalLM, AutoTokenizer import torch import gradio as gr # 模型路径 model_path =r"E:\DeepSeek-merged"# 这里选择自己保存的路径# 加载模型和tokenizer tokenizer = AutoTokenizer.from_pretrained(model_path) device ="cuda"if torch.cuda.is_available()else"cpu" model = AutoModelForCausalLM.from_pretrained( model_path, torch_dtype=torch.float16 if device =="cuda"else torch.float32 ).to(device)defgenerate_response(message, history):try:# 将历史对话拼接成prompt prompt ="\n".join([f"用户：{h[0]}\n助手：{h[1]}"for h in history])+f"\n用户：{message}\n助手："# 编码输入 inputs = tokenizer(prompt, return_tensors="pt").to(device)# 生成回复 outputs = model.generate( inputs.input_ids, max_length=1000, min_length=30, top_p=0.85, temperature=0.6, repetition_penalty=1.2, no_repeat_ngram_size=3, num_beams=4, do_sample=True, early_stopping=True)# 解码并提取新生成的回复 response = tokenizer.decode(outputs[0][inputs.input_ids.shape[-1]:], skip_special_tokens=True)return response except Exception as e:returnf"生成回复时出错：{str(e)}"# 创建Gradio界面 demo = gr.ChatInterface( fn=generate_response, title="AI问答助手", description="AIOT工作室开发的智能助手", examples=["你好！你是谁？","你能做什么？"], theme="soft")if __name__ =="__main__":# demo.launch(server_name="0.0.0.0", server_port=7860) # 所有端口都可以访问 demo.launch(server_name="localhost", server_port=7860)# 本地访问

3. 致谢

参考大佬的博客进行一些优化，原文链接如下：

解锁DeepSpeek-R1大模型微调：从训练到部署，打造定制化AI会话系统_speek人工智能-ZEEKLOG博客

用MC.JS WEBMC1.8快速验证游戏创意：48小时开发挑战

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 输入框内输入如下内容：快速开发一个MC.JS WEBMC1.8的概念验证游戏原型。游戏核心玩法是收集资源建造防御工事抵御夜间怪物攻击。白天玩家可以收集木材和石头，晚上会有简单AI的怪物出现。只需实现最基本的游戏循环：白天建造-夜晚防御-次日升级。UI只需要显示资源数量、昼夜计时和简单生命值。代码结构要清晰，便于后续扩展，生成详细的设计文档说明扩展方向。 1. 点击'项目生成'按钮，等待项目生成完整后预览效果最近尝试用MC.JS WEBMC1.8快速验证一个生存建造类游戏创意，整个过程比想象中顺利很多。这个框架对快速原型开发特别友好，48小时内就完成了核心玩法验证。记录下关键实现思路，给想做类似尝试的朋友参考。 1. 核心玩法设计游戏采用经典的昼夜循环机制：白天收集资源建造防御工事，夜晚抵御怪物攻击。为了快速验证可行性，我简化了以下要素： 2.

pywebview：用Python+Web技术打造轻量级桌面应用！

✍️作者：唐叔在学习 💡专栏：唐叔学python ✨关键词：Python桌面开发、pywebview教程、WebView应用、前后端分离、JS与Python交互、桌面应用打包、Electron替代方案、Python GUI 大家好，我是唐叔。今天我们来聊聊一个非常轻量且强大的Python库——pywebview。如果你曾经为开发一个简单的桌面应用而纠结于Electron的笨重、PyQt的复杂，或是Tkinter的界面简陋，那pywebview或许正是你一直在找的解决方案。文章目录 * 一、介绍 * 二、安装 * 安装全量版本 * 安装指定环境版本 * 三、使用入门 * 3.1 基本使用 * 3.2 应用程序架构 * 纯网络服务架构 * 无服务器架构 * 3.3 JS与Python交互 * 四、应用打包 * 五、常见使用场景 * 5.1 文件操作 * 文件下载

从零开始微调Qwen视觉模型｜结合LLaMA-Factory与Qwen3-VL-WEBUI实战

从零开始微调Qwen视觉模型｜结合LLaMA-Factory与Qwen3-VL-WEBUI实战一、前言：为什么需要微调Qwen3-VL？随着多模态大模型的快速发展，Qwen3-VL作为阿里云推出的最新一代视觉语言模型，凭借其强大的图文理解能力、长上下文支持（最高可达1M tokens）以及对视频、GUI操作等复杂任务的支持，正在成为企业级AI应用的重要基础设施。然而，预训练模型虽然具备通用能力，但在特定业务场景下——如识别公司内部文档格式、定制化图像标签生成或自动化表单填写——往往表现不足。本文将带你从零开始完成一次完整的Qwen3-VL-4B-Instruct模型微调实践，使用开源工具 LLaMA-Factory 实现高效参数微调（LoRA），并借助 Qwen3-VL-WEBUI 镜像快速部署和验证效果。无论你是算法工程师还是AI产品经理，都能通过本教程掌握如何让大模型“学会”你的专属任务。 ✅ 核心价值： - 掌握基于LLaMA-Factory的视觉语言模型微调全流程 - 理解Qwen3-VL的关键架构升级与适配要点 - 获得可复用的数据准备、配置优化与问题排查经验

用playwright封装一个处理web网页的爬虫，并隐藏自动化特征，自动处理反爬

更多内容请见：《爬虫和逆向教程》 - 专栏介绍和目录文章目录 * 一、脚本概述 * 1.1 脚本对应反爬措施 * 1.2 注意事项 * 1.3 反爬细节说明 * 二、完整代码 * 2.1 安装依赖 * 2.2 封装代码 * 2.3 使用示例下面是一个使用 Playwright 封装的、具备反爬对抗能力的网页爬虫Python函数，返回原始 HTML 内容，并重点隐藏自动化特征，避免被检测为 bot。一、脚本概述该封装已在多个中等反爬网站（如电商、新闻站）验证有效，能绕过大多数基于 navigator.webdriver、chrome 对象、permissions 等的检测。