【模型手术室】第四篇：全流程实战 —— 使用 LLaMA-Factory 开启你的第一个微调任务

优质文章学习记录

09 Apr 2026 — 2 min read

专栏进度：04 / 10 (微调实战专题)
很多初学者卡在环境配置和复杂的 torch.train 逻辑上。LLaMA-Factory 的核心优势在于它集成了几乎所有主流国产模型（DeepSeek, Qwen, Yi）和海外模型（Llama 3, Mistral），并且原生支持 Gradio 可视化面板，让你在网页上点点鼠标就能“炼丹”。

一、环境搭建：打造你的“炼丹炉”

为了保证训练不因版本冲突而崩溃，建议使用 Conda 进行物理隔离。

Bash

克隆项目

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

安装核心依赖 (针对 CUDA 12.1 环境)

pip install -e .[metrics,bitsandbytes,qwen]

验证是否安装成功

llamafactory-cli version

二、准备食材：注册你的“行业黑话”数据集

LLaMA-Factory 有一套自己的数据集管理逻辑。你需要把上一篇生成的 security_expert_data.jsonl 放入 data/ 目录，并在 data/dataset_info.json 中注册它。

注册示例：

JSON

“my_security_data”: {
“file_name”: “security_expert_data.jsonl”,
“columns”: {
“prompt”: “instruction”,
“query”: “input”,
“response”: “output”
}
}

三、点火炼丹：WebUI 模式与脚本模式

初学者推荐：WebUI 模式
在终端执行 llamafactory-cli webui。
你会看到一个极其直观的界面。你需要设置：

模型名称：选择 DeepSeek-V3 或 Qwen2.5-7B。

微调方法：选择 lora。

数据集：勾选你刚刚注册的 my_security_data。

学习率：建议 5e-5。

计算精度：显存够选 bf16，不够选 fp16 或 int4。

高阶推荐：命令行模式 (CLI)
一旦参数调优确定，建议使用脚本运行，更稳定且方便记录。

Bash

llamafactory-cli train
–stage sft
–do_train
–model_name_or_path /path/to/your/model
–dataset my_security_data
–template qwen
–finetuning_type lora
–output_dir ./saves/security_agent_v1
–per_device_train_batch_size 4
–gradient_accumulation_steps 4
–lr_scheduler_type cosine
–logging_steps 10
–save_steps 100
–learning_rate 5e-5
–num_train_epochs 3.0
–plot_loss
–fp16

四、关键指标：如何看懂“炼丹炉”里的 Loss 曲线

在训练过程中，你会看到一个不断下降的 Loss（损失值）曲线。

理想曲线：平稳下降，最后在某个数值（如 0.5 - 1.2 之间）开始横向震荡。

警报曲线：Loss 突然降到 0（过拟合，模型只会背书）或者 Loss 突然飙升（梯度爆炸，模型疯了）。

对策：如果 Loss 不降，调大 learning_rate；如果 Loss 波动太大，调小 learning_rate 并增大 batch_size。

五、避坑指南：显存溢出的“救命稻草”

如果你运行报错 OutOfMemoryError：

开启量化：使用 --quantization_bit 4。

降低长度：将 --cutoff_len 从 1024 降到 512。

梯度检查点：确保开启了 --gradient_checkpointing。

从零开始：在本地搭建一个带知识库的 AI 助手（Ollama + Open WebUI）

一文讲清楚：要选哪些工具、需要什么环境、整体架构长什么样，以及一步步实现到能用的程度。一、为什么要在本地搭一个 AI 助手？过去一年，大模型从“新奇玩意儿”迅速变成“日常生产力工具”。但如果你只用网页版 ChatGPT / 文心一言 / 通义千问，会碰到几个很现实的问题： * 数据隐私：公司内部文档、个人笔记、聊天记录，你敢全部塞到线上吗？ * 网络依赖：在飞机上、高铁里，或者公司内网严格管控时，在线 AI 直接“失联”。 * 额度与费用：免费额度有限，稍微重度一点就要付费，而且你也不知道自己的数据会不会被拿去训练。本地部署一套 “AI + 知识库” 的好处就非常直观： 1. 数据完全不出本地，满足隐私合规要求。 2. 断网也能用，随时随地调取你的“第二大脑”。 3. 可定制：可以给团队搭一个“

如何彻底释放LG WebOS电视潜能：第三方应用完全指南

智能电视用户的新选择【免费下载链接】webos-homebrew-channelUnofficial webOS TV homebrew store and root-related tooling 项目地址: https://gitcode.com/gh_mirrors/we/webos-homebrew-channel 你是否曾对LG WebOS智能电视的官方应用商店感到失望？应用数量有限、功能单一、无法安装第三方工具...这些问题困扰着无数智能设备用户。传统的官方渠道限制了电视的真正潜力，让价值数千元的智能设备变成了"智能"的摆设。 WebOS Homebrew Channel正是为解决这些问题而生。作为非官方的应用商店，它打破了LG WebOS智能电视的应用安装限制，让你能够自由安装各种第三方应用程序，真正释放智能电视的全部潜能。核心功能解析：为什么选择Homebrew Channel 独立应用仓库系统 WebOS Homebrew Channel提供了一个完全独立的WebOS软件包仓库，支持家庭酿造应用的发现、安装和更新。更重要的是，它支持多个外部仓库，

玩转ClaudeCode：使用Figma-MCP编写前端代码1:1还原UI设计图

目录本轮目标具体实践一、开启 Figma 的 MCP 服务器二、Claude Code 连接 Figma MCP 三、Claude Code 代码实现 Figma 设计稿本轮目标本轮目标是制作数字化大屏的一个前端组件，要求和UI设计图还原度达到1:1。本轮目标需要我们提前准备好figma客户端，且登录帐号具有开发模式的权限（没有可以去某夕）。Claude Code 就不必多说，没有安装的同学参考我的上一篇文章《玩转ClaudeCode：ClaudeCode安装教程（Windows+Linux+MacOS）》完成安装，通过专属链接注册，可以额外领取100美金的免费使用额度。安装教程参考：玩转ClaudeCode：ClaudeCode安装教程（Windows+Linux+MacOS）_claude code安装-ZEEKLOG博客文章浏览阅读2.5w次，点赞67次，

Windows下载、安装并运行MinIO，访问WebUI界面

MinIO MinIO 是一款基于 Apache License v2.0 开源协议的对象存储服务，兼容 Amazon S3 云存储服务接口，可用于存储海量非结构化数据（如图片、视频、日志文件等）。本教程针对 Windows 系统搭建本地 MinIO 服务，适合开发测试、小型项目部署场景。下载MinIO 官网下载访问MinIO中文官网或MinIO英文官网，根据读者的操作系统选择相应的操作系统版本点击MinIO Server/AIStor Server和MinIO Client/AIStor Client的Download按钮下载对应文件。说明：两版官网域名不同，Server/Client 的文字标题有差异，但下载文件一致；中文官网下载速度更快，优先推荐。网盘下载通过网盘分享的文件：Minio 链接: https://pan.baidu.com/s/

一、 环境搭建：打造你的“炼丹炉”

二、 准备食材：注册你的“行业黑话”数据集

三、 点火炼丹：WebUI 模式与脚本模式

四、 关键指标：如何看懂“炼丹炉”里的 Loss 曲线

五、 避坑指南：显存溢出的“救命稻草”

Read more