基于 LLaMA-Factory 的大模型部署与微调实战 | 极客日志

PythonAI算法

基于 LLaMA-Factory 的大模型部署与微调实战

综述由AI生成详细记录了基于 LLaMA-Factory 框架部署及微调大模型的完整流程。涵盖 Python 环境配置、CUDA 与 PyTorch 版本匹配、仓库克隆与依赖安装。演示了从魔搭社区下载 Qwen2.5 模型并启动 WebUI 进行推理测试。重点展示了通过 Faker 库生成智能家居温控数据集、配置训练参数、执行 LoRA 微调及合并导出模型的关键步骤。针对 CUDA 版本兼容性问题提供了经验建议，确保本地化部署顺利运行。

remedios发布于 2026/4/10更新于 2026/5/2316 浏览

一、环境搭建

1. Python 环境安装

确保 Python 环境配置正确，终端输入 python 能正常启动解释器。

文章配图

2. CUDA 和 PyTorch 安装

2.1 PyTorch 安装

首先确认 CUDA 版本，PyTorch 官网提供了详细的版本对应表。建议根据硬件情况选择合适的 CUDA 版本，例如 CUDA 11.8 在稳定性上表现较好。

文章配图

使用以下命令安装对应版本的 PyTorch：

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

注意网络环境对下载速度的影响，必要时可配置镜像源。安装完成后验证如下：

文章配图

2.2 CUDA 安装

前往 NVIDIA 开发者中心下载历史版本并安装。安装成功后，终端执行以下命令检查版本：

nvcc --version

文章配图

2.3 校验

进入 Python 交互环境，依次运行以下代码确认 GPU 识别状态：

import torch
torch.cuda.current_device()
torch.cuda.get_device_name(0)
torch.__version__

文章配图

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

pip install -e '.[torch,metrics]'

llamafactory-cli version

git clone https://www.modelscope.cn/Qwen/Qwen2.5-0.5B-Instruct.git

llamafactory-cli webui

import json
import random
from faker import Faker

def generate_thermal_dataset(output_path="thermal_dataset.json"):
    """生成智能家居温度调控指令数据集"""
    fake = Faker('zh_CN')
    base_phrases = ["有点", "非常", "特别", "实在", "真的", "确实", "越来越", "稍微", "极其"]
    heat_verbs = ["热", "炎热", "火热", "酷热", "炽热", "闷热", "灼热", "滚烫", "炙热", "沸热", "炙烤", "加热", "升温", "燥热", "湿热", "高温", "暖热"]
    quantifiers = ["了", "啦", "啊", "呢", ""]
    dataset = []
    
    for _ in range(2000):
        phrase = random.choice(base_phrases)
        verb = random.choice(heat_verbs)
        quantifier = random.choice(quantifiers)
        input_text = f"我{phrase}{verb}{quantifier}"
        
        output_json = {
            "Device": "AirConditioner",
            "Status": "on"
        }
        
        dataset.append({
            "instruction": "你是一个物联网数据处理专家，需要把自然语言指令转换为 JSON 结构化数据",
            "input": input_text,
            "output": json.dumps(output_json, ensure_ascii=False),
        })
    
    with open(output_path, "w", encoding="utf-8") as f:
        json.dump(dataset, f, indent=2, ensure_ascii=False)
    print(f"数据集已生成：{output_path}")

if __name__ == "__main__":
    generate_thermal_dataset()