跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
博客列表
PythonAI算法

LLaMA-Factory 本地部署与微调环境搭建指南

综述由AI生成LLaMA-Factory 是一款开源的大模型微调工具。基于 WSL Ubuntu 环境,演示了从 CUDA、PyTorch 到 LLaMA-Factory 的完整安装流程。涵盖版本兼容性检查、依赖配置及 WebUI 启动方法,帮助开发者快速构建本地大模型训练环境。

樱花落尽发布于 2026/3/27更新于 2026/4/253 浏览
LLaMA-Factory 本地部署与微调环境搭建指南

文章配图

环境参考

本教程基于以下环境编写,实际使用时请根据硬件情况调整:

  • 操作系统:WSL Ubuntu
  • 显卡:双 RTX 3090
  • CUDA:12.4
  • Python:3.12.4
  • PyTorch:2.6.0

前置检查

开始之前,先确认你的 GPU 支持 CUDA。访问 NVIDIA 官网查看具体型号支持情况。

在终端执行以下命令核对系统架构与发行版信息:

uname -m && cat /etc/*release

输出结果应包含 Linux 发行版标识,确保内核版本符合 CUDA 要求。 文章配图

同时检查编译器是否就绪,输入 gcc --version 确认已安装 gcc。 文章配图

安装 PyTorch 与 CUDA

推荐使用官方提供的安装指令。针对 CUDA 12.4 环境,执行如下命令:

pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu124

若需其他版本(如 CPU 版或旧版 CUDA),可参考 PyTorch 历史版本页面选择对应索引地址。 文章配图 文章配图

验证环境

安装完成后,通过 conda 列表确认包版本:

conda list

文章配图

进入 Python 交互模式检查 CUDA 版本是否正确加载:

import torch
print(torch.version.cuda)

文章配图

若输出为 12.4,说明底层驱动对接正常。

部署 LLaMA-Factory

拉取项目源码并安装依赖。建议使用可编辑模式以便后续修改代码:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

这一步会下载大量依赖,耐心等待完成。

启动与测试

安装成功后,运行版本检查命令:

llamafactory-cli version

看到版本号即表示核心组件就绪。 文章配图

若要使用可视化界面进行零代码微调,直接启动 WebUI:

llamafactory-cli webui

服务启动后,浏览器访问 http://127.0.0.1:7860 即可操作。 文章配图

注意该地址默认仅限本机访问,如需远程连接,建议配合内网穿透工具使用。更多参数细节可查阅官方文档。

目录

  1. 环境参考
  2. 前置检查
  3. 安装 PyTorch 与 CUDA
  4. 验证环境
  5. 部署 LLaMA-Factory
  6. 启动与测试
  • 💰 8折买阿里云服务器限时8折了解详情
  • 💰 8折买阿里云服务器限时8折购买
  • 🦞 5分钟部署阿里云小龙虾了解详情
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • OpenClaw 汉化版部署与常见问题排查指南
  • CosyVoice 安装 openai-whisper 报错 pkg_resources 缺失的解决方案
  • VR 音游音符轨道系统开发实录与原理
  • OpenClaw Secure DM Pairing:AI 机器人安全私信访问机制构建
  • 麒麟 V10 ARM64 环境部署 WebLogic 12c 实战
  • Python 基础语法实战练习
  • 多模态 AI 如何重塑人机交互的未来
  • MySQL 基本查询与增删改查实战指南
  • 滑动窗口算法实战:最大连续 1 与最小操作数
  • ZeroClaw 本地 AI 管理面板搭建:Gateway + LM Studio + Reflex
  • 机器人轨迹规划详解:概念、空间与常用算法
  • Java 泛型深度解析:机制、边界与实战
  • 无人机 Remote ID Beacon 帧结构深度解析
  • C 语言代码优化与性能调优实战:编译器、内存与算法
  • 大模型量化详解:基于 llama.cpp
  • 边缘采集引擎:从 Python 迁移到 Go 的性能优化与实战方案
  • GitHub Copilot 插件无法加载模型问题排查
  • Go Web 开发必备理论基础
  • 飞算 JavaAI 代码审查落地实践与关键细节
  • Java 高频面试题汇总与核心解析

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online