跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
博客列表
PythonAI算法

LLaMA-Factory 本地环境搭建与安装指南

LLaMA-Factory 本地部署涉及环境准备、依赖安装及验证步骤。首先确认 GPU 与 CUDA 兼容性,接着在 WSL Ubuntu 环境下配置 PyTorch 对应版本。随后克隆仓库并安装依赖,最后通过命令行启动 WebUI 界面进行模型微调。整个过程需确保 Python 与编译工具链完整。

kaikai发布于 2026/3/21更新于 2026/5/66 浏览
LLaMA-Factory 本地环境搭建与安装指南

环境准备

本次实践基于 WSL Ubuntu 环境,硬件为双 RTX 3090。主要依赖版本如下:

  • Python: 3.12.4
  • Conda: 24.5.0
  • CUDA: 12.4
  • Torch: 2.6.0

前置检查

安装前需确认 GPU 支持 CUDA。在终端执行以下命令查看系统架构与发行版信息:

uname -m && cat /etc/*release

同时确保已安装 gcc 编译器,输入 gcc --version 验证输出是否正常。

安装 PyTorch

根据 CUDA 版本选择对应的 PyTorch 构建。对于 CUDA 12.4,推荐使用以下指令:

pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu124

注意:若使用其他 CUDA 版本,请替换 cu124 为相应标识(如 cu118)。

验证环境

安装完成后,先通过 conda list 查看包列表,确认 Torch 版本无误。接着进入 Python 交互模式检查 CUDA 支持:

import torch
print(torch.version.cuda)

部署 LLaMA-Factory

克隆官方仓库并安装依赖。为了减少网络请求,建议仅获取最新提交:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

安装结束后,运行以下命令校验版本信息:

llamafactory-cli version

看到版本号即表示安装成功。

启动 WebUI

LLaMA-Factory 提供零代码微调的可视化界面。在项目根目录下执行:

llamafactory-cli webui

服务将启动在 http://127.0.0.1:7860。默认仅限本机访问,如需远程连接,可配合内网穿透工具使用。

目录

  1. 环境准备
  2. 前置检查
  3. 安装 PyTorch
  4. 验证环境
  5. 部署 LLaMA-Factory
  6. 启动 WebUI
  • 💰 8折买阿里云服务器限时8折了解详情
  • GPT-5.5 超高智商模型1元抵1刀ChatGPT中转购买
  • 代充Chatgpt Plus/pro 帐号了解详情
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Java 直播商城架构规划与常见营销模式解析
  • Spring AI 核心亮点拆解与实战指南
  • MCP 协议详解:与 Function Call 的区别及使用方法
  • nanobot 轻量级 AI Agent 框架搭建 QQ 机器人实践与开源贡献
  • GitHub 热门项目日榜 (2026-03-01)
  • PyMAVLink 无人机通信 Python 库使用指南
  • HarmonyOS6 RcList 组件核心架构与类型系统设计
  • OpenWrt Docker 管理插件 luci-app-dockerman 使用指南
  • AI 大模型应用开发体系化学习路线与实战指南
  • OpenClaw Mac 安装与配置 API 教程
  • CLAUDE.md 与 AGENTS.md 配置文件完全指南
  • 双显卡环境下 LLaMA-Factory 大模型微调环境搭建
  • 轻量 4B 模型视频理解实测:Qwen3-VL-WEBUI 部署与效果
  • @anthropic-ai/claude-code 安装报错 Node.js 版本过低解决方法
  • VRCT 使用指南:VRChat 跨语言交流工具配置与功能解析
  • OpenClaw 深度解析:从个人 AI 助理到开源智能体平台
  • Electron 桌面应用开发指南:7 天入门实战
  • 【JWT】JWT(JSON Web Token)结构化知识体系(完整版)
  • VS Code + GitHub Copilot 避坑指南:从安装配置到最佳实践
  • Dify Web 前端二次开发:隐藏探索功能与替换 Logo

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online