LLaMA-Factory安装教程（详细版）

优质文章学习记录

10 Apr 2026 — 3 min read

本机显卡双3090

使用wsl中ubuntu

torch==2.6.0

conda==24.5.0

cuda==12.4

python==3.12.4（python安装不做赘述，有需要我会另开一篇文章）

一、准备工作

首先，在 https://developer.nvidia.com/cuda-gpus 查看您的 GPU 是否支持CUDA。

保证当前 Linux 版本支持CUDA. 在命令行中输入

 uname -m && cat /etc/*release

输出如下，不一定完全一样，类似即可

检查是否安装了 gcc . 在命令行中输入 gcc --version ，应当看到类似的输出

二、pytorch和cuda安装

使用官网版本2.6.0 官网链接：Previous PyTorch Versions 箭头一栏可以看到历史版本

根据其指令安装对应版本

# ROCM 6.1 (Linux only) pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/rocm6.1 # ROCM 6.2.4 (Linux only) pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/rocm6.2.4 # CUDA 11.8 pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu118 # CUDA 12.4 pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu124 # CUDA 12.6 pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu126 # CPU only pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cpu

三、校检torch和cuda版本

安装完查看自己的torch版本

conda list

cuda版本则需要进入python

import torch print(torch.version.cuda)

四、LLaMA-Factory 安装

运行以下指令以安装 LLaMA-Factory 及其依赖:

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git cd LLaMA-Factory pip install -e ".[torch,metrics]"

五、LLaMA-Factory 校验

完成安装后，可以通过使用以下命令。

llamafactory-cli version

如果您能成功看到类似下面的界面，就说明安装成功了。

六、LLaMA-Factory 网页版

LLaMA-Factory 支持通过 WebUI 零代码微调大语言模型。在完成安装后，通过以下指令进入 WebUI:

llamafactory-cli webui

其中 http://127.0.0.1:7860就是你的可视化网址。

注：该网址只限于本机使用，如需联网多人服务器使用则需使用内网穿透。

ps.需要更详细的LLaMA-Factory参数详解，请点击关注催更留言，觉得内容不错留个赞再走吧，您的认可就是我更新的动力。

（长期有效）接入第三方 OpenAI 兼容模型到 GitHub Copilot

目前 GitHub Copilot 仅支持接入国外的几家模型提供商，无法直接调用 OpenAI 兼容的自定义 API 进行扩展。参考相关解决方案，我总结了一下Copilot中接入OpenAI 兼容 API 的方法。实现方法主要分为两种：方案一：修改 Copilot Chat 源代码在模型选择器中新增自定义提供商选项。方案二：API 兼容适配将 OpenAI 兼容的自定义 API 虚拟化封装为与 Ollama 兼容的 API（运行期间占用 Ollama 端口），从而利用 Copilot 模型选择器中原生的 Ollama 选项。方法一（目前存在问题）具体做法可参考修改Copilot chat插件增加自定义模型提供商这里只说一下这个方法存在的问题： 1. 官方开源的Copilot chat插件版本通常滞后于最新版，可能存在未来兼容性问题 2.

llama.cpp性能调优指南：提升本地部署效率的全栈优化方案

llama.cpp性能调优指南：提升本地部署效率的全栈优化方案【免费下载链接】llama.cppPort of Facebook's LLaMA model in C/C++ 项目地址: https://gitcode.com/GitHub_Trending/ll/llama.cpp 在本地部署大语言模型时，启动缓慢和推理延迟是开发者最常面临的挑战。llama.cpp作为轻量级C/C++实现的开源项目，虽然具备高效运行能力，但默认配置下仍可能出现启动时间过长、资源利用率不足等问题。本文将通过问题诊断、核心原理解析、分层优化策略、场景适配方案和效果验证方法，帮助开发者系统性提升llama.cpp的部署效率，实现模型启动速度3倍以上提升和推理性能的显著优化。问题诊断：llama.cpp性能瓶颈识别在进行优化前，首先需要准确识别性能瓶颈。llama.cpp的启动和运行过程涉及多个环节，任何一个环节的配置不当都可能导致性能问题。启动时间过长的典型表现启动阶段常见问题包括模型加载缓慢、

Whisper 模型本地化部署：全版本下载链接与离线环境搭建教程

Whisper 模型本地化部署指南一、模型版本与下载 Whisper 提供多种规模版本，可通过以下官方渠道获取： 1. GitHub 仓库 https://github.com/openai/whisper 包含最新代码、预训练权重和文档 * tiny.en / tiny * base.en / base * small.en / small * medium.en / medium * large-v2 (最新大模型) Hugging Face 模型库所有版本下载路径： https://huggingface.co/openai/whisper-{version}/tree/main 替换 {version} 为具体型号：二、离线环境搭建教程准备工作 1.

AIGC时代——语义化AI驱动器：提示词的未来图景与技术深潜

文章目录 * 一、技术范式重构：从指令集到语义认知网络 * 1.1 多模态语义解析器的进化路径 * 1.2 提示词工程的认知分层 * 二、交互革命：从提示词到意图理解 * 2.1 自然语言交互的认知进化 * 2.2 专业领域的认知增强 * 三、未来技术图谱：2025-2030演进路线 * 3.1 2025年关键突破 * 3.2 2027年技术里程碑 * 3.3 2030年技术愿景 * 四、伦理与治理：构建可信语义化AI * 4.1 动态伦理约束框架 * 4.2 提示词审计系统 * 五、开发者能力升级路线图 * 5.1 核心技能矩阵 * 5.2 典型学习路径 * 结语 * 《驱动AI：