Windows 本地大模型工具链安装指南：Ollama + llama.cpp + LLaMA Factory | 极客日志

PythonAI算法

Windows 本地大模型工具链安装指南：Ollama + llama.cpp + LLaMA Factory

在 Windows 11 系统上部署本地大模型工具链的完整流程，包括 Ollama 的安装与模型路径配置、基于 CUDA 的 llama.cpp 编译方法、以及 LLaMA Factory 的 Python 虚拟环境搭建与微调功能启用。内容涵盖数据集格式准备、WebUI 启动脚本编写及常见问题排查，旨在帮助用户构建支持 GPU 加速的本地大模型开发与推理环境。

安卓系统发布于 2026/4/6更新于 2026/5/2025 浏览

Windows 11 本地大模型工具链安装指南：Ollama + llama.cpp + LLaMA Factory

本教程将指导你在 Windows 11 系统上，将 Ollama、llama.cpp 和 LLaMA Factory 三个工具统一安装到 E 盘，并实现 GPU 加速、数据集配置和一键启动。所有步骤均已实际验证，适用于现代 NVIDIA 显卡。

1. 统一文件夹结构（推荐）

在 E 盘 创建父文件夹 LLM，用于集中管理所有相关文件。子文件夹规划如下：

E:\LLM\
├── Ollama\              # Ollama 程序安装目录
├── OllamaModels\        # Ollama 下载的模型存放目录
├── llama.cpp\           # llama.cpp 源码（git 克隆）
├── LLaMA-Factory\       # LLaMA Factory 源码（git 克隆）
├── LLaMAWork\           # 个人工作区（数据集、配置等）
│   └── datasets\        # 自定义数据集目录
└── models\              # 手动存放的 GGUF 模型文件（可选）

2. 安装 Ollama 并指定存储位置

2.1 下载安装包

访问 Ollama 官网，下载 OllamaSetup.exe。

2.2 自定义安装路径

以管理员身份打开命令提示符，进入安装包所在目录，执行：

OllamaSetup.exe /DIR="E:\LLM\Ollama"

2.3 设置模型存放路径

通过系统环境变量指定模型下载位置：

打开'系统属性' → '高级' → '环境变量'。
在'系统变量'中点击'新建'，变量名 OLLAMA_MODELS，变量值 E:\LLM\OllamaModels。
确定保存，并重启电脑或重启 Ollama 服务。

2.4 验证安装

打开新命令行，输入 ollama -v 查看版本。拉取一个小模型测试：

ollama run deepseek-r1:1.5b

模型应下载到 E:\LLM\OllamaModels 中。

3. 编译 GPU 版 llama.cpp（支持 CUDA）

3.1 安装编译工具

安装 Visual Studio 2022（社区版），勾选'使用 C++ 的桌面开发'工作负载。
安装，并确保添加到系统 PATH。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

cd /d E:\LLM
git clone https://github.com/ggerganov/llama.cpp.git

cd llama.cpp
mkdir build
cd build
cmake .. -G "Visual Studio 17 2022" -A x64 -DGGML_CUDA=ON
cmake --build . --config Release

conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/main
conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/r
conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/msys2

conda create -n llamafactory python=3.11 -y
conda activate llamafactory

pip install torch==2.6.0 torchvision==0.21.0 --index-url https://download.pytorch.org/whl/cu124

pip install --pre torch torchvision --index-url https://download.pytorch.org/whl/nightly/cu124

python -c "import torch; print(torch.cuda.is_available())"

cd /d E:\LLM
git clone https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory
pip install -e .[torch,metrics]

python -c "import llamafactory; print('OK')"

[
  {"instruction": "计算 2+2", "input": "", "output": "4"},
  {"instruction": "解释机器学习", "input": "", "output": "机器学习是..."}
]

{
  "my_dataset": {
    "file_name": "my_data.json",
    "formatting": "alpaca",
    "columns": {
      "prompt": "instruction",
      "query": "input",
      "response": "output"
    }
  }
}

conda activate llamafactory
where python

@echo off
title LLaMA Factory WebUI
REM 虚拟环境的 Python 解释器绝对路径
set VENV_PYTHON=D:\WorkApp\Python\miniconda3\envs\llamafactory\python.exe
REM LLaMA Factory 源码目录
set SRC=E:\LLM\LLaMA-Factory
cd /d %SRC%
"%VENV_PYTHON%" -m llamafactory.cli webui --server-port 7861
pause

conda activate base
pip uninstall llamafactory -y

load_tensors: offloading 27 repeating layers to GPU
load_tensors: offloaded 29/29 layers to GPU

nvidia-smi -l 1

pip install nvitop
nvitop

Windows 本地大模型工具链安装指南：Ollama + llama.cpp + LLaMA Factory

Windows 11 本地大模型工具链安装指南：Ollama + llama.cpp + LLaMA Factory

1. 统一文件夹结构（推荐）

2. 安装 Ollama 并指定存储位置

2.1 下载安装包

2.2 自定义安装路径

2.3 设置模型存放路径

2.4 验证安装

3. 编译 GPU 版 llama.cpp（支持 CUDA）

3.1 安装编译工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 下载源码

3.3 编译（启用 CUDA 支持）

3.4 验证 GPU 支持

4. 安装 LLaMA Factory（基于 Python 3.11）

4.1 安装 Miniconda

4.2 接受 Anaconda 服务条款（必须执行）

4.3 创建 Python 3.11 虚拟环境并激活

4.4 安装 PyTorch（RTX 系列显卡需使用特定版本）

4.5 获取 LLaMA Factory 源码

4.6 安装 LLaMA Factory（开发模式）

5. 配置数据集（WebUI 中显示）

5.1 准备数据集文件

5.2 创建 dataset_info.json

5.3 在 WebUI 中使用

6. 一键启动脚本（稳定版）

6.1 确定虚拟环境 Python 路径

6.2 创建批处理脚本

6.3 运行

7. 常见问题及解决方法

7.1 conda 命令找不到

7.2 conda 提示'Terms of Service have not been accepted'

7.3 虚拟环境中运行 llamafactory-cli 找不到命令

7.4 安装时提示'requires a different Python: 3.10.20 not in '>=3.11.0''

7.5 WebUI 中数据集不显示

7.6 base 环境能运行但虚拟环境不能

8. 清理 base 环境中的残留（可选）

9. 验证 GPU 是否正常工作

9.1 查看 llama.cpp 日志

9.2 使用 nvidia-smi 监控

10. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

5.2 创建 `dataset_info.json`

7.3 虚拟环境中运行 `llamafactory-cli` 找不到命令