Windows 本地大模型工具链安装：Ollama + llama.cpp + LLaMA Factory | 极客日志

PythonAI算法

Windows 本地大模型工具链安装：Ollama + llama.cpp + LLaMA Factory

介绍在 Windows 11 环境下安装 Ollama、llama.cpp 和 LLaMA Factory 的完整流程。包括统一文件夹规划、Ollama 安装及模型路径配置、llama.cpp 编译启用 CUDA 加速、基于 Miniconda 创建 Python 虚拟环境并部署 LLaMA Factory、数据集配置方法以及一键启动脚本编写。同时涵盖常见问题排查与 GPU 监控验证，帮助用户构建本地大模型开发与推理环境。

虚拟内存发布于 2026/4/6更新于 2026/5/2228 浏览

Windows 11 本地大模型工具链安装教程：Ollama + llama.cpp + LLaMA Factory

本教程将指导你在 Windows 11 系统上，将 Ollama、llama.cpp 和 LLaMA Factory 三个工具统一安装到 E 盘，并实现 GPU 加速、数据集配置和一键启动。所有步骤均已实际验证，适用于现代 NVIDIA 显卡。

📁 1. 统一文件夹结构（推荐）

在 E 盘 创建父文件夹 LLM，用于集中管理所有相关文件。子文件夹规划如下：

E:\LLM\
├── Ollama/                # Ollama 程序安装目录
├── OllamaModels/          # Ollama 下载的模型存放目录
├── llama.cpp/             # llama.cpp 源码（git 克隆）
├── LLaMA-Factory/         # LLaMA Factory 源码（git 克隆）
├── LLaMAWork/             # 个人工作区（数据集、配置等）
│   └── datasets/          # 自定义数据集目录
└── models/                # 手动存放的 GGUF 模型文件（可选）

⚙️ 2. 安装 Ollama 并指定存储位置

2.1 下载安装包

访问 Ollama 官网，下载 OllamaSetup.exe。

2.2 自定义安装路径

以管理员身份打开命令提示符，进入安装包所在目录，执行：

OllamaSetup.exe /DIR="E:\LLM\Ollama"

2.3 设置模型存放路径

通过系统环境变量指定模型下载位置：

打开'系统属性' → '高级' → '环境变量'。
在'系统变量'中点击'新建'，变量名 OLLAMA_MODELS，变量值 E:\LLM\OllamaModels。
确定保存，并重启电脑或重启 Ollama 服务。

2.4 验证安装

打开新命令行，输入 ollama -v 查看版本。拉取一个小模型测试：

ollama run deepseek-r1:1.5b

模型应下载到 E:\LLM\OllamaModels 中。

🏗️ 3. 编译 GPU 版 llama.cpp（支持 CUDA）

3.1 安装编译工具

安装 Visual Studio 2022（社区版），勾选''工作负载。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

cd /d E:\LLM
git clone https://github.com/ggerganov/llama.cpp.git

cd llama.cpp
mkdir build
cd build
cmake .. -G "Visual Studio 17 2022" -A x64 -DGGML_CUDA=ON
cmake --build . --config Release

conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/main
conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/r
conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/msys2

conda create -n llamafactory python=3.11 -y
conda activate llamafactory

pip install torch==2.6.0 torchvision==0.21.0 --index-url https://download.pytorch.org/whl/cu124

pip install --pre torch torchvision --index-url https://download.pytorch.org/whl/nightly/cu124

python -c "import torch; print(torch.cuda.is_available())"

cd /d E:\LLM
git clone https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory
pip install -e .[torch,metrics]

python -c "import llamafactory; print('OK')"

[
  {"instruction": "计算 2+2", "input": "", "output": "4"},
  {"instruction": "解释机器学习", "input": "", "output": "机器学习是..."}
]

{
  "my_dataset": {
    "file_name": "my_data.json",
    "formatting": "alpaca",
    "columns": {
      "prompt": "instruction",
      "query": "input",
      "response": "output"
    }
  }
}

conda activate llamafactory
where python

@echo off
title LLaMA Factory WebUI
REM 虚拟环境的 Python 解释器绝对路径
set VENV_PYTHON=D:\WorkApp\Python\miniconda3\envs\llamafactory\python.exe
REM LLaMA Factory 源码目录
set SRC=E:\LLM\LLaMA-Factory
cd /d %SRC%
"%VENV_PYTHON%" -m llamafactory.cli webui --server-port 7861
pause

conda activate base
pip uninstall llamafactory -y

load_tensors: offloading 27 repeating layers to GPU
load_tensors: offloaded 29/29 layers to GPU

nvidia-smi -l 1

# 安装：pip install nvitop
# 运行：nvitop

Windows 本地大模型工具链安装：Ollama + llama.cpp + LLaMA Factory

Windows 11 本地大模型工具链安装教程：Ollama + llama.cpp + LLaMA Factory

📁 1. 统一文件夹结构（推荐）

⚙️ 2. 安装 Ollama 并指定存储位置

2.1 下载安装包

2.2 自定义安装路径

2.3 设置模型存放路径

2.4 验证安装

🏗️ 3. 编译 GPU 版 llama.cpp（支持 CUDA）

3.1 安装编译工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 下载源码

3.3 编译（启用 CUDA 支持）

3.4 验证 GPU 支持

🐍 4. 安装 LLaMA Factory（基于 Python 3.11）

4.1 安装 Miniconda

4.2 接受 Anaconda 服务条款（必须执行）

4.3 创建 Python 3.11 虚拟环境并激活

4.4 安装 PyTorch（RTX 50 系列显卡需使用特定版本）

4.5 获取 LLaMA Factory 源码

4.6 安装 LLaMA Factory（开发模式）

🧪 5. 配置数据集（WebUI 中显示）

5.1 准备数据集文件

5.2 创建 dataset_info.json

5.3 在 WebUI 中使用

🚀 6. 一键启动脚本（终极版）

6.1 确定虚拟环境 Python 路径

6.2 创建批处理脚本

6.3 运行

❓ 7. 常见问题及解决方法

7.1 conda 命令找不到

7.2 conda 提示'Terms of Service have not been accepted'

7.3 虚拟环境中运行 llamafactory-cli 找不到命令

7.4 安装时提示'requires a different Python: 3.10.20 not in '>=3.11.0''

7.5 WebUI 中数据集不显示

7.6 base 环境能运行但虚拟环境不能

🧹 8. 清理 base 环境中的残留（可选）

✅ 9. 验证 GPU 是否正常工作

9.1 查看 llama.cpp 日志

9.2 使用 nvidia-smi 监控

📝 10. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

5.2 创建 `dataset_info.json`

7.3 虚拟环境中运行 `llamafactory-cli` 找不到命令