Windows 系统安装并编译 llama.cpp 步骤详解

Windows 环境下编译运行 llama.cpp 需要配置 Visual Studio、CMake 及可选的 CUDA 工具包。首先下载并安装 C++ 桌面开发组件，随后安装 CMake 构建工具。若需 GPU 加速则安装 CUDA Toolkit，联网下载模型需安装 curl。通过 vcpkg 管理依赖后克隆 llama.cpp 源码，使用 cmake 指定构建目录并开启 CUDA 与 CURL 支持进行 Release 模式编译。最终生成的可执行文件位于 build/bin/Release 目录中即可开始使用。

字节跳动发布于 2026/4/5更新于 2026/4/264 浏览

一、下载 Visual Studio

下载 Visual Studio Tools

选择 C++ 桌面开发。

二、下载 CMake

Download CMake

三、下载 CUDA Toolkits（需要 GPU 加速可选）

CUDA Toolkit

四、安装 Curl（需要联网下载模型可选）

git clone https://github.com/microsoft/vcpkg.git
cd vcpkg
.\bootstrap-vcpkg.bat
.\vcpkg install curl:x64-windows

需手动新建模型下载目录：C:\Users\Administrator\AppData\Local\llama.cpp

五、下载 llama.cpp 源代码并编译

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
cmake -B build -DGGML_CUDA=ON -DLLAMA_CURL=ON
cmake --build build --config Release

-B build：指定构建目录为 ./build。
-DGGML_CUDA=ON：启用 CUDA 支持（需已安装 CUDA 工具包）。
-DLLAMA_CURL=ON：启用 CURL 支持（需已安装 curl）。

六、开始使用

进入 build\bin\Release 目录开始使用 llama。

Windows 系统安装并编译 llama.cpp 步骤详解

一、下载 Visual Studio

二、下载 CMake

三、下载 CUDA Toolkits（需要 GPU 加速可选）

四、安装 Curl（需要联网下载模型可选）

五、下载 llama.cpp 源代码并编译

六、开始使用

更多推荐文章

相关免费在线工具

更多推荐文章

相关免费在线工具

Windows 系统安装并编译 llama.cpp 步骤详解

一、下载 Visual Studio

二、下载 CMake

三、下载 CUDA Toolkits（需要 GPU 加速可选）

四、安装 Curl（需要联网下载模型可选）

五、下载 llama.cpp 源代码并编译

六、开始使用

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具