Windows 环境下编译部署 llama.cpp
在本地编译运行 llama.cpp 不仅能更好地控制模型推理环境,还能避免云端调用的延迟。下面咱们一步步来,把开发环境搭好。
一、环境准备
编译前需要准备好 C++ 工具链和构建系统。推荐两种方案:一是使用 MinGW,二是轻量级的 w64devkit。无论选哪种,CMake 都是必须的。
1. 安装编译器
方案 A:MinGW
从 mingw-builds-binaries 下载预编译包。解压后,记得把 bin 目录加入系统环境变量,比如 E:\dev\mingw64\bin。验证一下是否生效:
g++ -v
方案 B:w64devkit
如果不想配置太多依赖,可以直接用 w64devkit。解压即用,同样需要将 bin 目录添加到环境变量中。
2. 安装 CMake
去 CMake 官网 下载 Windows x64 ZIP 版本(注意是压缩包,不是安装包)。解压后把 bin 目录加到环境变量里,然后运行 cmake --version 确认安装成功。
提示:截图显示的是解压后的目录结构,确保 bin 文件夹路径正确即可。
二、获取源码
直接用 Git 克隆官方仓库:
git clone https://github.com/ggerganov/llama.cpp
三、编译构建
现在官方已经废弃了旧的 Makefile 方式,推荐使用 CMake 构建。根据你选择的编译器,有两种生成项目的方式。
1. Visual Studio 方案
如果你电脑上装了 Visual Studio,这是兼容性最好的选择。进入 build 目录执行:
cd path/llama.cpp
mkdir build
cd build
cmake .. -G "Visual Studio 17 2022" -A x64 -DLLAMA_CURL=OFF
cmake --build . --config Release
2. MinGW 方案
如果使用刚才配置的 MinGW 或 w64devkit,命令略有不同:
cd path/llama.cpp
mkdir build
cd build
cmake .. -G "MinGW Makefiles" -DLLAMA_CURL=OFF
cmake --build . --config Release
注意:上面的
path/llama.cpp请替换为你实际的克隆路径。-DLLAMA_CURL=OFF是为了减少依赖,如果后续需要网络功能可以改为 ON。

