Windows 环境下编译部署 llama.cpp

在本地编译运行 llama.cpp 不仅能更好地控制模型推理环境，还能避免云端调用的延迟。下面咱们一步步来，把开发环境搭好。

编译前需要准备好 C++ 工具链和构建系统。推荐两种方案：一是使用 MinGW，二是轻量级的 w64devkit。无论选哪种，CMake 都是必须的。

方案 A：MinGW 从 mingw-builds-binaries 下载预编译包。解压后，记得把 bin 目录加入系统环境变量，比如 E:\dev\mingw64\bin。验证一下是否生效：

g++ -v

方案 B：w64devkit 如果不想配置太多依赖，可以直接用 w64devkit。解压即用，同样需要将 bin 目录添加到环境变量中。

去 CMake 官网下载 Windows x64 ZIP 版本（注意是压缩包，不是安装包）。解压后把 bin 目录加到环境变量里，然后运行 cmake --version 确认安装成功。

提示：截图显示的是解压后的目录结构，确保 bin 文件夹路径正确即可。

直接用 Git 克隆官方仓库：

git clone https://github.com/ggerganov/llama.cpp

现在官方已经废弃了旧的 Makefile 方式，推荐使用 CMake 构建。根据你选择的编译器，有两种生成项目的方式。

如果你电脑上装了 Visual Studio，这是兼容性最好的选择。进入 build 目录执行：

cd path/llama.cpp
mkdir build
cd build
cmake .. -G "Visual Studio 17 2022" -A x64 -DLLAMA_CURL=OFF
cmake --build . --config Release

如果使用刚才配置的 MinGW 或 w64devkit，命令略有不同：

cd path/llama.cpp
mkdir build
cd build
cmake .. -G "MinGW Makefiles" -DLLAMA_CURL=OFF
cmake --build . --config Release

注意：上面的 path/llama.cpp 请替换为你实际的克隆路径。-DLLAMA_CURL=OFF 是为了减少依赖，如果后续需要网络功能可以改为 ON。

更多推荐文章