跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
C++AI算法

Windows 环境下安装与编译 llama.cpp

综述由AI生成在 Windows 系统下配置编译环境的步骤,包括安装 mingw、w64devkit 和 CMake。随后演示了如何克隆 llama.cpp 源码,并重点讲解了使用 CMake 配合 Visual Studio 或 MinGW 进行项目构建及 Release 模式编译的具体命令,最终生成可执行程序。

全栈工匠发布于 2026/4/6更新于 2026/5/2426 浏览

Windows 环境下安装与编译 llama.cpp

1. 环境准备

1.1 安装 mingw

下载地址:mingw-builds-binaries

解压后,将 bin 目录加入环境变量,例如:E:\dev\mingw64\bin

验证安装是否成功:

g++ -v

1.2 安装 w64devkit

下载地址:w64devkit Releases

解压后,将 bin 目录添加到系统环境变量,例如:E:\dev\w64devkit\bin

1.3 安装 CMake

访问 CMake 官网,下载 Windows x64 ZIP(注意:不是安装包)。

解压后,将 bin 目录添加到环境变量,例如:E:\dev\cmake-4.0.3-windows-x86_64\bin

验证是否成功:

cmake --version

2. 克隆 llama.cpp

git clone https://github.com/ggerganov/llama.cpp

3. 编译

3.1 使用 CMake 构建(新版)

说明:llama.cpp 官方已废弃原来的 Makefile 构建方式,推荐改用 CMake 构建方式 来编译模型工具和推理引擎。

编译 llama.cpp:

如果本地有安装 Visual Studio,推荐使用 Visual Studio + CMake 进行构建(适用于 Windows 用户,兼容性最佳):

cd path/llama.cpp
mkdir build
cd build
# 使用 Visual Studio 生成项目
cmake .. -G "Visual Studio 17 2022" -A x64 -DLLAMA_CURL=OFF
# 或 使用 w64devkit 和 mingw 生成项目
cmake .. -G "MinGW Makefiles" -DLLAMA_CURL=OFF
# 编译 Release 模式
cmake --build . --config Release

如果一切正常,你会在 build/bin/Release 目录下看到生成的程序。

目录

  1. Windows 环境下安装与编译 llama.cpp
  2. 1. 环境准备
  3. 1.1 安装 mingw
  4. 1.2 安装 w64devkit
  5. 1.3 安装 CMake
  6. 2. 克隆 llama.cpp
  7. 3. 编译
  8. 3.1 使用 CMake 构建(新版)
  9. 使用 Visual Studio 生成项目
  10. 或 使用 w64devkit 和 mingw 生成项目
  11. 编译 Release 模式
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • AIStarter 一键安装 ComfyUI 黎黎原上咩 7.0 整合包教程
  • 模拟算法精选:替换问号、提莫攻击、Z 字形变换与外观数列
  • AI 时代重读《人人都是产品经理》:核心内核与产品实践
  • Llama-2-7B 昇腾 NPU 性能测评与部署优化指南
  • Flutter 在 OpenHarmony 上适配 eip55 库进行以太坊地址校验
  • AI 时代重读《人人都是产品经理》:核心内核与实战路径
  • 医疗 AI 败血症预测算法全流程实战与 Python 实现
  • 互联网就业寒冬下 Android 开发如何提升竞争力与薪资
  • 飞算 JavaAI 代码审查落地实践与关键细节
  • AI 辅助多链钱包架构设计与安全实践
  • 大模型微调方法总结:LoRA、Adapter、Prefix-tuning、P-tuning 与 Prompt-tuning
  • VR + 具身智能 + 人形机器人:构建现实世界的智能接口
  • Stable Diffusion 模型原理讲解与本地部署实践
  • Conda 环境配置报错 Solving environment: failed with repodata 解决方案
  • PHP 批量混淆加密工具:支持多级强度与纯 PHP 运行
  • 基于llama.cpp的Qwen3.5单GPU部署与股票筛选实战
  • 从 Python 到 OpenClaw:本地 AI 助理构建实战路径
  • PythonOCC 基础教程:几何建模与数据交换
  • C++ STL list 容器特性与常用接口解析
  • 免费 Trae 编辑器实测:i18n 任务排队超千位,AI 编程的边界在哪?

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online