Windows 7 编译运行 llama.cpp 部署 Qwen3 模型 | 极客日志

C++AI算法

Windows 7 编译运行 llama.cpp 部署 Qwen3 模型

介绍在 Windows 7 系统下通过本地编译 llama.cpp 并运行 Qwen3 大模型的完整流程。步骤包括准备 w64devkit 和 CMake 环境，克隆源码并替换特定 httplib.h 文件，配置 CMake 生成编译任务，执行编译生成服务器程序，最后通过浏览器访问本地服务进行对话。该方案解决了旧系统无法直接运行新版软件的问题，强调关闭杀毒软件以避免编译错误。

云朵棉花糖发布于 2026/4/5更新于 2026/7/2663 浏览

Windows 7 编译运行 llama.cpp 部署 Qwen3 模型

本指南专为不支持新版软件的 Windows 7 设计，通过本地编译实现大模型运行。

📋 0. 软件版本清单

请务必确保使用以下特定版本，以保证在 Win7 下的兼容性：

软件名称	文件名 (根据截图)	作用	备注
编译环境	`w64devkit-x64-2.5.0.7z.exe`	提供 GCC 编译器	核心工具
构建工具	`cmake-3.31.10-windows-x86_64.msi`	生成编译配置	必须安装到默认路径
源码工具	`Git_for_Windows_(64bit)_v2.45.2.exe`	下载代码
浏览器	`Firefox Setup 115.30.0esr.exe`	唯一推荐	Win7 支持的最后版本，用于打开聊天界面
备用浏览器	`109.0.5414.120_chrome_installer.exe`	Chrome 109	Win7 支持的最后 Chrome 版本

📥 第一阶段：下载代码并替换 httplib.h (使用 Git Bash)

操作环境：Windows 桌面/资源管理器

准备目录：建议在 C 盘根目录 下操作，路径短，不容易出错。
打开 Git：在 C 盘空白处右键 -> 'Open Git Bash here'。
执行命令（请一行一行复制运行）：

# 1. 克隆 llama.cpp 仓库
git clone https://github.com/ggerganov/llama.cpp.git
# 2. 进入文件夹
cd llama.cpp
# 3. 【核心步骤】切换到支持 Qwen3 的特定版本 (Tag: b5092)
git checkout b5092
# 4. 【核心步骤】替换 /examples/server/httplib.h 文件

确认路径：确保代码文件夹就在 C:\llama.cpp。

🛠️ 第二阶段：准备编译环境

操作环境：w64devkit.exe 黑色终端

🛑 关闭杀毒软件 (Win7 必做)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

cd /c/llama.cpp

"C:\Program Files\CMake\bin\cmake.exe" -G "MinGW Makefiles" -DLLAMA_CURL=OFF -DLLAMA_BUILD_TESTS=OFF -DCMAKE_C_COMPILER=gcc -DCMAKE_CXX_COMPILER=g++

rm -f CMakeCache.txt 
rm -rf CMakeFiles

"C:\Program Files\CMake\bin\cmake.exe" --build . --config Release -j4

./bin/llama-server.exe --version

./bin/llama-server.exe -m "/c/models/qwen3.gguf" -c 4096 --host 0.0.0.0 --port 8080

./bin/llama-server.exe -m "/c/Users/Administrator/.ollama/models/blobs/sha256-你的文件名..." -c 4096 --host 0.0.0.0 --port 8080

Windows 7 编译运行 llama.cpp 部署 Qwen3 模型

Windows 7 编译运行 llama.cpp 部署 Qwen3 模型

📋 0. 软件版本清单

📥 第一阶段：下载代码并替换 httplib.h (使用 Git Bash)

🛠️ 第二阶段：准备编译环境

更多推荐文章

相关免费在线工具

⚙️ 第三阶段：清理与配置 (CMake)

🚀 第四阶段：执行编译

✅ 第五阶段：验证结果

🤖 第六阶段：启动 Qwen3 模型 (Win7 专用方案)

准备工作

情况 A：加载 .gguf 文件

情况 B：加载 Ollama 缓存模型

🌐 最后一步：开始对话

更多推荐文章

相关免费在线工具

Windows 7 编译运行 llama.cpp 部署 Qwen3 模型

Windows 7 编译运行 llama.cpp 部署 Qwen3 模型

📋 0. 软件版本清单

📥 第一阶段：下载代码并替换 httplib.h (使用 Git Bash)

🛠️ 第二阶段：准备编译环境

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

⚙️ 第三阶段：清理与配置 (CMake)

🚀 第四阶段：执行编译

✅ 第五阶段：验证结果

🤖 第六阶段：启动 Qwen3 模型 (Win7 专用方案)

准备工作

情况 A：加载 .gguf 文件

情况 B：加载 Ollama 缓存模型

🌐 最后一步：开始对话

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具