旧电脑 Win7 复活计划:编译与运行 llama.cpp (Qwen3版)

旧电脑 Win7 复活计划:编译与运行 llama.cpp (Qwen3版)

🦕 旧电脑 Win7 复活计划:编译与运行 llama.cpp (Qwen3版)

这份指南专为不支持新版软件的 Windows 7 设计,通过本地编译实现大模型运行。

手动编译可以获得最好的性能,不想自己手动编译 可以直接使用下面编译好的bin文件,同时包含下面用到的相关软件和替换文件httplib.h
链接:https://pan.quark.cn/s/2c5f627c93d7
提取码:cSJh

📋 0. 软件版本清单

请务必确保使用以下特定版本,以保证在 Win7 下的兼容性:

软件名称文件名 (根据截图)作用备注
编译环境w64devkit-x64-2.5.0.7z.exe提供 GCC 编译器核心工具
构建工具cmake-3.31.10-windows-x86_64.msi生成编译配置必须安装到默认路径
源码工具Git_for_Windows_(64bit)_v2.45.2.exe下载代码
浏览器Firefox Setup 115.30.0esr.exe唯一推荐Win7 支持的最后版本,用于打开聊天界面
备用浏览器109.0.5414.120_chrome_installer.exeChrome 109Win7 支持的最后 Chrome 版本

📥 第一阶段:下载代码并替换httplib.h (使用 Git Bash)

操作环境:Windows 桌面/资源管理器

  1. 准备目录:建议在 C 盘根目录 下操作,路径短,不容易出错。
  2. 打开 Git:在 C 盘空白处右键 -> “Open Git Bash here”
  3. 执行命令(请一行一行复制运行):
# 1. 克隆 llama.cpp 仓库git clone https://github.com/ggerganov/llama.cpp.git # 2. 进入文件夹cd llama.cpp # 3. 【核心步骤】切换到支持 Qwen3 的特定版本 (Tag: b5092)git checkout b5092 # 4. 【核心步骤】替换 /examples/server/httplib.h 文件 夸克网盘自取 
  1. 确认路径:确保代码文件夹就在 C:\llama.cpp

🛠️ 第二阶段:准备编译环境

操作环境w64devkit.exe 黑色终端

  1. 🛑 关闭杀毒软件 (Win7 必做)
    • 请务必彻底退出 360、腾讯管家、金山毒霸等。
    • 原因:Win7 下这些软件会拦截编译器生成的 conftest.exe 等临时文件,直接导致 Access Violation 报错。
  2. 启动编译终端
    • 解压 w64devkit-x64-2.5.0.7z.exe
    • 双击运行文件夹内的 w64devkit.exe
    • 在黑框中输入以下命令(注意路径写法):

进入代码目录

cd /c/llama.cpp 

⚙️ 第三阶段:清理与配置 (CMake)

操作环境w64devkit.exe 黑色终端

    • 直接复制下面这行长命令运行:
    • 成功标志:屏幕滚动后显示 Generating done

生成配置文件 (Win7 专用修复版)

"C:\Program Files\CMake\bin\cmake.exe". -G "MinGW Makefiles" -DLLAMA_CURL=OFF -DLLAMA_BUILD_TESTS=OFF -DCMAKE_C_COMPILER=gcc -DCMAKE_CXX_COMPILER=g++ 

清理环境 (防止旧缓存报错)

rm -f CMakeCache.txt rm -rf CMakeFiles 

🚀 第四阶段:执行编译

操作环境w64devkit.exe 黑色终端

    • -j4 表示使用 4 线程加速,如果电脑配置极低可改为 -j2
  1. 等待完成
    • 耐心等待进度条走到 [100%]
    • 编译完成后,bin 文件夹下会出现 llama-server.exe

开始编译

"C:\Program Files\CMake\bin\cmake.exe" --build . --config Release -j4 

✅ 第五阶段:验证结果

    • 在当前终端输入:
    • 看到 commit d3bd719 字样即为成功。

检查版本

./bin/llama-server.exe --version 

🤖 第六阶段:启动 Qwen3 模型 (Win7 专用方案)

Win7 的 CMD 窗口无法很好地显示聊天文字,必须使用浏览器模式

准备工作

  • 安装 Firefox 115 ESR (Firefox Setup 115.30.0esr.exe)。这是 Win7 下最稳定、兼容性最好的现代浏览器。

情况 A:加载 .gguf 文件

假设模型文件在 C:\models\qwen3.gguf

    • -c 4096: 上下文长度。如果内存大于 16G,可以设为 8192 或更高。

启动命令

./bin/llama-server.exe -m "/c/models/qwen3.gguf" -c 4096 --host 0.0.0.0 --port 8080

情况 B:加载 Ollama 缓存模型

如果你用 Ollama 下载过 Qwen3,可以直接利用它的缓存文件(无需转换)。

  1. 找到 Blob 文件
    • 路径:C:\Users\你的用户名\.ollama\models\blobs
    • 找到最大的那个文件(例如 sha256-abc1234...)。

启动命令

./bin/llama-server.exe -m "/c/Users/Administrator/.ollama/models/blobs/sha256-你的文件名..." -c 4096 --host 0.0.0.0 --port 8080

🌐 最后一步:开始对话

  1. 当黑框显示 HTTP server listening 时,保持黑框开启(不要关闭)。
  2. 打开 Firefox 115 浏览器。
  3. 地址栏输入:http://127.0.0.1:8080
  4. 界面加载后,即可在浏览器中与 Qwen3 流畅对话!
在这里插入图片描述

Read more

【AI领域】OpenClaw 实战指南:手把手教你更新大模型

【AI领域】OpenClaw 实战指南:手把手教你更新大模型

OpenClaw 作为轻量高效的 AI Agent 调度平台,凭借灵活的扩展性成为开发者连接多模型的首选工具。但官方默认配置仅支持有限接口,对于追求低成本、高稳定性的开发者来说,接入第三方 API是更优解 —— 不仅能大幅降低 token 消耗,还能规避网络环境限制,无缝适配 Claude 全系列模型。本文将从「配置逻辑→实操步骤→问题排查」全程拆解,即使是新手也能快速上手。 一、前置准备 1. 已安装 OpenClaw(版本 ≥ 1.8.0,低于该版本请先执行 brew upgrade openclaw 升级); 2. 已获取  API Key(【Claude】获取Claude API Key的多种方式全攻略:从入门到精通,再到详解教程!); 3. 熟悉基础的

AI 单词别读错了!Gemini 到底该怎么读?

很多人第一次见到 Gemini,都会念成: * “鸡米你”? * “杰么你”? * “杰摸奶”? 结果让国外同事听了,忍不住笑场 😅 其实它的标准美式发音是 /ˈdʒɛmɪˌnaɪ/,中文谐音:杰米奶。 程序员虽然不靠口语,但常见 AI 单词还是希望能读对一点,交流就更顺畅啦。今天整理一份 美式发音 + 中文谐音速查表,帮大家避免尴尬发音。 🔹 常见 AI 模型 / 公司 单词美式音标中文谐音GPT/ˌdʒiː.piːˈtiː/吉屁踢ChatGPT/tʃæt ˌdʒiː.piːˈtiː/恰特 吉屁踢OpenAI/ˌoʊpənˈeɪˌaɪ/欧喷 诶艾Anthropic/ænˈθrɑːpɪk/安丝弱匹克Claude/klɔːd/克牢德DeepSeek/ˈdiːp siːk/迪普西克LLaMA/ˈlɑːmə/拉马Mistral/ˈmɪstrəl/米丝丑Gemini/ˈdʒɛmɪˌnaɪ/杰米奶Copilot/

AI三分钟第1弹|3分钟学会给Cursor配置代理

AI三分钟第1弹|3分钟学会给Cursor配置代理 文章目录 * AI三分钟第1弹|3分钟学会给Cursor配置代理 * 正文 * 拿去用 * 讲清楚 * 记住它 * 结语 * 引用 * 版权信息 什么是AI三分钟? 《AI三分钟》专栏旨在提供短小精悍的AI工具使用技巧或者知识 在这个时间碎片化、知识碎片化的时代 用最精炼的语言和最生动的故事 3分钟完成一项干货的科普 正文 拿去用 方法一:直接用博主的配置文件(推荐) 1. 打开Cursor,按 Cmd + Shift + P(Mac)或 Ctrl + Shift + P(Windows)打开检索框 2. 重启Cursor使代理设置生效 3. 点击下图中的首选项,选择Cursor首选项配置,进入network(网络管理)页面 将HTTP协议改成HTTP1.1 粘贴博主编辑好的配置(全部覆盖,覆盖前请自行备份之前的用户设置)

AI的提示词专栏:多语言 Prompt,中文、英文、日文混写的实践

AI的提示词专栏:多语言 Prompt,中文、英文、日文混写的实践

AI的提示词专栏:多语言 Prompt,中文、英文、日文混写的实践 本文围绕多语言 Prompt(中文、英文、日文混写)展开全面实践探讨,先阐述其打破跨语言信息壁垒、提升专业场景精准度、适配多语言用户需求的核心价值,再分析中、英、日三种语言特性对 Prompt 编写的影响,接着提出语言标识清晰、核心需求统一、文化适配性的基础编写原则与语言切换逻辑设计、术语对齐、混合语言优先级设定的进阶技巧。文中结合跨境电商产品文案生成、国际学术论文摘要撰写、跨国企业会议纪要制作三大行业实战案例,展示多语言 Prompt 的应用方法,还针对模型语言混淆、术语翻译偏差、文化适配不当等常见问题给出解决方案,最后总结核心要点并展望自动化语言适配、多模态多语言融合等未来趋势,为全球化场景下多语言 Prompt 的使用提供全面指导。 人工智能专栏介绍     人工智能学习合集专栏是 AI 学习者的实用工具。它像一个全面的 AI 知识库,把提示词设计、AI 创作、智能绘图等多个细分领域的知识整合起来。