我在Mac mini使用OpenClaw接上本地Gemma4后，确认了一件事：AI成本正在归零

优质文章学习记录

09 Apr 2026 — 3 min read

Google 全新发布的 Gemma4 堪称 2026 年本地 AI 最优解，260 亿参数开源免费，普通笔记本就能离线全速运行。

今天我在折腾一件事：

👉 用 Mac mini 跑 Gemma 4 + 接入 OpenClaw

跑通之后，我的第一反应不是“AI更强了”，而是：

AI 的使用成本，正在被打到接近 0。

一、我是在 Mac mini 上跑起来的 Gemma 4

先说结论：

👉 Gemma 4 是可以在 Mac mini 上跑的

我用的是轻量版本（E4B），本地直接跑，完全离线。

没有云，没有API，没有费用。

两分钟搞定：

12 curl -fsSL ollama.com/install.sh | sh ollama pull gemma4:e4b

跑起来之后，你会有一种感觉：

AI第一次真正属于你自己的硬件了

二、Gemma 4 发布，我把架构扒了一遍

我专门对比了 Gemma 4 和 Gemma 3。

结论很有意思👇

✅ 架构几乎没变

还是那一套：

• Pre/Post-norm
• 5:1 hybrid attention
• GQA

说白了：

👉 不是靠架构创新赢的

✅ 但性能直接起飞

• 基准测试全面超 Gemma 3

✅ 26B MoE 是最大惊喜

👉 总参数 26B
👉 实际激活只有 4B

什么意思？

用小模型的成本，打大模型的效果

✅ 最关键：Apache 2.0

这一点很多人没意识到有多重要：

👉 可以商用
👉 可以改
👉 可以私有部署

一句话总结 Gemma 4

架构没变，数据和训练方法才是真王道

所以我现在的判断是：

👉 架构党可以先歇歇了

三、很多人没看懂 Gemma 4 真正的价值

大部分人看到的是：

👉 开源
👉 免费
👉 本地能跑

但这些都不是重点。

真正的重点只有一个：

它原生支持 Function Calling（函数调用）

这意味着什么？

👉 它可以自己调用工具
👉 可以执行代码
👉 可以访问API
👉 可以连数据库
👉 可以浏览网页

说白了：

它不是聊天模型，是一个“能干活的本地智能体”

四、为什么我一定要接 OpenClaw

因为：

👉 Gemma4 + OpenClaw = 本地AI系统

OpenClaw 是什么？

你可以理解为：

AI的操作系统（Agent OS）

它负责：

• 多Agent协作
• 任务执行
• 工具调用（MCP）
• 长时间运行

但很多人卡在这里：

👉 OpenClaw 根本没用到你的大模型

比如你看到：

1 gateway-injected

那说明：

你还在用内置小模型

五、正确接入姿势（关键）

1️⃣ 拉对模型

123 ollama pull gemma4:26b # 或 ollama pull gemma4:31b

⚠️ 不能写 gemma4
必须写完整：gemma4:26b

2️⃣ 配置 OpenClaw

123456 {   "id": "gemma4:26b",   "name": "Gemma4 Local",   "contextWindow": 262144,   "maxTokens": 8192 }

3️⃣ 强制切换模型

1 /model ollama/gemma4:26b

当你看到：

1 agent main | ollama/gemma4:26b

那一刻开始：

你就拥有了一个真正的本地 AI Agent

六、今天的测试

🧠 本地：Gemma 4

负责：

• 写文章
• 代码审查
• 数据处理
• 日常分析

🔧 工具：MCP + OpenClaw

负责：

• 调接口
• 浏览网页
• 数据库操作
• 自动执行任务

☁️ 云端：Claude Code（备用）

只在以下情况用：

• 高复杂推理
• 架构设计
• 超大项目

七、这套组合带来的变化（非常关键）

以前：

👉 每个月 AI 成本几百美金

现在：

👉 90% 本地解决
👉 只为 10% 付费

一句话总结：

AI从“按token收费”，变成“按电费收费”

八、我有一个老设备也能跑

我现在甚至在试：

👉 老显卡 + gemma4:e4b

结果是：

👉 轻松跑
👉 稳定
👉 可用

随便用，只耗电

Llama Factory

1. Llama Factory 到底是什么？ 1.1 简单比喻想象你要定制一辆汽车：传统方式（没有 Llama Factory）： * 你需要自己造发动机、设计车身、组装零件 * 需要懂机械工程、电子技术、材料科学 * 整个过程复杂、容易出错、耗时很长使用 Llama Factory： * 你只需要： 1. 选择基础车型（预训练模型） 2. 告诉工厂你的需求（训练数据） 3. 选择改装方案（训练方法） 4. 工厂自动完成所有改装 * 你不需要懂技术细节，只需要提需求 1.2 一句话定义 Llama Factory 是一个"AI模型定制工厂"，它让普通人也能轻松地定制和训练自己的大语言模型。 2. 为什么需要

【AIGC】冷启动数据与多阶段训练在 DeepSeek 中的作用

博客主页： [小ᶻ☡꙳ᵃⁱᵍᶜ꙳]本文专栏: AIGC |ChatGPT 文章目录 * 💯前言 * 💯冷启动数据的作用 * 冷启动数据设计 * 💯多阶段训练的作用 * 阶段 1：冷启动微调 * 阶段 2：推理导向强化学习（RL） * 阶段 3：拒绝采样与监督微调（SFT） * 阶段 4：多场景强化学习 * 💯代码示例：冷启动数据与多阶段训练的实现 * 1. 冷启动微调阶段 * 作用与应用： * 2. 推理导向的强化学习阶段 * 作用与应用： * 3. 拒绝采样与监督微调阶段 * 作用与应用： * 4. 多场景强化学习 * 作用与应用： * 总体流程 * DeepSeek 中的应用 * 💯总结 💯前言在人工智能领域，深度学习模型的训练和优化往往需要大量的标注数据和计算资源。然而，面对复杂任务时，即使是最先进的技术和大量的训练数据也未必能够保证模型的最优表现。DeepSeek

GPU PRO 4 - 5.1 An Aspect-Based Engine Architecture 笔记

本笔记仅为个人的理解，如果有误欢迎指出 An Aspect-Based Engine Architecture 一种基于方面的引擎架构不是很明白为什么GPU的书籍会有游戏引擎架构的文章。这里Aspect在文章中的意义更像是表述一个功能模块，在Java中有将Aspect翻译成切面，但是Java切面主要是横向的代码注入，与本文的概念不相符。大多数系统架构都会考虑将各个功能封装成模块或者组件，在面向对象编程的思想下，这个封装是基于对象去实现的，本文则描述了一种在引擎层面的封装功能的架构思想，封装后的产物被称为Aspect，每一个Aspect负责提供一些功能子集，并通过一个通用的接口与引擎核心通信。引擎核心：引擎核心的功能是保存游戏或者仿真时的数据结构以及相关状态，功能Aspect将会与这些数据进行交互。一般来说引擎核心会定义一些接口，外部的Aspect则通过接口访问当前的游戏数据用MVC架构的角度去理解的话引擎核心相当于M层，而各个Aspect则相当于C层。

基于FPGA的工业ALU模块构建：完整示例

基于FPGA的工业ALU模块构建：从原理到实战在现代工业自动化系统中，实时性、可靠性和确定性是决定控制性能的核心指标。随着智能制造和边缘计算的发展，传统的通用处理器架构逐渐暴露出中断延迟高、流水线不可控、资源争抢等问题。而 FPGA（现场可编程门阵列）凭借其并行处理能力与硬件级可定制特性，正成为解决这些痛点的关键技术路径。本文将带你深入一个真实可用的工程场景——如何在FPGA上构建一个工业级算术逻辑单元（ALU）。我们将不走马观花地罗列概念，而是像一位嵌入式系统工程师那样，从需求出发，一步步拆解设计思路，手把手实现Verilog代码，并结合典型工业应用说明其价值所在。为什么要在FPGA里“造”一个ALU？你可能会问：CPU里不是已经有ALU了吗？为什么还要自己实现？答案藏在“工业”两个字背后的需求中： * 硬实时响应：电机控制环路要求微秒甚至纳秒级响应，软件调度无法满足。 * 多通道同步处理：六轴机器人需要同时对多个传感器数据做差值、比较、累加。 * 抗干扰能力强：无操作系统介入，避免任务抢占或内存泄漏导致失控。 * 算法固化为硬件：关键运