OpenClaw + Ollama 在 macOS 上部署本地大模型实践 | 极客日志

Shell / BashNode.jsAI

OpenClaw + Ollama 在 macOS 上部署本地大模型实践

综述由AI生成记录了在 MacBook Pro M1 Pro 上通过 Ollama 部署本地大模型并接入 OpenClaw 的过程。包括环境准备、Ollama 安装与模型拉取、OpenClaw 配置文件修改、Gateway 重启及代理清理。内容涵盖模型性能基准测试、通信架构原理及常见问题排障，实现了本地低延迟推理与云端兜底的混合策略。

PentesterX发布于 2026/3/28更新于 2026/5/2330 浏览

一、背景与目标

1.1 为什么要本地部署？

维度	云端 API	本地部署
隐私性	⚠️ 数据上传到云端	✅ 数据完全不出本机
网络依赖	需要稳定网络 + 可能需要代理	无需网络，离线可用
延迟	100-500ms 网络延迟	~0ms 网络延迟
成本	按 token 计费	一次下载，永久免费推理
模型规模	无限制	受限于本地硬件

1.2 硬件环境

项目	配置
设备	MacBook Pro (2021)
芯片	Apple M1 Pro（10 核 CPU + 16 核 GPU）
内存	32GB 统一内存（CPU/GPU 共享）
存储	1TB SSD
系统	macOS Sonoma 14.5

1.3 软件环境

组件	版本
OpenClaw	v2024.2.15
Ollama	v0.16.1
Node.js	v22.x
pnpm	v10.x

二、Ollama 安装与模型准备

2.1 安装 Ollama 推荐使用 Homebrew 安装，便于后续升级管理：

# 安装 Homebrew（如果尚未安装）
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
# 通过 Homebrew 安装 Ollama
brew install --cask ollama
# 验证安装
ollama --version
# 输出：ollama version is 0.16.1

提示：国内网络环境下，可使用清华/中科大镜像安装 Homebrew：

/bin/bash -c

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

# 模型 1：gpt-oss:20b（13GB，支持推理链）
ollama pull gpt-oss:20b
# 模型 2：qwen3-coder（18GB，擅长编程和中文）
ollama pull qwen3-coder

# 查看已下载的模型
ollama list
# 输出：
# NAME ID SIZE MODIFIED
# gpt-oss:20b xxxxxxxxxxxx 13 GB 2 hours ago
# qwen3-coder:latest xxxxxxxxxxxx 18 GB 2 hours ago
# 快速测试
ollama run gpt-oss:20b "Say hello"

# 测试 Ollama API
curl http://127.0.0.1:11434/api/tags | python3 -m json.tool
# 测试 OpenAI 兼容端点
curl http://127.0.0.1:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{ "model": "gpt-oss:20b", "messages": [{"role":"user","content":"Hello"}], "stream": false, "max_tokens": 50 }'

~/.openclaw/
├── openclaw.json ← 主配置文件（改 3 处）
│   ├── auth.profiles["ollama:default"] ← ① 认证声明
│   ├── models.providers.ollama ← ② 模型提供商定义
│   └── agents.defaults.model ← ③ 默认模型 + 回退链
└── agents/main/agent/
    └── auth-profiles.json ← 密钥文件（改 1 处）
        └── profiles["ollama:default"] ← ④ 认证凭据

{
  "auth": {
    "profiles": {
      "zai:default": { "provider": "zai", "mode": "api_key" },
      "ollama:default": { "provider": "ollama", "mode": "api_key" }
    }
  }
}

{
  "models": {
    "mode": "merge",
    "providers": {
      "ollama": {
        "baseUrl": "http://127.0.0.1:11434/v1",
        "api": "openai-completions",
        "models": [
          {
            "id": "gpt-oss:20b",
            "name": "GPT-OSS 20B (Local)",
            "reasoning": true,
            "input": ["text"],
            "contextWindow": 131072,
            "maxTokens": 8192
          },
          {
            "id": "qwen3-coder",
            "name": "Qwen3 Coder (Local)",
            "reasoning": false,
            "input": ["text"],
            "contextWindow": 131072,
            "maxTokens": 8192
          }
        ]
      }
    }
  }
}

字段	值	说明
`baseUrl`	`http://127.0.0.1:11434/v1`	Ollama 的 OpenAI 兼容 API 端点
`api`	`openai-completions`	使用 OpenAI Chat Completions 协议
`reasoning`	`true` / `false`	模型是否支持推理链（thinking）
`contextWindow`	`131072`	最大上下文窗口（tokens）
`maxTokens`	`8192`	单次生成最大 token 数

{
  "agents": {
    "defaults": {
      "model": {
        "primary": "ollama/gpt-oss:20b",
        "fallbacks": ["ollama/qwen3-coder", "zai/glm-4.5-air"]
      },
      "models": {
        "ollama/gpt-oss:20b": { "alias": "GPT-OSS 20B (Local)" },
        "ollama/qwen3-coder": { "alias": "Qwen3 Coder (Local)" },
        "zai/glm-4.5-air": {}
      }
    }
  }
}

gpt-oss:20b (本地) → qwen3-coder (本地) → glm-4.5-air (云端智谱)
主模型 第一备用 第二备用（兜底）

{
  "version": 1,
  "profiles": {
    "ollama:default": {
      "type": "api_key",
      "provider": "ollama",
      "key": "ollama"
    }
  }
}

# 停止现有 Gateway
openclaw gateway stop
# 清除旧的会话记录（避免 Context overflow）
echo '{}' > ~/.openclaw/agents/main/sessions/sessions.json
# 重新启动 Gateway
openclaw gateway
# 验证健康状态
openclaw health

unset http_proxy https_proxy HTTP_PROXY HTTPS_PROXY
openclaw gateway

优先本地：省成本、低延迟、保隐私
本地备用：主模型不可用时切换到另一个本地模型
云端兜底：本地全部不可用时，仍可通过云端 API 提供服务

# 先停止旧进程
openclaw gateway stop
# 如果仍然报错，强制 kill
kill $(lsof -ti :18789)
# 重新启动
openclaw gateway

echo '{}' > ~/.openclaw/agents/main/sessions/sessions.json
openclaw gateway stop && openclaw gateway

# 启动 Gateway 前清除代理
unset http_proxy https_proxy HTTP_PROXY HTTPS_PROXY
openclaw gateway

# 检查版本
ollama --version
# 如果提示 server/client 版本不一致，重启 Ollama 服务
pkill -f "ollama serve"
# 等待 Ollama 自动重启（macOS LaunchAgent 会自动拉起），或手动启动：
ollama serve &

# 查看正在运行的模型
ollama ps
# 查看所有已下载模型
ollama list
# 测试 API 连通性
curl -s http://127.0.0.1:11434/api/tags | python3 -m json.tool

OpenClaw + Ollama 在 macOS 上部署本地大模型实践

更多推荐文章

相关免费在线工具

2.4 验证 API 端点

更多推荐文章

相关免费在线工具

OpenClaw + Ollama 在 macOS 上部署本地大模型实践

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.4 验证 API 端点

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具