OpenClaw + Ollama 集成指南：本地私有化部署 LLM | 极客日志

TypeScriptNode.jsAI

OpenClaw + Ollama 集成指南：本地私有化部署 LLM

综述由AI生成介绍如何通过 OpenClaw 与 Ollama 集成实现本地大语言模型（LLM）的私有化部署。方案解决了云端 API 成本高、数据隐私风险及网络依赖问题。内容涵盖硬件要求确认、Ollama 安装配置、上下文窗口扩展、OpenClaw 对接设置、模型量化优化及混合路由策略。通过实战案例展示了搭建本地代码审查助手的全过程，实现了零成本、数据不离本地的 AI 智能体运行环境。

王者发布于 2026/4/6更新于 2026/5/2324 浏览

在这里插入图片描述

零成本运行 AI 智能体：OpenClaw+Ollama 本地私有化部署完全指南

告别 API 账单，让 AI 真正属于你自己——数据隐私 + 零 Token 成本 + 离线可用

引言：为什么需要本地模型？

在 OpenClaw 的生态中，模型是 AI 的'大脑'。无论是 GPT-4 还是 Claude，云端大模型虽然强大，但存在三个无法回避的问题：

成本居高不下：一个中等规模的团队，每月 API 费用轻松超过$500
隐私风险：敏感代码、商业文档、个人数据必须上传到厂商服务器
网络依赖：断网环境 AI 直接'罢工'

OpenClaw + Ollama 的组合正是为解决这些问题而生。Ollama 作为轻量级本地大模型管理工具，能将 Llama、Qwen 等开源模型部署在你的电脑上，让 OpenClaw 彻底摆脱云端依赖，实现本地推理、数据私有化、零 Token 成本的全闭环体验。

本地部署模式用户指令 → OpenClaw 网关 → 本地 Ollama (Llama/Qwen) → 返回结果 (零成本，数据留在本地)

云端部署模式用户指令 → OpenClaw 网关 → 云端 API (GPT-4/Claude) → 返回结果 (每 Token 计费，数据上传厂商)

本文将手把手教你完成 OpenClaw+Ollama 的完整集成，从安装部署到性能优化，再到混合模型策略和实战案例，让你拥有真正属于自己的 AI 智能体。

一、Ollama 部署与配置：搭建本地'大脑'

1.1 硬件要求

在开始之前，先确认你的硬件是否满足要求：

配置项	最低要求	推荐配置
GPU	NVIDIA 显存≥4GB（可运行 4B 模型）	NVIDIA 显存≥8GB（流畅运行 7B~14B 模型）
内存	16GB	32GB 及以上
磁盘空间	20GB 空闲（SSD 优先）	50GB 以上 SSD
处理器	Intel i5/Ryzen 5	Intel i7/Ryzen 7 或 Apple M 系列

特别说明：

无独立显卡可使用 CPU 推理，但速度会大幅下降
Apple Silicon（M 系列芯片）通过 Metal 加速，性能优秀
显存 4GB 可运行 Qwen2.5-4B 等轻量模型

1.2 Ollama 一键安装

macOS/Linux 用户：

curl -fsSL https://ollama.com/install.sh | sh

Windows 用户：

访问 Ollama 官网下载 Windows 安装包

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

ollama --version

# 拉取 Qwen2.5 7B 模型（约 4.7GB，推荐，兼顾性能与硬件要求）
ollama pull qwen2.5:7b

# 更强推理能力（显存≥10GB 可选）
ollama pull qwen3:8b

# 轻量版（显存 4GB 可用）
ollama pull qwen2.5:4b

# 英文场景可选 Llama3
ollama pull llama3:8b

ollama run qwen2.5:7b

# 1. 切换到用户根目录
cd C:\Users\<你的用户名>

# 2. 创建 Modelfile 配置文件
@"FROM qwen2.5:7b PARAMETER num_ctx 32768"@ | Out-File -Encoding ascii Modelfile

# 3. 验证配置文件
Get-Content Modelfile

# 4. 创建自定义模型（命名为 qwen2.5:7b-32k）
ollama create qwen2.5:7b-32k -f Modelfile

# 5. 验证自定义模型
ollama list
# 应显示 qwen2.5:7b-32k
ollama show qwen2.5:7b-32k --modelfile
# 确认包含 num_ctx 32768

# 创建 Modelfile
echo "FROM qwen2.5:7b\nPARAMETER num_ctx 32768" > Modelfile

# 创建自定义模型
ollama create qwen2.5:7b-32k -f Modelfile

# 验证
ollama list

# npm 全局安装 OpenClaw（最新稳定版）
npm install -g openclaw

# 验证安装
openclaw --version

npm install -g openclaw --unsafe-perm

openclaw onboard

配置步骤	操作要求	输入/选择内容
Model/auth provider	选择模型提供商，拉到列表最后	`Custom Provider`
API Base URL	本地 Ollama 的 API 地址	`http://127.0.0.1:11434/v1`
API Key	任意字符串（不可留空）	`ollama`（或自定义如`123456`）
Endpoint compatibility	接口兼容模式	`OpenAI-compatible`
Model ID	本地自定义模型名	`qwen2.5:7b-32k`
后续所有配置项	暂不配置渠道、技能等	全部选择`Skip for now / No`

Model context window too small (4096 tokens). Minimum is 16000

帮我写一个 Python 函数，计算斐波那契数列

# 当使用 Qwen 系列模型时
你是一个有帮助的 AI 助手，用中文回答，保持简洁。

# 当使用 Llama 系列时（英文模型需明确语言）
You are a helpful assistant. Answer in Chinese.

# 查看当前模型配置
openclaw config get models

# 设置模型参数（临时）
openclaw config set models.providers.custom.options.num_ctx 16384

任务类型	上下文需求	备注
简单对话	4K-8K	节省内存
文档处理	16K-32K	平衡性能
复杂分析	32K+	需高配硬件

# ~/.openclaw/agents/main/agent/model_settings.yaml
temperature: 0.7 # 0.0-1.0，越低越确定，越高越创造
top_p: 0.9 # 核采样，控制多样性
top_k: 40 # 只考虑概率最高的 k 个 token
repeat_penalty: 1.1 # 重复惩罚，避免循环

# 模型提供商配置
providers:
  local:
    type: custom
    baseUrl: http://127.0.0.1:11434/v1
    apiKey: ollama
    models:
      - qwen2.5:7b-32k
      - llama3:8b
  cloud:
    type: openai
    apiKey: ${OPENAI_API_KEY}
    models:
      - gpt-4
      - gpt-3.5-turbo

# 路由规则
routing:
  # 规则 1：文件操作、系统命令用本地模型
  - pattern: "文件 | 目录 | 备份 | 整理 | 移动 | 复制"
    provider: local
    model: qwen2.5:7b-32k
  # 规则 2：代码审查、复杂问题用 GPT-4
  - pattern: "代码审查 | 优化 | 重构 | 架构 | 设计模式"
    provider: cloud
    model: gpt-4
  # 规则 3：敏感关键词强制本地
  - pattern: "密码 | 密钥 |token| 隐私 | 机密"
    provider: local
    model: qwen2.5:7b-32k
  # 默认规则：根据复杂度动态判断
  - default:
      strategy: dynamic
      local_threshold: 0.7 # 置信度低于 0.7 转云端

场景	优化前	优化后	节省
简单对话（'你好'）	15,466 tokens	1,021 tokens	93%
文件操作	15,466 tokens	3,058 tokens	80%
代码编写	15,466 tokens	5,122 tokens	67%

# 拉取 4bit 量化版本（推荐，平衡速度与精度）
ollama pull qwen2.5:7b-q4_0

# 拉取 8bit 量化版本（更高精度，内存占用稍大）
ollama pull qwen2.5:7b-q8_0

# 拉取 2bit 量化版本（极致压缩，仅限极端场景）
ollama pull qwen2.5:7b-q2_k

# 设置线程数（通常为物理核心数）
ollama run qwen2.5:7b --num-thread 8

# 限制内存使用
ollama run qwen2.5:7b --memory-limit 8G

import { exec } from 'child_process';
import { promisify } from 'util';
import fs from 'fs-extra';
import path from 'path';
import { LLM } from 'openclaw-sdk';

const execAsync = promisify(exec);

interface PRParams {
  repo: string; // 仓库名，如 "user/repo"
  prNumber: number; // PR 编号
  baseDir?: string; // 本地克隆目录，默认 ~/repos
}

export async function handler(params: PRParams) {
  const baseDir = params.baseDir || path.join(process.env.HOME, 'repos');
  const repoDir = path.join(baseDir, params.repo.replace('/', '-'));
  const prDir = path.join(repoDir, `pr-${params.prNumber}`);

  // 1. 克隆 PR 代码（如果不存在）
  if (!await fs.pathExists(prDir)) {
    await fs.ensureDir(prDir);
    await execAsync(`git clone https://github.com/${params.repo}.git ${prDir} && ` +
      `cd ${prDir} && git fetch origin pull/${params.prNumber}/head:pr-branch && ` +
      `git checkout pr-branch`);
  }

  // 2. 运行静态分析工具
  const linters = { js: 'npx eslint --format json', py: 'pylint --output-format=json', java: 'checkstyle -c /sun_checks.xml -f xml' };
  const lintResults = {};
  for (const [ext, cmd] of Object.entries(linters)) {
    try {
      const { stdout } = await execAsync(`cd ${prDir} && find . -name "*.${ext}" | xargs ${cmd} 2>/dev/null`);
      lintResults[ext] = JSON.parse(stdout);
    } catch (e) {
      // 某些工具返回非零退出码但仍有输出
      if (e.stdout) {
        try { lintResults[ext] = JSON.parse(e.stdout); } catch {}
      }
    }
  }

  // 3. 获取 PR 的变更文件列表
  const { stdout: diffFiles } = await execAsync(`cd ${prDir} && git diff --name-only origin/main...pr-branch`);
  const changedFiles = diffFiles.split('\n').filter(Boolean);

  // 4. 读取变更内容
  const changes = [];
  for (const file of changedFiles.slice(0, 10)) { // 限制 10 个文件避免 token 爆炸
    if (await fs.pathExists(path.join(prDir, file))) {
      const content = await fs.readFile(path.join(prDir, file), 'utf-8');
      changes.push(`文件：${file}\n\`\`\`${content.slice(0, 1000)}\n\`\`\``);
    }
  }

  // 5. 调用本地 LLM 分析
  const llm = new LLM({ provider: 'local', model: 'qwen2.5:7b-32k' });
  const prompt = `
你是一位资深的代码审查专家。请分析以下 PR 的变更，指出：
1. 潜在的 bug 或逻辑错误
2. 安全漏洞（SQL 注入、XSS 等）
3. 性能问题
4. 代码风格不符合最佳实践的地方
5. 改进建议
变更文件列表：${changedFiles.join('\n')}
静态分析结果：${JSON.stringify(lintResults, null, 2)}
关键变更内容：${changes.join('\n\n')}
请用中文输出审查报告，按严重程度排序。
`;
  const reviewReport = await llm.complete(prompt);

  // 6. 格式化评论
  const comment = `## 🤖 AI 代码审查报告\n\n${reviewReport}\n\n---\n*由 OpenClaw 本地模型自动生成*`;

  // 7. 发布到 PR（需配置 GitHub Token）
  // await postGitHubComment(params.repo, params.prNumber, comment);

  return {
    code: 0,
    data: { reviewed: changedFiles.length, report: comment }
  };
}

# ~/.openclaw/cron/pr-review.yaml
name: pr-review
schedule: "*/30 * * * *" # 每 30 分钟检查一次
type: cron
skill: code-review
params:
  repo: "your-org/your-repo" # 可动态获取最近 PR 的逻辑需在 Skill 中实现

OpenClaw + Ollama 集成指南：本地私有化部署 LLM

零成本运行 AI 智能体：OpenClaw+Ollama 本地私有化部署完全指南

引言：为什么需要本地模型？

一、Ollama 部署与配置：搭建本地'大脑'

1.1 硬件要求

1.2 Ollama 一键安装

更多推荐文章

相关免费在线工具

1.3 拉取基础大模型

1.4 验证本地对话

1.5 关键定制：扩展上下文窗口（必做）

二、OpenClaw 对接 Ollama：让大脑连接身体

2.1 OpenClaw 安装

2.2 交互式配置：对接本地 Ollama

2.3 解决核心报错：模型上下文窗口过小

2.4 测试调用

三、模型适配优化：让本地模型更好用

3.1 提示词适配

3.2 上下文窗口调整

3.3 解决'模型输出不稳定'问题

四、混合模型策略：本地 + 云端的最佳组合

4.1 路由规则设计

4.2 OpenClaw 配置实现

4.3 高级优化：Viking 分层路由

五、性能优化：让本地模型跑得更快

5.1 模型量化：用精度换速度

5.2 硬件加速配置

5.3 内存优化技巧

六、实战案例：基于 Ollama+OpenClaw 搭建本地代码审查助手

6.1 需求分析

6.2 系统架构

6.3 开发步骤

6.4 效果验证

七、结语：本地 AI 的时代已经到来

更多推荐文章

相关免费在线工具

OpenClaw + Ollama 集成指南：本地私有化部署 LLM

零成本运行 AI 智能体：OpenClaw+Ollama 本地私有化部署完全指南

引言：为什么需要本地模型？

一、Ollama 部署与配置：搭建本地'大脑'

1.1 硬件要求

1.2 Ollama 一键安装

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.3 拉取基础大模型

1.4 验证本地对话

1.5 关键定制：扩展上下文窗口（必做）

二、OpenClaw 对接 Ollama：让大脑连接身体

2.1 OpenClaw 安装

2.2 交互式配置：对接本地 Ollama

2.3 解决核心报错：模型上下文窗口过小

2.4 测试调用

三、模型适配优化：让本地模型更好用

3.1 提示词适配

3.2 上下文窗口调整

3.3 解决'模型输出不稳定'问题

四、混合模型策略：本地 + 云端的最佳组合

4.1 路由规则设计

4.2 OpenClaw 配置实现

4.3 高级优化：Viking 分层路由

五、性能优化：让本地模型跑得更快

5.1 模型量化：用精度换速度

5.2 硬件加速配置

5.3 内存优化技巧

六、实战案例：基于 Ollama+OpenClaw 搭建本地代码审查助手

6.1 需求分析

6.2 系统架构

6.3 开发步骤

6.4 效果验证

七、结语：本地 AI 的时代已经到来

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具