Jetson 部署 OpenClaw 联动 Ollama 与 llama.cpp 大模型配置模板

在 Jetson Orin NX 上部署 OpenClaw 本地大模型的推荐方案，采用 Ollama 作为主模型后端，llama.cpp 作为备用或专用模型后端，并结合 Ollama embeddings 实现记忆搜索功能。文章提供了详细的配置文件模板、环境变量设置、启动顺序及远程控制配置，并指出了避免将 Ollama 接口误配为 OpenAI 兼容模式等常见坑点，确保在资源受限设备上稳定运行。

深海蔚蓝发布于 2026/4/6更新于 2026/7/2955 浏览

Jetson 上建议的联动方式是：OpenClaw -> Ollama（主模型，原生 API）+ llama.cpp（备用/低资源模型，OpenAI 兼容 API）+ Ollama embeddings（memorySearch）。 这样做的原因是，OpenClaw 官方把 Ollama + openclaw onboard 作为最低冲突的本地方案；同时它也支持把 vLLM / LiteLLM / 自定义 OpenAI-compatible 本地代理 作为额外 provider 接进来。Ollama 这边，OpenClaw 明确推荐走原生 http://host:11434，不要给它配 /v1，否则工具调用会变差；而 llama.cpp 的 llama-server 则原生提供 OpenAI-compatible chat completions / responses / embeddings 路由，适合当第二套本地后端。

另外，OpenClaw 的本地模型指南也明确提醒：它默认期待大上下文和较强的提示注入防护，小硬件上的强量化/小模型更容易丢上下文或降低安全裕量。所以在 Jetson Orin NX 16G 上，更稳的策略是把 Ollama 设为主模型，把 llama.cpp 设为 fallback 或专用模型，而不是反过来。

下面给你一份推荐版模板：特点是 Ollama 走自动发现，你不用手工维护本地模型清单；llama.cpp 作为一个显式自定义 provider 接入；memorySearch 用 Ollama 的 /api/embeddings。OpenClaw 的文档说明，只要设置了 OLLAMA_API_KEY 且没有显式写 models.providers.ollama，它就会从本地 http://127.0.0.1:11434 自动发现模型。memorySearch.provider = "ollama" 也是官方支持的，只是不会自动选中，所以这里显式打开。

先准备环境变量：

export OLLAMA_API_KEY="ollama-local"
export OPENCLAW_GATEWAY_TOKEN="replace-with-a-long-random-token"

把下面保存为 ~/.openclaw/openclaw.json：

{
  "identity": {
    "name": "Jetson-Claw",
    "theme": "local edge agent",
    "emoji": "🦙"
  },

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

ollama serve
ollama list

~/src/llama.cpp/build/bin/llama-server \
  -m ~/models/base/model.gguf \
  --host 127.0.0.1 \
  --port 8080 \
  -c 4096 \
  -np 1 \
  -ctk q8_0 \
  -ctv q8_0

curl http://127.0.0.1:11434/api/tags
curl http://127.0.0.1:8080/v1/models

openclaw gateway restart
openclaw models list
openclaw health
openclaw gateway status

{
  "models": {
    "mode": "merge",
    "providers": {
      "ollama": {
        "baseUrl": "http://127.0.0.1:11434",
        "apiKey": "${OLLAMA_API_KEY}",
        "api": "ollama",
        "models": [
          {
            "id": "qwen2.5:7b-instruct",
            "name": "Qwen2.5 7B Instruct",
            "reasoning": false,
            "input": ["text"],
            "cost": { "input": 0, "output": 0, "cacheRead": 0, "cacheWrite": 0 },
            "contextWindow": 8192,
            "maxTokens": 2048
          },
          {
            "id": "llama3.2:3b",
            "name": "Llama 3.2 3B",
            "reasoning": false,
            "input": ["text"],
            "cost": { "input": 0, "output": 0, "cacheRead": 0, "cacheWrite": 0 },
            "contextWindow": 8192,
            "maxTokens": 2048
          }
        ]
      }
    }
  }
}

ssh -N -L 18789:127.0.0.1:18789 user@jetson-host

{
  "gateway": {
    "mode": "remote",
    "remote": {
      "url": "ws://127.0.0.1:18789",
      "token": "your-token"
    }
  }
}

Jetson 部署 OpenClaw 联动 Ollama 与 llama.cpp 大模型配置模板

更多推荐文章

相关免费在线工具

启动顺序

如果你想把 Ollama 也改成'显式配置'

远程控制这台 Jetson 的模板

两个最容易踩的坑

参考链接

更多推荐文章

相关免费在线工具

Jetson 部署 OpenClaw 联动 Ollama 与 llama.cpp 大模型配置模板

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

启动顺序

如果你想把 Ollama 也改成'显式配置'

远程控制这台 Jetson 的模板

两个最容易踩的坑

参考链接

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具