Jetson 本地部署：OpenClaw + Ollama + llama.cpp 联动配置

Jetson 本地部署 OpenClaw 大模型代理，推荐采用 Ollama 作为主模型后端，llama.cpp 作为备用或低资源模型后端，配合 Ollama embeddings 进行记忆搜索。配置核心在于环境变量设置及 openclaw.json 模板编写，Ollama 走原生 API 避免工具调用失效，llama.cpp 需显式配置为 OpenAI 兼容 provider。启动顺序为先 Ollama 后 llama.cpp，通过 curl 验证后端状态。远程控制建议通过 SSH 隧道连接 Gateway 端口，避免直接暴露。注意不要将 Ollama 地址配成 /v1 路径，memorySearch 优先选 ollama 而非 local 模式以减少依赖编译问题。

数字游民发布于 2026/4/8更新于 2026/7/2438 浏览

Jetson 上我建议的联动方式是：OpenClaw -> Ollama（主模型，原生 API）+ llama.cpp（备用/低资源模型，OpenAI 兼容 API）+ Ollama embeddings（memorySearch）。 这样做的原因是，OpenClaw 官方把 Ollama + openclaw onboard 作为最低冲突的本地方案；同时它也支持把 vLLM / LiteLLM / 自定义 OpenAI-compatible 本地代理 作为额外 provider 接进来。Ollama 这边，OpenClaw 明确推荐走原生 http://host:11434，不要给它配 /v1，否则工具调用会变差；而 llama.cpp 的 llama-server 则原生提供 OpenAI-compatible chat completions / responses / embeddings 路由，适合当第二套本地后端。

另外，OpenClaw 的本地模型指南也明确提醒：它默认期待大上下文和较强的提示注入防护，小硬件上的强量化/小模型更容易丢上下文或降低安全裕量。所以在 Jetson Orin NX 16G 上，更稳的策略是把 Ollama 设为主模型，把 llama.cpp 设为 fallback 或专用模型，而不是反过来。

下面给你一份推荐版模板：特点是 Ollama 走自动发现，你不用手工维护本地模型清单；llama.cpp 作为一个显式自定义 provider 接入；memorySearch 用 Ollama 的 /api/embeddings。OpenClaw 的文档说明，只要设置了 OLLAMA_API_KEY 且没有显式写 models.providers.ollama，它就会从本地 http://127.0.0.1:11434 自动发现模型。memorySearch.provider = "ollama" 也是官方支持的，只是不会自动选中，所以这里显式打开。

先准备环境变量：

export OLLAMA_API_KEY="ollama-local"
export OPENCLAW_GATEWAY_TOKEN="replace-with-a-long-random-token"

把下面保存为 ~/.openclaw/openclaw.json：

{
  "identity": {
    "name": "Jetson-Claw",
    "theme": "local edge agent",
    "emoji": "🦙"
  },

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

ollama serve
ollama list

~/src/llama.cpp/build/bin/llama-server \
  -m ~/models/base/model.gguf \
  --host 127.0.0.1 \
  --port 8080 \
  -c 4096 \
  -np 1 \
  -ctk q8_0 \
  -ctv q8_0

curl http://127.0.0.1:11434/api/tags
curl http://127.0.0.1:8080/v1/models

openclaw gateway restart
openclaw models list
openclaw health
openclaw gateway status

{
  "models": {
    "mode": "merge",
    "providers": {
      "ollama": {
        "baseUrl": "http://127.0.0.1:11434",
        "apiKey": "${OLLAMA_API_KEY}",
        "api": "ollama",
        "models": [
          {
            "id": "qwen2.5:7b-instruct",
            "name": "Qwen2.5 7B Instruct",
            "reasoning": false,
            "input": ["text"],
            "cost": {
              "input": 0,
              "output": 0,
              "cacheRead": 0,
              "cacheWrite": 0
            },
            "contextWindow": 8192,
            "maxTokens": 2048
          },
          {
            "id": "llama3.2:3b",
            "name": "Llama 3.2 3B",
            "reasoning": false,
            "input": ["text"],
            "cost": {
              "input": 0,
              "output": 0,
              "cacheRead": 0,
              "cacheWrite": 0
            },
            "contextWindow": 8192,
            "maxTokens": 2048
          }
        ]
      }
    }
  }
}

ssh -N -L 18789:127.0.0.1:18789 user@jetson-host

{
  "gateway": {
    "mode": "remote",
    "remote": {
      "url": "ws://127.0.0.1:18789",
      "token": "your-token"
    }
  }
}

Jetson 本地部署：OpenClaw + Ollama + llama.cpp 联动配置

更多推荐文章

相关免费在线工具

启动顺序

如果你想把 Ollama 也改成'显式配置'

远程控制这台 Jetson 的模板

两个最容易踩的坑

更多推荐文章

相关免费在线工具

Jetson 本地部署：OpenClaw + Ollama + llama.cpp 联动配置

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

启动顺序

如果你想把 Ollama 也改成'显式配置'

远程控制这台 Jetson 的模板

两个最容易踩的坑

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具