Jetson 平台 OpenClaw 联动 Ollama 与 llama.cpp 部署大模型

Jetson 上 OpenClaw 联动 Ollama 与 llama.cpp 部署大模型

Jetson 上我建议的联动方式是：OpenClaw -> Ollama（主模型，原生 API）+ llama.cpp（备用/低资源模型，OpenAI 兼容 API）+ Ollama embeddings（memorySearch）。这样做的原因是，OpenClaw 官方把 Ollama + openclaw onboard 作为最低冲突的本地方案；同时它也支持把 vLLM / LiteLLM / 自定义 OpenAI-compatible 本地代理 作为额外 provider 接进来。Ollama 这边，OpenClaw 明确推荐走原生 http://host:11434，不要给它配 /v1，否则工具调用会变差；而 llama.cpp 的 llama-server 则原生提供 OpenAI-compatible chat completions / responses / embeddings 路由，适合当第二套本地后端。

另外，OpenClaw 的本地模型指南也明确提醒：它默认期待大上下文和较强的提示注入防护，小硬件上的强量化/小模型更容易丢上下文或降低安全裕量。所以在 Jetson Orin NX 16G 上，更稳的策略是把 Ollama 设为主模型，把 llama.cpp 设为 fallback 或专用模型，而不是反过来。

下面给你一份推荐版模板：特点是 Ollama 走自动发现，你不用手工维护本地模型清单；llama.cpp 作为一个显式自定义 provider 接入；memorySearch 用 Ollama 的 /api/embeddings。OpenClaw 的文档说明，只要设置了 OLLAMA_API_KEY 且没有显式写 models.providers.ollama，它就会从本地 http://127.0.0.1:11434 自动发现模型。memorySearch.provider = "ollama" 也是官方支持的，只是不会自动选中，所以这里显式打开。

先准备环境变量：

export OLLAMA_API_KEY="ollama-local"
export OPENCLAW_GATEWAY_TOKEN="replace-with-a-long-random-token"

把下面保存为 ~/.openclaw/openclaw.json：

{
  "identity": {
    "name": "Jetson-Claw",
    "theme": "local edge agent",
    "emoji": "🦙"
  }

Jetson 平台 OpenClaw 联动 Ollama 与 llama.cpp 部署大模型

Jetson 上 OpenClaw 联动 Ollama 与 llama.cpp 部署大模型

更多推荐文章

相关免费在线工具

启动顺序

如果你想把 Ollama 也改成'显式配置'

远程控制这台 Jetson 的模板

两个最容易踩的坑

更多推荐文章

相关免费在线工具

Jetson 平台 OpenClaw 联动 Ollama 与 llama.cpp 部署大模型

Jetson 上 OpenClaw 联动 Ollama 与 llama.cpp 部署大模型

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

启动顺序

如果你想把 Ollama 也改成'显式配置'

远程控制这台 Jetson 的模板

两个最容易踩的坑

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具