Jetson 上 OpenClaw + Ollama + llama.cpp 的联动配置模板部署大模型

优质文章学习记录

10 Apr 2026 — 5 min read

Jetson 上我建议的联动方式是：OpenClaw -> Ollama（主模型，原生 API）+ llama.cpp（备用/低资源模型，OpenAI 兼容 API）+ Ollama embeddings（memorySearch）。 这样做的原因是，OpenClaw 官方把 Ollama + openclaw onboard 作为最低冲突的本地方案；同时它也支持把 vLLM / LiteLLM / 自定义 OpenAI-compatible 本地代理 作为额外 provider 接进来。Ollama 这边，OpenClaw 明确推荐走原生 http://host:11434，不要给它配 /v1，否则工具调用会变差；而 llama.cpp 的 llama-server 则原生提供 OpenAI-compatible chat completions / responses / embeddings 路由，适合当第二套本地后端。([OpenClaw][1])

另外，OpenClaw 的本地模型指南也明确提醒：它默认期待大上下文和较强的提示注入防护，小硬件上的强量化/小模型更容易丢上下文或降低安全裕量。所以在 Jetson Orin NX 16G 上，更稳的策略是把 Ollama 设为主模型，把 llama.cpp 设为 fallback 或专用模型，而不是反过来。([OpenClaw][1])

下面给你一份推荐版模板：
特点是 Ollama 走自动发现，你不用手工维护本地模型清单；llama.cpp 作为一个显式自定义 provider 接入；memorySearch 用 Ollama 的 /api/embeddings。OpenClaw 的文档说明，只要设置了 OLLAMA_API_KEY 且没有显式写 models.providers.ollama，它就会从本地 http://127.0.0.1:11434 自动发现模型。memorySearch.provider = "ollama" 也是官方支持的，只是不会自动选中，所以这里显式打开。([OpenClaw][2])

先准备环境变量：

exportOLLAMA_API_KEY="ollama-local"exportOPENCLAW_GATEWAY_TOKEN="replace-with-a-long-random-token"

把下面保存为 ~/.openclaw/openclaw.json：

{ identity: { name: "Jetson-Claw", theme: "local edge agent", emoji: "🦙", }, gateway: { bind: "loopback", port: 18789, auth: { token: "${OPENCLAW_GATEWAY_TOKEN}", }, }, agent: { workspace: "~/.openclaw/workspace", }, agents: { defaults: { model: { // 主模型：走 Ollama（自动发现） primary: "ollama/qwen2.5:7b-instruct", // 备用：先退到 llama.cpp，再退到另一个 Ollama 小模型 fallbacks: [ "llamacpp/qwen2.5-7b-instruct-gguf", "ollama/llama3.2:3b", ], }, models: { "ollama/qwen2.5:7b-instruct": { alias: "Ollama 主模型" }, "llamacpp/qwen2.5-7b-instruct-gguf": { alias: "llama.cpp 备用" }, "ollama/llama3.2:3b": { alias: "Ollama 小模型" }, }, memorySearch: { enabled: true, // 用 Ollama embeddings，而不是 OpenClaw 的 local(node-llama-cpp) 模式 provider: "ollama", // 换成你本机实际装好的 embedding 模型 model: "YOUR_OLLAMA_EMBED_MODEL", // Jetson 上先不要再级联更多 embedding fallback，保持简单 fallback: "none", cache: { enabled: true, maxEntries: 50000, }, sync: { watch: true, }, }, }, }, models: { // 保留合并模式，未来你还可以叠加云端 provider mode: "merge", providers: { // llama.cpp 作为自定义 OpenAI-compatible provider llamacpp: { baseUrl: "http://127.0.0.1:8080/v1", apiKey: "llama-local", api: "openai-completions", models: [ { id: "qwen2.5-7b-instruct-gguf", name: "Qwen2.5 7B Instruct GGUF", reasoning: false, input: ["text"], cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }, contextWindow: 4096, maxTokens: 1024, }, ], }, }, }, }

这个模板的关键点有三个：

第一，Ollama 不写 models.providers.ollama。因为官方文档说，一旦你显式写了 models.providers.ollama，自动发现会被关闭，你就得自己维护模型列表；不写则会自动从本地 Ollama 实例发现模型。([OpenClaw][2])

第二，llama.cpp 走 /v1，并用 api: "openai-completions"。OpenClaw 官方对“其他 OpenAI-compatible 本地代理”给的标准接法，就是 models.providers.<id> + baseUrl + api + models 这一套；而 llama.cpp 官方文档确认 llama-server 提供 OpenAI-compatible 路由。([OpenClaw][1])

第三，memorySearch 用 Ollama，不用 local。因为 OpenClaw 文档里写得很清楚：memorySearch.provider = "local" 走的是 node-llama-cpp，可能需要额外的 pnpm approve-builds / pnpm rebuild；而 memorySearch.provider = "ollama" 是官方支持的本地/self-hosted embeddings 路径，更适合先把 Jetson 跑稳。([OpenClaw][3])

启动顺序

先起 Ollama。Ollama 官方 API 默认就在 http://localhost:11434/api。 ([Ollama Docs][4])

ollama serve ollama list

然后起 llama.cpp：

~/src/llama.cpp/build/bin/llama-server \-m ~/models/base/model.gguf \--host127.0.0.1 \--port8080\-c4096\-np1\-ctk q8_0 \-ctv q8_0

再检查两个后端：

curl http://127.0.0.1:11434/api/tags curl http://127.0.0.1:8080/v1/models

最后让 OpenClaw 读配置：

openclaw gateway restart openclaw models list openclaw health openclaw gateway status

如果你想把 Ollama 也改成“显式配置”

只有在这几种情况下才建议这么做：
你要连远程 Ollama、你想强制指定 contextWindow/maxTokens、或者你想完全手工管模型列表。官方文档明确说，远程 Ollama 时应使用 baseUrl: "http://host:11434"，不要加 /v1，并把 api 设成 "ollama" 以保证原生工具调用行为。([OpenClaw][2])

对应模板是：

{ models: { mode: "merge", providers: { ollama: { baseUrl: "http://127.0.0.1:11434", apiKey: "${OLLAMA_API_KEY}", api: "ollama", models: [ { id: "qwen2.5:7b-instruct", name: "Qwen2.5 7B Instruct", reasoning: false, input: ["text"], cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }, contextWindow: 8192, maxTokens: 2048, }, { id: "llama3.2:3b", name: "Llama 3.2 3B", reasoning: false, input: ["text"], cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }, contextWindow: 8192, maxTokens: 2048, }, ], }, }, }, }

远程控制这台 Jetson 的模板

OpenClaw 官方建议把 Gateway 绑在 loopback，然后通过 SSH 隧道 从笔记本连进去；默认网关端口是 18789。如果你希望本地电脑上的 OpenClaw CLI 默认连这台 Jetson，可以把 gateway.mode: "remote" 和 gateway.remote.url/token 写进去。([OpenClaw][5])

先在你的笔记本上开隧道：

ssh-N-L18789:127.0.0.1:18789 user@jetson-host

然后在本地电脑的 OpenClaw 配置里加：

{ gateway: { mode: "remote", remote: { url: "ws://127.0.0.1:18789", token: "your-token", }, }, }

这样之后本地的 openclaw health、openclaw status 之类就会默认走这个远程 Gateway。([OpenClaw][5])

两个最容易踩的坑

不要把 OpenClaw 连 Ollama 时写成 http://127.0.0.1:11434/v1。 官方文档明确说，这会切到 OpenAI-compatible 模式，工具调用会变得不可靠，模型可能把工具 JSON 当纯文本吐出来。([OpenClaw][2])

不要一开始就把 memorySearch.provider 设成 local。 这条路走的是 node-llama-cpp，本地编译和依赖更重；Jetson 上先用 ollama embeddings 更省心。([OpenClaw][3])

后面会陆续加入openclaw gateway安全模式下与ros联动配置。

参考链接：
[1]: https://docs.openclaw.ai/gateway/local-models “Local Models - OpenClaw”
[2]: https://docs.openclaw.ai/providers/ollama “Ollama - OpenClaw”
[3]: https://docs.openclaw.ai/reference/memory-config “Memory configuration reference - OpenClaw”
[4]: https://docs.ollama.com/api/introduction “Introduction - Ollama”
[5]: https://docs.openclaw.ai/gateway/remote “Remote Access - OpenClaw”

人工智能：自然语言处理在教育领域的应用与实战

人工智能：自然语言处理在教育领域的应用与实战学习目标 💡 理解自然语言处理（NLP）在教育领域的应用场景和重要性 💡 掌握教育领域NLP应用的核心技术（如智能教学、学习分析、评估系统） 💡 学会使用前沿模型（如BERT、GPT-3、Transformer）进行教育文本分析 💡 理解教育领域的特殊挑战（如数据多样性、个性化需求、实时性要求高） 💡 通过实战项目，开发一个智能教学问答系统重点内容 * 教育领域NLP应用的主要场景 * 核心技术（智能教学、学习分析、评估系统） * 前沿模型（BERT、GPT-3、Transformer）在教育领域的使用 * 教育领域的特殊挑战 * 实战项目：智能教学问答系统开发一、教育领域NLP应用的主要场景 1.1 智能教学 1.1.1 智能教学的基本概念智能教学是利用NLP技术，为学生提供个性化的教学内容和方法的过程。在教育领域，智能教学的主要应用场景包括： * 智能问答系统：回答学生的问题（

AI 开发必用的4个skills组合，用来流畅掌控AI开发流程，灵活控制AI（opencode skills）

skills 一种技能增强器。 skills 可以理解为升级版的提示词，它的文件记录了某个skill（技能）的元信息，就是描述这个skills的名称等信息，另外它的文件中还记录了skills的技能实现步骤。以下4个skills在AI项目开发中，我认为必不可缺一。这4个skills的引入，可更为方便我们去介入AI，控制AI，给AI制定边界。我会用一个音乐机器人项目开发来介绍这4个skills，如何介入AI开发流程，如何行云流水的控制AI。指令式控制AI 开发流程的主控调度器：有4个SIKLLS 在我的项目中.opencode目录中存在4个skills， 4个skills技能结合和.opencode目录同级的AGNETS.md文档，AGNETS.md是主控配置文件，是AI 开发流程的主控调度器，负责协调三个专业技能包（毒蛇产品经理、UI设计师、全栈开发工程师、ui-ux-pro-max） ui-ux-pro-max技能包，我120%的推荐，减少了不少UI配色的塑料感，可在文末看我此次，用技能包开发的UI界面，做一个效果对比。 skills技能指令：我

AI Agent 面试八股文100问：大模型智能体高频考点全解析（附分类指南和简历模板）

AI Agent 面试八股文100问：大模型智能体高频考点全解析（附分类指南和简历模板）如果你对学成归来的简历没有概念，可以看看以下的模板先，毕竟先看清眼前的路，比奔跑更重要：最终的AI Agent简历模板，点我跳转！适用人群：LLM Agent、RAG、AutoGPT、LangChain、Function Calling 等方向的求职者与开发者随着大模型技术的飞速演进，AI Agent（智能体）已成为工业界和学术界共同关注的焦点。无论是 AutoGPT、LangChain 还是 LlamaIndex，背后都离不开对 Agent 架构、推理机制、工具调用等核心能力的深入理解。本文系统整理了 AI Agent 方向的 100 道高频面试问题，覆盖基础概念、架构设计、推理决策、工具调用、记忆管理、评估方法、安全对齐、

OpenClaw+优云智算Coding Plan：从灵感到成文，再到公众号发布的全流程AI自动化

1. 背景在自媒体运营、技术分享和日常内容创作中，许多从业者面临碎片化、低效率和重复劳动的问题。从灵感闪现到文章发布，整个过程涉及多个步骤如构思、撰写、排版及上传等，需要频繁切换工具与手动调整格式，耗时费力且容易出错。目前市面上的AI工具大多只能解决特定环节的问题，无法覆盖整个创作流程；而专业自动化平台要么操作复杂，要么成本高昂，难以普及使用。为此，我使用OpenClaw开源AI智能体（龙虾）和优云智算Coding Plan大模型服务搭建了一个流水线。通过OpenClaw的任务管理和工具调用能力，加上优云智算提供的稳定低价算力支持，实现了“灵感输入→文案生成→内容优化→公众号发布”的端到端全流程自动化，极大提高了效率，让创作者能够更加专注于创意本身。 2. AI大模型配置优云智算Coding Plan是聚合了OpenAI、Claude、DeepSeek、智谱GLM、MiniMax等全球主流大模型的订阅式算力服务，兼容OpenAI API协议，支持Claude Code/Codex/OpenClaw等AI工具，能完美对接OpenClaw，为内容创作提供稳定的AI生成能力，本