OpenClaw 中的'自由模型'可能意味着两种不同的东西,而混淆这两种模型正是大多数人浪费时间的地方。
**有一种'免费'是真正意义上的免费,**因为模型运行在本地,你只需要支付 CPU、内存、GPU 和电力费用。例如 Ollama 或你自行托管的 OpenAI 兼容运行时环境。
**另一种是'免费套餐',**即托管服务提供商提供一定的配额、积分或 OAuth 访问权限。这种套餐虽然不错,但通常会有速率限制、策略限制,而且偶尔还会出现意外中断或流量突然上限的情况。
本指南篇幅较长,因为模型配置看似简单,但一旦遇到问题,例如工具调用速度变慢、出现 429 错误,或者某个代理使用的身份验证配置文件与预期不符等,就会发现其中的奥妙。我们将力求实用。
如果您是 OpenClaw 新手,想先了解基础知识,可以阅读 OpenClaw 简介及其工作原理。如果您已经运行了 OpenClaw,接下来我们来正确地连接模型。
OpenClaw 模型引用的工作原理
OpenClaw 模型引用使用provider/model格式。例如:openai/gpt-5.1-codex或ollama/llama3.3。
如果你设置了此项,agents.defaults.models实际上就创建了一个允许列表。只有列表中列出的模型才符合条件。这在你想防止不同环境下的模型选择出现随机偏差时非常有用。
在实际应用中非常重要的命令行助手:
openclaw onboard用于初始身份验证和提供商设置openclaw models list看看 OpenClaw 能看到什么openclaw models set provider/model无需编辑配置即可快速切换
这些内容在提供商文档中都有明确说明,可以避免配置错误。
在粘贴随机按键之前,请先制定好策略。
策略A:本地优先,托管备用
这是我给大多数自托管用户的默认建议。本地模型可以处理繁琐的日常任务,而备用方案则可以应对'我需要更强大的处理器来处理这个问题'或'我的本地服务器繁忙'的情况。此外,由于大部分流量都停留在本地,因此成本也更可预测。
策略B:仅提供免费托管服务
如果你不需要进行任何本地推理,并且使用量很轻,那么这种方法可行。缺点是免费套餐的额度会变化,你会遇到限制,所以你需要一些备用方案。
策略C:仅限本地
从隐私和成本角度来看,这是最简洁的方案。但它也最依赖硬件。在小型机器上运行的 3B 模型在快速自动化方面表现出色,但在长时间的推理任务中则会崩溃。
真正免费的本地模型
奥拉玛
Ollama 是最常见的'我想要免费且本地化的服务'方案。OpenClaw 支持 Ollama 作为服务提供商,并且可以自动检测本地 Ollama 服务器http://127.0.0.1:11434/v1。
最简配置如下所示:
ollama pull llama3.3 openclaw models list
然后设置您的默认模型openclaw.json:
{ "agents": { "defaults": { "model": { "primary": "ollama/llama3.3" } } } }
如果你想要一套合理的'入门'模型,可以保留一个通用模型作为主模型,再添加一个编码模型作为备用。一开始规模要小,以后可以随时扩展。
Ollama 关于流媒体的警告
由于 SDK 和流格式的特殊性,某些 Ollama 配置的构建版本会禁用流式传输。如果您发现文本输出中泄露了奇怪的工具标记,通常就是这个原因。请将流式传输视为可选而非必需。

