OpenClaw 模型引用的工作原理
OpenClaw 模型引用使用provider/model格式。例如:openai/gpt-5.1-codex或ollama/llama3.3。
如果你设置了此项,agents.defaults.models实际上就创建了一个允许列表。只有列表中列出的模型才符合条件。这在你想防止不同环境下的模型选择出现随机偏差时非常有用。
在实际应用中非常重要的命令行助手:
openclaw onboard用于初始身份验证和提供商设置openclaw models list看看 OpenClaw 能看到什么openclaw models set provider/model无需编辑配置即可快速切换
在粘贴随机按键之前,请先制定好策略
策略 A:本地优先,托管备用
这是我给大多数自托管用户的默认建议。本地模型可以处理繁琐的日常任务,而备用方案则可以应对'我需要更强大的处理器来处理这个问题'或'我的本地服务器繁忙'的情况。此外,由于大部分流量都停留在本地,因此成本也更可预测。
策略 B:仅提供免费托管服务
如果你不需要进行任何本地推理,并且使用量很轻,那么这种方法可行。缺点是免费套餐的额度会变化,你会遇到限制,所以你需要一些备用方案。
策略 C:仅限本地
从隐私和成本角度来看,这是最简洁的方案。但它也最依赖硬件。在小型机器上运行的 3B 模型在快速自动化方面表现出色,但在长时间的推理任务中则会崩溃。
真正免费的本地模型
奥拉玛 (Ollama)
Ollama 是最常见的'我想要免费且本地化的服务'方案。OpenClaw 支持 Ollama 作为服务提供商,并且可以自动检测本地 Ollama 服务器http://127.0.0.1:11434/v1。
最简配置如下所示:
ollama pull llama3.3
openclaw models list
然后设置您的默认模型openclaw.json:
{
"agents": {
"defaults": {
"model": {
"primary": "ollama/llama3.3"
}
}
}
}
如果你想要一套合理的'入门'模型,可以保留一个通用模型作为主模型,再添加一个编码模型作为备用。一开始规模要小,以后可以随时扩展。
Ollama 关于流媒体的警告
由于 SDK 和流格式的特殊性,某些 Ollama 配置的构建版本会禁用流式传输。如果您发现文本输出中泄露了奇怪的工具标记,通常就是这个原因。请将流式传输视为可选而非必需。

