openclaw使用本地llama.cpp

llama.cpp兼容openapi接口,自然可以作为openclaw的后端。
添加自定义provider同前:为openclaw增加自定义provider
反复修改,总是不能得到正确的model状态。

{"meta":{"lastTouchedVersion":"2026.2.3-1", "lastTouchedAt":"2026-02-05T12:16:30.399Z"}, "wizard":{"lastRunAt":"2026-01-30T12:20:58.674Z", "lastRunVersion":"2026.1.29", "lastRunCommand":"onboard", "lastRunMode":"local"}, "models":{"mode":"merge", "providers":{"llamacpp":{"baseUrl":"http://192.168.1.182:8087/v1", "apiKey":"no need key", "api":"openai-completions", "models":[{"id":"Qwen3-8B-Q6_K", "name":"Qwen3", "api":"openai-completions", "reasoning": true, "input":["text"], "cost":{"input":0, "output":0, "cacheRead":0, "cacheWrite":0}, "contextWindow":262144, "maxTokens":32000}]}}}, "agents":{"defaults":{"model":{"primary":"llamacpp/Qwen3-8B-Q6_K"}, "models":{"llamacpp/Qwen3-8B-Q6_K":{"alias":"Qwen3"}}, "maxConcurrent":4, "subagents":{"maxConcurrent":8}}}, "messages":{"ackReactionScope":"group-mentions"}, "commands":{"native":"auto", "nativeSkills":"auto"}, "gateway":{"port":18789, "mode":"local", "bind":"loopback", "auth":{"mode":"token", "token":"a08c51975f90e3afa566f4af1de977a70b6e9630909cc8c0", "password":"a08c51975f90e3afa566f4af1de977a70b6e9630909cc8c0"}, "tailscale":{"mode":"off", "resetOnExit":false}}, "skills":{"install":{"nodeManager":"npm"}}}

注意C:\Users\yusp7.openclaw\agents\main\agent\models.json,要与config\models\provider里一致,内容不能有重复provider名的:

{"providers":{"llamacpp":{"baseUrl":"http://192.168.1.182:8087/v1", "apiKey":"no need key", "api":"openai-completions", "models":[{"id":"Qwen3-8B-Q6_K", "name":"Qwen3", "api":"openai-completions", "reasoning": true, "input":["text"], "cost":{"input":0, "output":0, "cacheRead":0, "cacheWrite":0}, "contextWindow":262144, "maxTokens":32000}]}}}
在这里插入图片描述


但是,为什么返回的对话不对?

在这里插入图片描述

Read more

本地 AI Agent 平台实战:DeerFlow Windows 全栈部署与架构深度解析

本地 AI Agent 平台实战:DeerFlow Windows 全栈部署与架构深度解析

目录 1. 痛点直击:为什么我们需要在本地部署 AI Agent 平台? 2. 核心方案:总体架构与设计思路 2.1 架构拓扑图 2.2 核心技术选型理由 2.3 设计意图解析 3. 实战演练:一步步实现 (Step-by-Step) 3.1 环境准备:工欲善其事 3.2 项目克隆与配置 3.3 安装依赖与启动服务 4. 原理深挖:黑盒之下发生了什么 4.1 请求生命周期时序图 4.2 状态管理核心 (LangGraph State) 4.3 沙箱隔离原理 5. 避坑指南:生产环境的血泪教训

ibbot(智体机灵):国产开源AI智能体平台的全面解析

ibbot(智体机灵):国产开源AI智能体平台的全面解析

ibbot(智体机灵):国产开源AI智能体平台的全面解析 ibbot,全称ibbot智体机灵,是一个极具创新性的国产开源AI智能体(Agent)平台与操作系统。它的核心使命是将复杂的AI智能体能力封装成易于使用、可扩展的工具,显著降低个人用户的使用门槛,让AI技术真正走进日常生活和工作。 从产品定位来看,ibbot集多重身份于一体:首先,它是一个功能强大的AI智能体平台,支持创建、调度和管理多种AI智能体;其次,它通过预装系统的定制安卓手机(青春版)实现了移动AI工作站的构想,让用户可以随时随地使用完整的AI智能体生态;再者,作为一个开源项目生态,它包含ibbot核心、dtnsbot(设备集成)、dtns.os(底层系统)等多个子项目,鼓励社区共同参与建设。 ibbot的核心功能体系十分丰富: 1. 复杂任务执行:用户只需用自然语言描述任务,ibbot就能自动分解并调度相应Agent完成,支持多达60多步的连续复杂任务。 2. AI编程与建站:支持通过自然语言指令自动生成代码和网站页面,大幅降低技术门槛。 3. 知识库管理:支持多种格式文档上传,构建专属知识库并进行智能

从思考到实现:在 VS Code 中集成 MiniMax M2.1,解锁 AI 编程新范式

从思考到实现:在 VS Code 中集成 MiniMax M2.1,解锁 AI 编程新范式

在 AI 辅助编程(AI Coding)百家争鸣的今天,开发者们一直在寻找那个既能理解复杂逻辑、又能精准产出代码的“神队友”。最近,MiniMax M2.1 凭借其独特的 Interleaved Thinking(交错思考) 机制,在编程圈引起了广泛关注。 为什么选择 MiniMax 进行编程? 1. 逻辑严密的“交错思考”:不同于普通模型直接输出代码,M2.1 会先在 <think> 标签内进行深度推理,分析架构后再下笔,极大地减少了逻辑断层。 2. 超大上下文支持:在处理大型项目或重构复杂函数时,M2.1 能够精准捕捉全局上下文信息。 3. 极速中文理解:作为国产大模型的佼佼者,它在中文注释理解和响应速度上有着天然优势,拒绝“小作文”式的废话。 选购指南:主流

文心一言 4.5 开源深度剖析:性能中文双项碾压,开源引擎驱动行业变革,解锁大模型新范式

文心一言 4.5 开源深度剖析:性能中文双项碾压,开源引擎驱动行业变革,解锁大模型新范式

引言 不知道大家关注到没?文心大模型 ERNIE 4.5 已开源并首发于 GitCode 平台!不同于以往的开源模型,百度这次一口气开源了 10 款模型,覆盖基础、对话、多模态、思考等多个方向,甚至将核心训练框架、分布式策略完全开放。在基准测试中,文心开源即刷榜,性能大幅超越 Qwen3 、 DeepSeek-V3 等模型;下面跟随博主一起从模型架构特性、技术分析、部署难度等来对文心模型全面解析一下! 文章目录 * 引言 * 一、文心大模型 ERNIE 4.5 开源简介 * 1.1 开源模型版本介绍 * 1.2 基准测试表现 * 1.3 全面的工具生态链 * 二、文心大模型 ERNIE 4.5技术分析