开源 MaxKB 企业级智能体平台技术解析
MaxKB(全称 Max Knowledge Brain)是一款企业级智能体平台,以开源易用、可逐步拓展的特性,解决企业 AI 落地面临的技术门槛高、部署成本高、迭代周期长的问题。该平台支持多模型接入与全流程 RAG 管道,已覆盖多个行业的众多企业。
一、技术内核拆解:从 RAG 到 Agent 的全栈架构
1. 模型中立:多类型大模型的适配能力
MaxKB 的模型中立性基于模块化适配架构,打破单一模型绑定限制:
- 覆盖范围:支持本地私有模型(Llama 3、Qwen 2 等)、国内公域模型(DeepSeek、通义千问、腾讯混元、字节豆包、百度千帆等)、国外主流模型(OpenAI、Anthropic、Gemini 等),同时兼容语音识别、视觉识别等多模态模型;
- 集成特性:通过标准化 API 接口与模型适配层,新模型接入无需重构核心代码,企业可根据成本预算与性能需求动态切换。
2. 全流程 RAG 管道:可信问答链路的技术实现
作为 MaxKB 的核心技术支柱,RAG 管道通过'摄取 - 处理 - 检索 - 生成'四阶段构建问答链路:
- 多源摄取层:支持 TXT、Markdown、PDF、DOCX、Excel、CSV 等 10 余种格式文档的拖拽上传,可通过 URL 自动爬取 Web 文档、飞书文档,单次最多上传 50 个文件(单个最大 100MB,支持配置扩展至 1000MB);
- 智能处理层:
- 分段:默认按 Markdown 层级智能拆分(最多 6 级标题),复杂文档可通过正则表达式自定义分段规则,保障段落语义完整;
- 向量化:采用 Embedding 模型将文本转换为高维向量,存储于 PostgreSQL 等向量数据库,为语义检索提供基础;
- 双模式检索:
- 混合检索:融合向量语义匹配与全文关键词检索,通过重排序算法筛选结果;
- 精准控制:支持相似度阈值设置(常规建议 0.75),可配置'引用分段数 TOP'与'最大字符数',避免信息过载;
- 生成策略:命中知识库时可选择'模型优化生成'或'直接原文返回',未命中时支持指定回复内容,提升问答可信度。
3. 渐进式智能升级:从工具到 Agent 的拓展路径
MaxKB 以阶梯式能力适配企业不同发展阶段,无需一次性技术跃迁:
- 基础层(RAG 问答):关联知识库即可上线,支持语音输入输出、历史对话缓存(0-10 条可调);
- 进阶层(Workflow 编排):通过拖拽式工作流引擎,串联'知识库检索→模型推理→工具调用'等环节,非技术人员可搭建自动化流程;
- 高级层(Agent 智能体):支持两类工具调用扩展:
- 函数工具:通过 Python 编写自定义函数,实现数据提取、逻辑判断等功能;
- MCP 服务工具:对接第三方服务 API,实现数据库查询、邮件发送、ERP 系统交互等操作。
4. 零编码集成:多场景系统融合方案
MaxKB 通过'嵌入式 + API'双路径实现系统融合:
- 前端嵌入:复制生成的代码即可将智能体以浮窗/全屏模式嵌入网站、公众号、企业微信等,支持主题色自定义与品牌 LOGO 配置;
- 后端对接:开放 API 接口供 ERP、CRM 等业务系统调用;
- 多端适配:支持浏览器、移动端、桌面端交互,语音功能适配移动端办公场景。


