SpringBoot + LangChain4j 打造企业级 RAG 智能知识库,多工具集成方案

SpringBoot + LangChain4j 打造企业级 RAG 智能知识库,多工具集成方案

基于 Spring Boot 4 + LangChain4j 1.11 + Ollama + Qdrant +MCP 的一体化 多Agentic 智能体,RAG 系统

本文结合笔者企业级项目,重新抽象,开发,一个真正“开箱即用”的企业级智能知识库系统。它不仅支持标准 RAG 问答,更融合了 Agentic 智能体架构MCP 文件沙盒金融专用算子混合模型路由,提供从文档上传到复杂推理的完整闭环体验。


1. 总览:技术栈与核心能力 ✨

维度技术选型能力说明
后端框架Spring Boot 4 + SQLite轻量级持久化,无需额外数据库,生产可切换为其他数据,如mysql,pgsql
AI 引擎LangChain4j 1.11支持 Agentic 工具调用、流式响应、上下文记忆
语言模型Ollama(qwen2.5:7b) + 可选 DashScope(qwen-plus本地私有部署 + 云端高性能混合
嵌入模型Ollama(qwen3-embedding:0.6b固定使用本地,保障数据不出域,高性能,降低成本
向量库Qdrant(1024 维)自动建集、高效检索(minScore=0.5)
前端界面纯静态 HTML/JS毛玻璃效果 + 渐变设计,5 大功能页面,少依赖,轻量化。
特色能力🎯 10+ 领域文档管理
🧠 Agentic 多工具协作
📊 金融计算(IRR/债券/期权)
📎 MCP 文件分析
🌤️ 天气/时间查询
企业场景全覆盖

2. 端到端架构 🚀

💡 关键设计:嵌入模型始终走本地 Ollama,确保敏感文档向量化过程完全私有;仅生成模型可动态路由。


3. 模块深度解析

3.1 RAG 检索增强生成 📄

  • 入口RagService
  • 流程
    1. 用户提问 → 本地 qwen3-embedding 生成向量;
    2. Qdrant 检索 top5 相似段落(min-score: 0.5);
    3. 拼接上下文 → 路由至 LLM(本地/云端)→ 流式返回带引用的回答。
  • 文档支持:PDF/TXT 自动分块(chunk-size: 500, overlap: 50),元数据含文件名便于溯源。

3.2 Agentic 智能体对话 ⭐

基于 LangChain4j Agentic 架构,实现自主决策与工具协作:

  • 记忆机制MessageWindowChatMemory,滑动窗口管理最近 2 × context-window-size 条消息(默认 20 条)。
  • 内置工具集(Agent 自主调用):
    • searchKnowledge():向量知识库检索
    • readFile() / listDirectory() / searchFiles():MCP 文件系统操作
    • calculate():数学表达式求值(exp4j)
    • calculateAmortization():贷款摊销计划
    • getIRR() / getBondPrice() / getOptionPrice():金融专用计算
    • getCurrentTime() / getWeather():实时信息查询
  • 执行追踪AgentExecutionInfo 记录完整思考链,前端可展示“Agent 正在读取文件...调用 Black-Scholes...”。

3.3 混合模型路由策略 🔀

通过 ModelRouterService 实现智能分流:

策略配置示例适用场景
PERCENTAGEaliyun: 30, local: 70测试环境、负载均衡
BUSINESS_TYPEaliyun-types: [COMPLEX_QUERY, LONG_CONTEXT]
local-types: [TOOL_CALLING, SIMPLE_QA]
生产推荐:复杂任务上云,工具调用走本地
安全兜底:若未配置 DashScope API Key,自动 100% 路由至本地 Ollama。

3.4 MCP 风格文件沙盒 📎

Model Context Protocol (MCP) 启发,实现安全文件交互:

  • 路径隔离:所有文件存于 uploads/{conversationId}/,按会话隔离。
  • 安全防护
    • 限制根目录(mcp-allowed-directory
    • 防目录遍历(.. 被规范化)
    • 大文件(>5KB)自动截断预览

典型场景

用户上传《信访政策.pdf》 → Agent 调用 readFile() 读取 → 结合 searchKnowledge() 检索知识库 → 对比分析合规性。

3.5 现代化前端界面 🎨

5 个功能页面,统一采用渐变设计 + 毛玻璃效果

页面功能亮点截图预览
📁 文件上传
/upload.html
- 支持 PDF / TXT 上传
- 自动分块 + 向量化入库 Qdrant
- 可指定领域标签(如 FINANCE
💬 智能问答
/chat.html
- 标准 RAG 流式对话
- 回答自动标注引用来源(文件名 + 片段)
- 响应速度快,体验流畅
🤖 Agentic 对话
/agent-chat.html
- 智能体自主调用工具(文件/计算/检索等)
- 实时展示执行轨迹:模型选择 → 工具调用 → 结果整合
- 支持复杂多步推理
📚 领域文档管理
/domain.html

- 管理 10+ 领域知识库(如 TECH, FINANCE, POLICY
- 查看各领域文档数量与状态
- 支持异步处理进度反馈

也可以改造为mq等方式作为ai服务,接受数据存储知识库。

🗃️ Qdrant 管理
/qdrant.html
- 查看现有向量集合(Collections)
- 创建新集合(自动配置 1024 维)
- 调试向量存储状态

4. 快速启动与配置 ⚙️

4.1 本地全栈运行

# 1. 启动 Ollama 并拉取模型 ollama serve ollama pull qwen2.5:7b ollama pull qwen3-embedding:0.6b # 2. 启动 Qdrant docker run -d -p 6333:6333 -p 6334:6334 qdrant/qdrant # 3. 运行应用 mvn spring-boot:run # 4. 访问系统 open http://localhost:8080 

4.2 关键配置 (application.yaml)

# 模型路由(生产建议 BUSINESS_TYPE) model-router: strategy: BUSINESS_TYPE business-type: aliyun-types: [COMPLEX_QUERY, LONG_CONTEXT] local-types: [SIMPLE_QA, TOOL_CALLING] # RAG 参数 rag: chunk-size: 500 chunk-overlap: 50 max-results: 5 min-score: 0.5 # Agent 安全沙盒 agent: context-window-size: 10 mcp-allowed-directory: ./uploads # 严格限制! mcp-file-enabled: true 
🔑 DashScope 配置:设置环境变量 DASHSCOPE_API_KEY 即可启用云端模型。

5. 企业级细节与扩展点 💡

  • 金融计算深度支持
    • 投资分析:IRR(牛顿法)、NPV、摊销计划
    • 债券:定价、到期收益率(YTM)、久期、凸度
    • 期权:Black-Scholes 模型 + Greeks(Delta/Gamma/Vega)
    • 📚 详见 Financial-Calculation-Guide.md
  • 领域知识管理:支持 TECHNOLOGYFINANCE 等 10+ 领域,异步处理入库。
  • 可扩展建议
    • 安全:反向代理层增加上传大小限制,收紧 mcp-allowed-directory
    • 可观测性:将 AgentExecutionInfo 接入日志系统,构建完整审计链
    • 前端:当前静态页可无缝替换为 React/Vue SPA,后端 SSE 接口已就绪

6. 结语:为什么这个项目值得尝试? ✅

“不是 Demo,而是基于已有企业级实现剥离出来的可落地的企业级知识底座。”
  • 全栈私有化:Ollama + Qdrant + SQLite,无外部依赖;
  • Agentic Ready:不止问答,更能自主调用工具、分析文件、执行计算
  • 场景覆盖广:从通用 RAG 到金融/政务等垂直领域;
  • 开箱即用:5 分钟启动,5 个页面覆盖核心需求;
  • 灵活扩展:模型、工具、路由策略均可插拔。

无论是搭建内部知识库、智能客服,还是探索 Agentic AI 应用,这个项目都提供了生产级参考实现。立即克隆,开启您的企业智能之旅!

🔗 项目地址:https://github.com/IdeasForLife/knowledge
⭐ 如果对你有帮助,欢迎 Star 支持!

🚀 最近计划:MCP 智能体 × 企业运维生态

项目目标提供各种ai实际能力,目前正在开发 MCP(Model Context Protocol)智能体在自动化运维场景的深度集成,目标是构建一个具备自主感知、诊断与操作能力的 AI 运维助手。目前已规划对接以下核心系统,实现可插拔的ai能力:

  • 代码与协作:GitLab(PR 分析、CI 状态查询)、飞书文档(故障复盘知识检索)
  • 日志与监控:阿里云日志服务(SLS)、ClickHouse(高性能日志分析)、SkyWalking(分布式链路追踪),CAT(美团开源的监控平台)
  • 基础设施:Kubernetes(Pod 状态、事件查询、资源扩缩容建议)
  • 命令执行:安全沙盒化的 cat / grep / kubectl 等类 CLI 工具调用
  • arthas 线上pod jvm等数据收集

通过统一的 MCP 工具接口,智能体可跨系统关联上下文——例如:

“用户反馈服务变慢” → 自动查询 SkyWalking 链路 → 定位慢接口 → 拉取 Kubernetes Pod 日志 → 分析 ClickHouse 中的错误日志聚合 → 生成根因假设。

🔍 智能归因引擎 正在开发中,未来将支持基于多源数据的自动根因定位与修复建议,真正实现 “观测即行动” 的 AIOps 闭环。敬请期待!

Read more

【OpenClaw从入门到精通】第10篇:OpenClaw生产环境部署全攻略:性能优化+安全加固+监控运维(2026实测版)

【OpenClaw从入门到精通】第10篇:OpenClaw生产环境部署全攻略:性能优化+安全加固+监控运维(2026实测版)

摘要:本文聚焦OpenClaw从测试环境走向生产环境的核心痛点,围绕“性能优化、安全加固、监控运维”三大维度展开实操讲解。先明确生产环境硬件/系统选型标准,再通过硬件层资源管控、模型调度策略、缓存优化等手段提升响应速度(实测响应效率提升50%+);接着从网络、权限、数据三层构建安全防护体系,集成火山引擎安全方案拦截高危操作;最后落地TenacitOS可视化监控与Prometheus告警体系,配套完整故障排查清单和虚拟实战案例。全文所有配置、代码均经实测验证,兼顾新手入门实操性和进阶读者的生产级部署需求,帮助开发者真正实现OpenClaw从“能用”到“放心用”的跨越。 优质专栏欢迎订阅! 【DeepSeek深度应用】【Python高阶开发:AI自动化与数据工程实战】【YOLOv11工业级实战】 【机器视觉:C# + HALCON】【大模型微调实战:平民级微调技术全解】 【人工智能之深度学习】【AI 赋能:Python 人工智能应用实战】【数字孪生与仿真技术实战指南】 【AI工程化落地与YOLOv8/v9实战】【C#工业上位机高级应用:高并发通信+性能优化】 【Java生产级避坑指南:

By Ne0inhk
ARM Linux 驱动开发篇--- Linux 并发与竞争实验(互斥体实现 LED 设备互斥访问)--- Ubuntu20.04互斥体实验

ARM Linux 驱动开发篇--- Linux 并发与竞争实验(互斥体实现 LED 设备互斥访问)--- Ubuntu20.04互斥体实验

🎬 渡水无言:个人主页渡水无言 ❄专栏传送门: 《linux专栏》《嵌入式linux驱动开发》《linux系统移植专栏》 ❄专栏传送门: 《freertos专栏》《STM32 HAL库专栏》 ⭐️流水不争先,争的是滔滔不绝  📚博主简介:第二十届中国研究生电子设计竞赛全国二等奖 |国家奖学金 | 省级三好学生 | 省级优秀毕业生获得者 | ZEEKLOG新星杯TOP18 | 半导纵横专栏博主 | 211在读研究生 在这里主要分享自己学习的linux嵌入式领域知识;有分享错误或者不足的地方欢迎大佬指导,也欢迎各位大佬互相三连 目录 前言  一、实验基础说明 1.1、互斥体简介 1.2 本次实验设计思路 二、硬件原理分析(看过之前博客的可以忽略) 三、实验程序编写 3.1 互斥体 LED 驱动代码(mutex.c) 3.2.1、设备结构体定义(28-39

By Ne0inhk
Flutter for OpenHarmony:swagger_dart_code_generator 接口代码自动化生成的救星(OpenAPI/Swagger) 深度解析与鸿蒙适配指南

Flutter for OpenHarmony:swagger_dart_code_generator 接口代码自动化生成的救星(OpenAPI/Swagger) 深度解析与鸿蒙适配指南

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net 前言 后端工程师扔给你一个 Swagger (OpenAPI) 文档地址,你会怎么做? 1. 对着文档,手写 Dart Model 类(容易写错字段类型)。 2. 手写 Retrofit/Dio 的 API 接口定义(容易拼错 URL)。 3. 当后端修改了字段名,你对着报错修半天。 这是重复劳动的地狱。 swagger_dart_code_generator 可以将 Swagger (JSON/YAML) 文件直接转换为高质量的 Dart 代码,包括: * Model 类:支持 json_serializable,带 fromJson/

By Ne0inhk
Linux 开发别再卡壳!makefile/git/gdb 全流程实操 + 作业解析,新手看完直接用----《Hello Linux!》(5)

Linux 开发别再卡壳!makefile/git/gdb 全流程实操 + 作业解析,新手看完直接用----《Hello Linux!》(5)

文章目录 * 前言 * make/makefile * 文件的三个时间 * Linux第一个小程序-进度条 * 回车和换行 * 缓冲区 * 程序的代码展示 * git指令 * 关于gitee * Linux调试器-gdb使用 * 作业部分 前言 做 Linux 开发时,你是不是也遇到过这些 “卡脖子” 时刻?写 makefile 时,明明语法没错却报错,最后发现是依赖方法行没加 Tab;想提交代码到 gitee,记不清 git add/commit/push 的 “三板斧”,还得反复搜教程;用 gdb 调试程序,输了命令没反应,才想起编译时没加-g生成 debug 版本;甚至连写个进度条,都搞不懂\r和\n的区别,导致进度条乱跳…… 其实这些问题,

By Ne0inhk