SpringBoot + LangChain4j 打造企业级 RAG 智能知识库,多工具集成方案

SpringBoot + LangChain4j 打造企业级 RAG 智能知识库,多工具集成方案

基于 Spring Boot 4 + LangChain4j 1.11 + Ollama + Qdrant +MCP 的一体化 多Agentic 智能体,RAG 系统

本文结合笔者企业级项目,重新抽象,开发,一个真正“开箱即用”的企业级智能知识库系统。它不仅支持标准 RAG 问答,更融合了 Agentic 智能体架构MCP 文件沙盒金融专用算子混合模型路由,提供从文档上传到复杂推理的完整闭环体验。


1. 总览:技术栈与核心能力 ✨

维度技术选型能力说明
后端框架Spring Boot 4 + SQLite轻量级持久化,无需额外数据库,生产可切换为其他数据,如mysql,pgsql
AI 引擎LangChain4j 1.11支持 Agentic 工具调用、流式响应、上下文记忆
语言模型Ollama(qwen2.5:7b) + 可选 DashScope(qwen-plus本地私有部署 + 云端高性能混合
嵌入模型Ollama(qwen3-embedding:0.6b固定使用本地,保障数据不出域,高性能,降低成本
向量库Qdrant(1024 维)自动建集、高效检索(minScore=0.5)
前端界面纯静态 HTML/JS毛玻璃效果 + 渐变设计,5 大功能页面,少依赖,轻量化。
特色能力🎯 10+ 领域文档管理
🧠 Agentic 多工具协作
📊 金融计算(IRR/债券/期权)
📎 MCP 文件分析
🌤️ 天气/时间查询
企业场景全覆盖

2. 端到端架构 🚀

💡 关键设计:嵌入模型始终走本地 Ollama,确保敏感文档向量化过程完全私有;仅生成模型可动态路由。


3. 模块深度解析

3.1 RAG 检索增强生成 📄

  • 入口RagService
  • 流程
    1. 用户提问 → 本地 qwen3-embedding 生成向量;
    2. Qdrant 检索 top5 相似段落(min-score: 0.5);
    3. 拼接上下文 → 路由至 LLM(本地/云端)→ 流式返回带引用的回答。
  • 文档支持:PDF/TXT 自动分块(chunk-size: 500, overlap: 50),元数据含文件名便于溯源。

3.2 Agentic 智能体对话 ⭐

基于 LangChain4j Agentic 架构,实现自主决策与工具协作:

  • 记忆机制MessageWindowChatMemory,滑动窗口管理最近 2 × context-window-size 条消息(默认 20 条)。
  • 内置工具集(Agent 自主调用):
    • searchKnowledge():向量知识库检索
    • readFile() / listDirectory() / searchFiles():MCP 文件系统操作
    • calculate():数学表达式求值(exp4j)
    • calculateAmortization():贷款摊销计划
    • getIRR() / getBondPrice() / getOptionPrice():金融专用计算
    • getCurrentTime() / getWeather():实时信息查询
  • 执行追踪AgentExecutionInfo 记录完整思考链,前端可展示“Agent 正在读取文件...调用 Black-Scholes...”。

3.3 混合模型路由策略 🔀

通过 ModelRouterService 实现智能分流:

策略配置示例适用场景
PERCENTAGEaliyun: 30, local: 70测试环境、负载均衡
BUSINESS_TYPEaliyun-types: [COMPLEX_QUERY, LONG_CONTEXT]
local-types: [TOOL_CALLING, SIMPLE_QA]
生产推荐:复杂任务上云,工具调用走本地
安全兜底:若未配置 DashScope API Key,自动 100% 路由至本地 Ollama。

3.4 MCP 风格文件沙盒 📎

Model Context Protocol (MCP) 启发,实现安全文件交互:

  • 路径隔离:所有文件存于 uploads/{conversationId}/,按会话隔离。
  • 安全防护
    • 限制根目录(mcp-allowed-directory
    • 防目录遍历(.. 被规范化)
    • 大文件(>5KB)自动截断预览

典型场景

用户上传《信访政策.pdf》 → Agent 调用 readFile() 读取 → 结合 searchKnowledge() 检索知识库 → 对比分析合规性。

3.5 现代化前端界面 🎨

5 个功能页面,统一采用渐变设计 + 毛玻璃效果

页面功能亮点截图预览
📁 文件上传
/upload.html
- 支持 PDF / TXT 上传
- 自动分块 + 向量化入库 Qdrant
- 可指定领域标签(如 FINANCE
💬 智能问答
/chat.html
- 标准 RAG 流式对话
- 回答自动标注引用来源(文件名 + 片段)
- 响应速度快,体验流畅
🤖 Agentic 对话
/agent-chat.html
- 智能体自主调用工具(文件/计算/检索等)
- 实时展示执行轨迹:模型选择 → 工具调用 → 结果整合
- 支持复杂多步推理
📚 领域文档管理
/domain.html

- 管理 10+ 领域知识库(如 TECH, FINANCE, POLICY
- 查看各领域文档数量与状态
- 支持异步处理进度反馈

也可以改造为mq等方式作为ai服务,接受数据存储知识库。

🗃️ Qdrant 管理
/qdrant.html
- 查看现有向量集合(Collections)
- 创建新集合(自动配置 1024 维)
- 调试向量存储状态

4. 快速启动与配置 ⚙️

4.1 本地全栈运行

# 1. 启动 Ollama 并拉取模型 ollama serve ollama pull qwen2.5:7b ollama pull qwen3-embedding:0.6b # 2. 启动 Qdrant docker run -d -p 6333:6333 -p 6334:6334 qdrant/qdrant # 3. 运行应用 mvn spring-boot:run # 4. 访问系统 open http://localhost:8080 

4.2 关键配置 (application.yaml)

# 模型路由(生产建议 BUSINESS_TYPE) model-router: strategy: BUSINESS_TYPE business-type: aliyun-types: [COMPLEX_QUERY, LONG_CONTEXT] local-types: [SIMPLE_QA, TOOL_CALLING] # RAG 参数 rag: chunk-size: 500 chunk-overlap: 50 max-results: 5 min-score: 0.5 # Agent 安全沙盒 agent: context-window-size: 10 mcp-allowed-directory: ./uploads # 严格限制! mcp-file-enabled: true 
🔑 DashScope 配置:设置环境变量 DASHSCOPE_API_KEY 即可启用云端模型。

5. 企业级细节与扩展点 💡

  • 金融计算深度支持
    • 投资分析:IRR(牛顿法)、NPV、摊销计划
    • 债券:定价、到期收益率(YTM)、久期、凸度
    • 期权:Black-Scholes 模型 + Greeks(Delta/Gamma/Vega)
    • 📚 详见 Financial-Calculation-Guide.md
  • 领域知识管理:支持 TECHNOLOGYFINANCE 等 10+ 领域,异步处理入库。
  • 可扩展建议
    • 安全:反向代理层增加上传大小限制,收紧 mcp-allowed-directory
    • 可观测性:将 AgentExecutionInfo 接入日志系统,构建完整审计链
    • 前端:当前静态页可无缝替换为 React/Vue SPA,后端 SSE 接口已就绪

6. 结语:为什么这个项目值得尝试? ✅

“不是 Demo,而是基于已有企业级实现剥离出来的可落地的企业级知识底座。”
  • 全栈私有化:Ollama + Qdrant + SQLite,无外部依赖;
  • Agentic Ready:不止问答,更能自主调用工具、分析文件、执行计算
  • 场景覆盖广:从通用 RAG 到金融/政务等垂直领域;
  • 开箱即用:5 分钟启动,5 个页面覆盖核心需求;
  • 灵活扩展:模型、工具、路由策略均可插拔。

无论是搭建内部知识库、智能客服,还是探索 Agentic AI 应用,这个项目都提供了生产级参考实现。立即克隆,开启您的企业智能之旅!

🔗 项目地址:https://github.com/IdeasForLife/knowledge
⭐ 如果对你有帮助,欢迎 Star 支持!

🚀 最近计划:MCP 智能体 × 企业运维生态

项目目标提供各种ai实际能力,目前正在开发 MCP(Model Context Protocol)智能体在自动化运维场景的深度集成,目标是构建一个具备自主感知、诊断与操作能力的 AI 运维助手。目前已规划对接以下核心系统,实现可插拔的ai能力:

  • 代码与协作:GitLab(PR 分析、CI 状态查询)、飞书文档(故障复盘知识检索)
  • 日志与监控:阿里云日志服务(SLS)、ClickHouse(高性能日志分析)、SkyWalking(分布式链路追踪),CAT(美团开源的监控平台)
  • 基础设施:Kubernetes(Pod 状态、事件查询、资源扩缩容建议)
  • 命令执行:安全沙盒化的 cat / grep / kubectl 等类 CLI 工具调用
  • arthas 线上pod jvm等数据收集

通过统一的 MCP 工具接口,智能体可跨系统关联上下文——例如:

“用户反馈服务变慢” → 自动查询 SkyWalking 链路 → 定位慢接口 → 拉取 Kubernetes Pod 日志 → 分析 ClickHouse 中的错误日志聚合 → 生成根因假设。

🔍 智能归因引擎 正在开发中,未来将支持基于多源数据的自动根因定位与修复建议,真正实现 “观测即行动” 的 AIOps 闭环。敬请期待!

Read more

FPGA内部资源详解:LUT、FF、BRAM、DSP、PLL是什么?综合报告怎么看

FPGA内部资源详解:LUT、FF、BRAM、DSP、PLL是什么?综合报告怎么看

本文是《FPGA入门到实战》专栏第8篇。上一篇完成了第一个下板项目,本篇从芯片内部视角出发,深入讲解 FPGA 的五大核心硬件资源:LUT、FF、BRAM、DSP 和 PLL。理解这些资源的工作原理和使用限制,是写出高质量 FPGA 代码、读懂综合报告的基础。 FPGA内部资源详解:LUT、FF、BRAM、DSP、PLL是什么?综合报告怎么看 * 1. 为什么要了解内部资源 * 1.1 Artix-7 资源概览 * 2. LUT 查找表 * 2.1 LUT 是什么 * 2.2 LUT 实现任意 6 输入函数 * 2.3 LUT 的双输出模式(O5/

By Ne0inhk
【OpenHarmony】鸿蒙Flutter智能家居应用开发实战指南

【OpenHarmony】鸿蒙Flutter智能家居应用开发实战指南

鸿蒙Flutter智能家居应用开发实战指南 概述 智能家居是鸿蒙全场景生态的重要应用场景。本文讲解如何基于鸿蒙Flutter框架,开发一套完整的智能家居应用,实现设备发现、控制、场景联动、语音交互等核心功能。 欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net 系统架构设计 整体架构图 ┌────────────────────────────────────────────────────────────┐ │ 用户交互层 (Flutter) │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │ │ 设备控制面板 │ │ 场景编排 │ │ 语音交互 │ │ │ └─────────────┘ └─────────────┘ └─────────────┘ │ └───────────────────────┬────────────────────────────────────┘ │ RPC/事件总线 ┌────────────────────

By Ne0inhk

OpenClaw中飞书机器人配置指南:如何让群消息免 @ 也能自动回复

用 OpenClaw 做飞书机器人时,默认配置下,群里的消息必须 @ 机器人 才能触发回复。这在很多场景下很不方便——如果希望机器人在群里"隐身"工作,不用 @ 就能自动监听和回复,需要额外配置。 本文记录我解决这个问题的完整过程,供同样踩坑的同学参考。 问题描述 现象: * 飞书群里 @ 机器人 → 正常回复 ✅ * 飞书群里不 @ 机器人 → 没有任何反应 ❌ 环境: * OpenClaw 框架 * 飞书自建应用(机器人) * WebSocket 长连接模式 解决过程 第一步:修改 OpenClaw 配置 在 openclaw.json 中找到飞书渠道配置: "channels":{"feishu":{"requireMention&

By Ne0inhk
Trae x 图片素描MCP一键将普通图片转换为多风格素描效果

Trae x 图片素描MCP一键将普通图片转换为多风格素描效果

目录 * 前言 * 一、核心工具与优势解析 * 二、操作步骤:从安装到生成素描效果 * 第一步:获取MCP配置代码 * 第二步:下载 * 第三步:在 Trae 中导入 MCP 配置并建立连接 * 第四步:核心功能调用 * 三、三大素描风格差异化应用 * 四.总结 前言 在设计创作、社交媒体分享、教育演示等场景中,素描风格的图片往往能以简洁的线条突出主体特征,带来独特的艺术质感。然而,传统素描效果制作需借助专业设计软件(如Photoshop、Procreate),不仅操作复杂,还需掌握一定的绘画技巧,难以满足普通用户快速生成素描的需求。 为解决这一痛点,本文将介绍蓝耘MCP广场提供的图片素描MCP工具(工具ID:3423)。该工具基于MCP(Model Context Protocol)协议开发,支持单张/批量图片转换、3种素描风格切换及自定义参数调节,兼容多种图片格式与中文路径,无需专业设计能力,

By Ne0inhk