SpringBoot + LangChain4j 打造企业级 RAG 智能知识库，多工具集成方案

Ne0inhk

24 Mar 2026 — 8 min read

基于 Spring Boot 4 + LangChain4j 1.11 + Ollama + Qdrant +MCP 的一体化多Agentic 智能体，RAG 系统

本文结合笔者企业级项目，重新抽象，开发，一个真正“开箱即用”的企业级智能知识库系统。它不仅支持标准 RAG 问答，更融合了 Agentic 智能体架构、MCP 文件沙盒、金融专用算子 和 混合模型路由，提供从文档上传到复杂推理的完整闭环体验。

1. 总览：技术栈与核心能力 ✨

维度	技术选型	能力说明
后端框架	Spring Boot 4 + SQLite	轻量级持久化，无需额外数据库，生产可切换为其他数据，如mysql,pgsql
AI 引擎	LangChain4j 1.11	支持 Agentic 工具调用、流式响应、上下文记忆
语言模型	Ollama（`qwen2.5:7b`） + 可选 DashScope（`qwen-plus`）	本地私有部署 + 云端高性能混合
嵌入模型	Ollama（`qwen3-embedding:0.6b`）	固定使用本地，保障数据不出域，高性能，降低成本
向量库	Qdrant（1024 维）	自动建集、高效检索（minScore=0.5）
前端界面	纯静态 HTML/JS	毛玻璃效果 + 渐变设计，5 大功能页面，少依赖，轻量化。
特色能力	🎯 10+ 领域文档管理 🧠 Agentic 多工具协作 📊 金融计算（IRR/债券/期权） 📎 MCP 文件分析 🌤️ 天气/时间查询	企业场景全覆盖

2. 端到端架构 🚀

💡 关键设计：嵌入模型始终走本地 Ollama，确保敏感文档向量化过程完全私有；仅生成模型可动态路由。

3. 模块深度解析

3.1 RAG 检索增强生成 📄

入口：RagService
流程：
1. 用户提问 → 本地 qwen3-embedding 生成向量；
2. Qdrant 检索 top5 相似段落（min-score: 0.5）；
3. 拼接上下文 → 路由至 LLM（本地/云端）→ 流式返回带引用的回答。
文档支持：PDF/TXT 自动分块（chunk-size: 500, overlap: 50），元数据含文件名便于溯源。

3.2 Agentic 智能体对话 ⭐

基于 LangChain4j Agentic 架构，实现自主决策与工具协作：

记忆机制：MessageWindowChatMemory，滑动窗口管理最近 2 × context-window-size 条消息（默认 20 条）。
内置工具集（Agent 自主调用）：
- searchKnowledge()：向量知识库检索
- readFile() / listDirectory() / searchFiles()：MCP 文件系统操作
- calculate()：数学表达式求值（exp4j）
- calculateAmortization()：贷款摊销计划
- getIRR() / getBondPrice() / getOptionPrice()：金融专用计算
- getCurrentTime() / getWeather()：实时信息查询
执行追踪：AgentExecutionInfo 记录完整思考链，前端可展示“Agent 正在读取文件...调用 Black-Scholes...”。

3.3 混合模型路由策略 🔀

通过 ModelRouterService 实现智能分流：

策略	配置示例	适用场景
PERCENTAGE	`aliyun: 30, local: 70`	测试环境、负载均衡
BUSINESS_TYPE	`aliyun-types: [COMPLEX_QUERY, LONG_CONTEXT]` `local-types: [TOOL_CALLING, SIMPLE_QA]`	生产推荐：复杂任务上云，工具调用走本地

✅ 安全兜底：若未配置 DashScope API Key，自动 100% 路由至本地 Ollama。

3.4 MCP 风格文件沙盒 📎

受 Model Context Protocol (MCP) 启发，实现安全文件交互：

路径隔离：所有文件存于 uploads/{conversationId}/，按会话隔离。
安全防护：
- 限制根目录（mcp-allowed-directory）
- 防目录遍历（.. 被规范化）
- 大文件（>5KB）自动截断预览

典型场景：

用户上传《信访政策.pdf》 → Agent 调用 readFile() 读取 → 结合 searchKnowledge() 检索知识库 → 对比分析合规性。

3.5 现代化前端界面 🎨

5 个功能页面，统一采用渐变设计 + 毛玻璃效果：

页面	功能亮点	截图预览
📁 文件上传 `/upload.html`	- 支持 PDF / TXT 上传 - 自动分块 + 向量化入库 Qdrant - 可指定领域标签（如 `FINANCE`）
💬 智能问答 `/chat.html`	- 标准 RAG 流式对话 - 回答自动标注引用来源（文件名 + 片段） - 响应速度快，体验流畅
🤖 Agentic 对话 `/agent-chat.html`	- 智能体自主调用工具（文件/计算/检索等） - 实时展示执行轨迹：模型选择 → 工具调用 → 结果整合 - 支持复杂多步推理
📚 领域文档管理 `/domain.html`	- 管理 10+ 领域知识库（如 `TECH`, `FINANCE`, `POLICY`） - 查看各领域文档数量与状态 - 支持异步处理进度反馈也可以改造为mq等方式作为ai服务，接受数据存储知识库。
🗃️ Qdrant 管理 `/qdrant.html`	- 查看现有向量集合（Collections） - 创建新集合（自动配置 1024 维） - 调试向量存储状态

4. 快速启动与配置 ⚙️

4.1 本地全栈运行

# 1. 启动 Ollama 并拉取模型 ollama serve ollama pull qwen2.5:7b ollama pull qwen3-embedding:0.6b # 2. 启动 Qdrant docker run -d -p 6333:6333 -p 6334:6334 qdrant/qdrant # 3. 运行应用 mvn spring-boot:run # 4. 访问系统 open http://localhost:8080

4.2 关键配置 (`application.yaml`)

# 模型路由（生产建议 BUSINESS_TYPE） model-router: strategy: BUSINESS_TYPE business-type: aliyun-types: [COMPLEX_QUERY, LONG_CONTEXT] local-types: [SIMPLE_QA, TOOL_CALLING] # RAG 参数 rag: chunk-size: 500 chunk-overlap: 50 max-results: 5 min-score: 0.5 # Agent 安全沙盒 agent: context-window-size: 10 mcp-allowed-directory: ./uploads # 严格限制！ mcp-file-enabled: true

🔑 DashScope 配置：设置环境变量 DASHSCOPE_API_KEY 即可启用云端模型。

5. 企业级细节与扩展点 💡

金融计算深度支持：
- 投资分析：IRR（牛顿法）、NPV、摊销计划
- 债券：定价、到期收益率（YTM）、久期、凸度
- 期权：Black-Scholes 模型 + Greeks（Delta/Gamma/Vega）
- 📚 详见 Financial-Calculation-Guide.md
领域知识管理：支持 TECHNOLOGY、FINANCE 等 10+ 领域，异步处理入库。
可扩展建议：
- 安全：反向代理层增加上传大小限制，收紧 mcp-allowed-directory
- 可观测性：将 AgentExecutionInfo 接入日志系统，构建完整审计链
- 前端：当前静态页可无缝替换为 React/Vue SPA，后端 SSE 接口已就绪

6. 结语：为什么这个项目值得尝试？ ✅

“不是 Demo，而是基于已有企业级实现剥离出来的可落地的企业级知识底座。”

全栈私有化：Ollama + Qdrant + SQLite，无外部依赖；
Agentic Ready：不止问答，更能自主调用工具、分析文件、执行计算；
场景覆盖广：从通用 RAG 到金融/政务等垂直领域；
开箱即用：5 分钟启动，5 个页面覆盖核心需求；
灵活扩展：模型、工具、路由策略均可插拔。

无论是搭建内部知识库、智能客服，还是探索 Agentic AI 应用，这个项目都提供了生产级参考实现。立即克隆，开启您的企业智能之旅！

🔗 项目地址：https://github.com/IdeasForLife/knowledge
⭐ 如果对你有帮助，欢迎 Star 支持！

🚀 最近计划：MCP 智能体 × 企业运维生态

项目目标提供各种ai实际能力，目前正在开发 MCP（Model Context Protocol）智能体在自动化运维场景的深度集成，目标是构建一个具备自主感知、诊断与操作能力的 AI 运维助手。目前已规划对接以下核心系统，实现可插拔的ai能力：

代码与协作：GitLab（PR 分析、CI 状态查询）、飞书文档（故障复盘知识检索）
日志与监控：阿里云日志服务（SLS）、ClickHouse（高性能日志分析）、SkyWalking（分布式链路追踪），CAT（美团开源的监控平台）
基础设施：Kubernetes（Pod 状态、事件查询、资源扩缩容建议）
命令执行：安全沙盒化的 cat / grep / kubectl 等类 CLI 工具调用
arthas 线上pod jvm等数据收集

通过统一的 MCP 工具接口，智能体可跨系统关联上下文——例如：

“用户反馈服务变慢” → 自动查询 SkyWalking 链路 → 定位慢接口 → 拉取 Kubernetes Pod 日志 → 分析 ClickHouse 中的错误日志聚合 → 生成根因假设。

🔍 智能归因引擎 正在开发中，未来将支持基于多源数据的自动根因定位与修复建议，真正实现 “观测即行动” 的 AIOps 闭环。敬请期待！

SpringBoot + LangChain4j 打造企业级 RAG 智能知识库，多工具集成方案

Ne0inhk

1. 总览：技术栈与核心能力 ✨

2. 端到端架构 🚀

💡 关键设计：嵌入模型始终走本地 Ollama，确保敏感文档向量化过程完全私有；仅生成模型可动态路由。

3. 模块深度解析

3.1 RAG 检索增强生成 📄

3.2 Agentic 智能体对话 ⭐

3.3 混合模型路由策略 🔀

3.4 MCP 风格文件沙盒 📎

3.5 现代化前端界面 🎨

4. 快速启动与配置 ⚙️

4.1 本地全栈运行

4.2 关键配置 (`application.yaml`)

5. 企业级细节与扩展点 💡

6. 结语：为什么这个项目值得尝试？ ✅

🚀 最近计划：MCP 智能体 × 企业运维生态

Read more

FPGA内部资源详解：LUT、FF、BRAM、DSP、PLL是什么？综合报告怎么看

【OpenHarmony】鸿蒙Flutter智能家居应用开发实战指南

OpenClaw中飞书机器人配置指南：如何让群消息免 @ 也能自动回复

Trae x 图片素描MCP一键将普通图片转换为多风格素描效果

1. 总览：技术栈与核心能力 ✨

2. 端到端架构 🚀

💡 关键设计：嵌入模型始终走本地 Ollama，确保敏感文档向量化过程完全私有；仅生成模型可动态路由。

3. 模块深度解析

3.1 RAG 检索增强生成 📄

3.2 Agentic 智能体对话 ⭐

3.3 混合模型路由策略 🔀

3.4 MCP 风格文件沙盒 📎

3.5 现代化前端界面 🎨

4. 快速启动与配置 ⚙️

4.1 本地全栈运行

4.2 关键配置 (application.yaml)

5. 企业级细节与扩展点 💡

6. 结语：为什么这个项目值得尝试？ ✅

🚀 最近计划：MCP 智能体 × 企业运维生态

Read more

FPGA内部资源详解：LUT、FF、BRAM、DSP、PLL是什么？综合报告怎么看

【OpenHarmony】鸿蒙Flutter智能家居应用开发实战指南

OpenClaw中飞书机器人配置指南：如何让群消息免 @ 也能自动回复

Trae x 图片素描MCP一键将普通图片转换为多风格素描效果

4.2 关键配置 (`application.yaml`)