spring-ai-alibaba DataAgent 项目后端(Java)深度分析

spring-ai-alibaba DataAgent 项目后端(Java)深度分析

spring-ai-alibaba DataAgent 项目后端(Java)深度分析

视角:Java 后端研发(Spring Boot / MyBatis / Spring AI)。

范围:重点分析 data-agent-management(后端管理服务),前端仅作为调用方不展开。

目录

  • 项目定位与核心能力
  • 运行形态与依赖
  • 后端模块结构与分层
  • 核心功能域(按业务)
  • 核心执行链路(从请求到落库/外部调用)
  • 工作流(StateGraph)架构解读
  • 数据持久化与初始化脚本
  • 向量检索与知识体系
  • 模型配置与 LLM/Embedding 动态切换
  • 异步、事件与定时任务
  • 横切关注点(异常/响应/日志/校验/安全)
  • 风险点与改进建议
  • 关键文件索引(建议从这里读起)

在这里插入图片描述

项目地址

https://github.com/spring-ai-alibaba/DataAgent.git

使用教程

这里不做使用教程的详细描述,直接贴上官网的简单教程。

https://github.com/spring-ai-alibaba/DataAgent/blob/main/docs/QUICK_START.md

项目定位与核心能力

data-agent-management 是一个“数据智能体管理与执行服务”,其核心目标是:

  • 管理智能体(Agent)、数据源(Datasource)、语义模型(Semantic Model)、知识(Business/Agent Knowledge)、模型配置(Chat/Embedding)等资产。
  • 通过“工作流图(StateGraph)”把自然语言需求编排为一条可观测的链路:
    • 召回证据(知识/术语)
    • 召回 Schema(表/字段)
    • 规划(Planner)
    • 生成/修复 SQL(NL2SQL)
    • 执行 SQL 得到数据
    • 可选:Python 代码执行、报告生成、人工反馈续跑
  • 向量化能力贯穿:
    • Schema 向量化(table/column 等)
    • 业务术语/知识文档向量化
    • 执行时向量召回辅助 NL2SQL/规划

从架构上,它是:

  • 一个 Spring Boot 管理服务(HTTP API + SSE 流式输出)
  • 一套 MyBatis 管理库(保存配置、会话、知识、语义模型等)
  • 一套可插拔的向量存储(默认内存 SimpleVectorStore,可切 Elasticsearch 向量库)
  • 一套可切换的 LLM/Embedding 模型注册中心(以“模型配置表”为驱动热切换)

运行形态与依赖

技术栈
  • Java 版本:Java 17
  • 框架:Spring Boot 3.4.x
  • AI:Spring AI 1.1.x(含 MCP Server、Tika Reader、Vector Store 等)
  • 持久化:MyBatis + JDBC(Druid 连接池),多数据库驱动(MySQL/PostgreSQL/SQLServer/H2/达梦)
  • 通信:Spring MVC +(同时引入)WebFlux(用于 SSE/Flux 与客户端能力)
  • 文件/集成:Aliyun OSS、Docker Java Client(Python 执行用)
运行配置
  • application.yml:默认以 MySQL 作为“管理库”(存储 agent/datasource/knowledge/model-config/chat 等)
    • 默认 spring.sql.init.mode: never(生产风格,不自动建表)
  • application-h2.yml:H2 内存库(开发/演示)
    • spring.sql.init.mode: always + spring.

Read more

基于腾讯云HAI + DeepSeek快速设计自己的个人网页

基于腾讯云HAI + DeepSeek快速设计自己的个人网页

前言:通过结合腾讯云HAI 强大的云端运算能力与DeepSeek先进的 AI技术,本文介绍高效、便捷且低成本的设计一个自己的个人网页。你将了解到如何轻松绕过常见的技术阻碍,在腾讯云HAI平台上快速部署DeepSeek模型,仅需简单几步,就能获取一个包含个人简介、技能特长、项目经历及联系方式等核心板块的响应式网页。 目录 一、DeepSeek模型部署在腾讯云HAI 二、设计个人网页 一、DeepSeek模型部署在腾讯云HAI 把 DeepSeek 模型部署于腾讯云 HAI,用户便能避开官网访问限制,直接依托腾讯云 HAI 的超强算力运行 DeepSeek-R1 等模型。这一举措不仅降低了技术门槛,还缩短了部署时间,削减了成本。尤为关键的是,凭借 HAI 平台灵活且可扩展的特性,用户能够依据自身特定需求定制专属解决方案,进而更出色地适配特定业务场景,满足各类技术要求 。 点击访问腾讯云HAI控制台地址: 算力管理 - 高性能应用服务 - 控制台 腾讯云高性能应用服务HAI已支持DeepSeek-R1模型预装环境和CPU算力,只需简单的几步就能调用DeepSeek - R1

By Ne0inhk
AI革命先锋:DeepSeek与蓝耘通义万相2.1的无缝融合引领行业智能化变革

AI革命先锋:DeepSeek与蓝耘通义万相2.1的无缝融合引领行业智能化变革

云边有个稻草人-ZEEKLOG博客 目录 引言 一、什么是DeepSeek? 1.1 DeepSeek平台概述 1.2 DeepSeek的核心功能与技术 二、蓝耘通义万相2.1概述 2.1 蓝耘科技简介 2.2 蓝耘通义万相2.1的功能与优势 1. 全链条智能化解决方案 2. 强大的数据处理能力 3. 高效的模型训练与优化 4. 自动化推理与部署 5. 行业专用解决方案 三、蓝耘通义万相2.1与DeepSeek的对比分析 3.1 核心区别 3.2 结合使用的优势 四、蓝耘注册流程 五、DeepSeek与蓝耘通义万相2.1的集成应用 5.1 集成应用场景 1. 智能医疗诊断

By Ne0inhk
如何通过 3 个简单步骤在 Windows 上本地运行 DeepSeek

如何通过 3 个简单步骤在 Windows 上本地运行 DeepSeek

它是免费的——社区驱动的人工智能💪。         当 OpenAI 第一次推出定制 GPT 时,我就明白会有越来越多的人为人工智能做出贡献,并且迟早它会完全由社区驱动。         但从来没有想过它会如此接近😂让我们看看如何在 Windows 机器上完全免费使用第一个开源推理模型!  步骤 0:安装 Docker 桌面         我确信很多人已经安装了它,所以可以跳过,但如果没有 — — 这很简单,只需访问Docker 的官方网站,下载并运行安装 👍         如果您需要一些特定的设置,例如使用 WSL,那么有很多指导视频,请查看!我将继续下一步。 步骤 1:安装 CUDA 以获得 GPU 支持         如果您想使用 Nvidia 显卡运行 LLM,则必须安装 CUDA 驱动程序。(嗯……是的,它们需要大量的计算能力)         打开CUDA 下载页面,

By Ne0inhk
在 VSCode 中本地运行 DeepSeek,打造强大的私人 AI

在 VSCode 中本地运行 DeepSeek,打造强大的私人 AI

本文将分步向您展示如何在本地安装和运行 DeepSeek、使用 CodeGPT 对其进行配置以及开始利用 AI 来增强您的软件开发工作流程,所有这些都无需依赖基于云的服务。  步骤 1:在 VSCode 中安装 Ollama 和 CodeGPT         要在本地运行 DeepSeek,我们首先需要安装Ollama,它允许我们在我们的机器上运行 LLM,以及CodeGPT,它是集成这些模型以提供编码辅助的 VSCode 扩展。 安装 Ollama Ollama 是一个轻量级平台,可以轻松运行本地 LLM。 下载Ollama 访问官方网站:https://ollama.com * 下载适合您的操作系统(Windows、macOS 或 Linux)的安装程序。 * 验证安装 安装后,打开终端并运行: ollama --version  如果 Ollama 安装正确,

By Ne0inhk