SpringAI 大模型应用开发篇-SpringAI 项目的新手入门知识

优质文章学习记录

07 Apr 2026 — 7 min read

🔥博客主页：【小扳_-ZEEKLOG博客】
❤感谢大家点赞👍收藏⭐评论✍

文章目录

1.0 SpringAI 概述

1.1 大模型的使用

2.0 SpringAI 新手入门

2.1 配置 pom.xml 文件

2.2 配置 application.yaml 文件

2.3 配置 ChatClient

1.0 SpringAI 概述

目前大模型应用开发最常见的框架就是 LangChain，然而 LangChain 是基于 Python 语言，虽然有 LangChain4j，但是对于大量使用 Spring 生态的应用来说，适配性就稍微差了些。

而 Spring 公司推出的 SpringAI 框架，充分利用了 Spring 框架中 AOP、IOC 的能力，可以与现有的 Java 项目无缝融合，非常方便。

当然，SpringAI 要求的 JDK 版本至少是 JDK17，SpringBoot 也必须是 3.x 的版本才可以，所以如果想要使用 SpringAI，必须先升级 JDK 和 SpringAI 版本才行。

如果是比较老的项目，也可以使用 LangChain4j，它要求的最低 JDK 版本为 JDK8。

1.1 大模型的使用

首先要明确一点，大模型应用开发并不是在浏览器中跟 AI 聊天。而是通过访问模型对外暴露的 API 接口，实现与大模型的交互。

因此，企业首先需要有一个可访问的大模型，通常有三种选择：

1）使用开放的大模型 API；

本次演示的都是使用开放的大模型 API，只需要选择自己合适的大模型，创建出自己的 API Key 就能免费使用很长时间了：

2）在云平台部署稀有大模型；

3）在本地服务器部署稀有大模型；

2.0 SpringAI 新手入门

2.1 配置 pom.xml 文件

首先，在 SpringBoot 项目中引入 SpringAI 起步依赖：

接着，在项目 pom.xml 中添加 SpringAI 的版本信息：

然后，添加 SpringAI 的依赖管理项：

最终，完整 pom.xml 依赖如下：

除了以上 SpringAI 的依赖之外，我还额外引入了在之后的项目开发中所用到的依赖。

2.2 配置 application.yaml 文件

我们现在使用的是开放大模型的 API，需要添加以下内容：

2.3 配置 ChatClient

代码解读：
ChatClient.builder：会得到一个 ChatClient.Builder 工厂对象，利用它可以自由选择模型、添加各种自定义配置。

2.4 同步调用

接下来，我们定义一个 Controller，在其中接收用户发送的提示词，然后把提示词发送给大模型，交给大模型处理，拿到结果后返回。

注意，基于 call() 方法的调用属于同步调用，需要所有响应结果全部返回后才能返回给前端。

启动项目，在浏览器中访问：http://localhost:8080/ai/chat?prompt=你好

2.5 流式调用

同步调用需要等待很长时间页面才能看到结果，用户体验不好。为了解决这个问题，我们可以改进调用方式为流式调用。

在 SpringAI 中使用了 WebFlux 技术实现流式调用。

重启测试，再次访问：

2.6 System 设定

可以发现，当我们询问 AI 你是谁的时候，它回答自己是 DeepSeek-R1，这是大模型底层的设定。如果我们希望 AI 按照新的设定工作，就需要给它设置 System 背景信息。

在 SpringAI 中，设置 System 信息非常方便，不需要在每次发送时封装到 Message，而是创建 ChatClient 时指定即可：

2.7 日志功能

默认情况下，应用于 AI 的交互时不记录日志的，我们无法得知 SpringAI 组织的提示词到底长什么样，有没有问题。这样不方便我们调试。

SpringAI 基于 AOP 机制实现与大模型对话过程的增强、拦截、修改等功能。所有的增强通知都需要实现 Advisor 接口。

Spring 提供了一些 Advisor 的默认实现，来实现一些基本的增强功能：

1）SimpleLoggerAdvisor：日志记录的 Advisor。
2）MessageChatMemoryAdvisor：会话记忆的 Advisor。
3）QuestionAnswerAdvisor：实现 RAG 的 Advisor。

只需要在配置 ChatClient 添加日志记录 Advisor：

接下来，修改日志级别：

重启项目，再次和 AI 聊天就可以在控制台上看到 AI 的日志输出了。

2.8 会话记忆功能

现在，我们的 AI 聊天机器人是没有记忆功能的，上一次聊天的内容，下一次就忘掉了。我们之前说过，让 AI 有会话记忆的方式就是把每一次历史对话内容拼接到 Prompt 中，一起发送过去。是不是还挺麻烦的。别担心，好消息是，我们并不需要自己来拼接，SpringAI 自带了会话记忆功能，可以帮我们把历史会话保存下来，下一次请求 AI 时会自动拼接，非常方便。

2.8.1 ChatMemory

会话记忆功能同样是基于 AOP 实现，Spring 提供了一个 MessageChatMemoryAdvisor 的通知，我们可以像之前添加日志通知一样添加到 ChatClient 即可。

不过，要注意的是，MessageChatMemoryAdvisor 需要指定一个 ChatMemory 实例，也就是会话历史保存的方式。

ChatMemory 接口声明如下：

可以看到，所有的会话记忆都是与 conversationid 有关联的，也就是会话 Id，将来不同会话 id 的记忆自然是分开管理的。

目前，在 SpringAI 中有两个 ChatMemory 的实现：
1）InMemoryChatMemory：会话历史保存在内存中
2）CassandraChatMemory：会话保存在 Cassandra 数据库中（需要引入额外依赖，并且绑定了向量数据库，不够灵活）

2.8.2 添加会话记忆功能

首先注册 chatMemory 对象：

然后添加到 ChatClient 中：

最后在和 AI 聊天的时候，为了区分每一个用户对应着不同的会话记录，因此需要传入用户 ID 进行区分：

睿抗机器人大赛魔力元宝

1、搭建基础环境 1、以Ros-noetic为例创建工作区间： # 1. 创建工作空间目录 mkdir -p ~/catkin_ws/src cd ~/robot_ws/src # 2. 这里的关键步骤：请将你上传的源码包中的以下 4 个文件夹复制到 ~/robot_ws/src 下： # - ar_pose # - oryxbot_description # - relative_move # - pid_lib 这里以moliyuanbao/relative_move/src at main · Xk-fly/moliyuanbao我所上传的源码为例 # 注意：不要直接把整个 xk-fly 文件夹放进去，要剥离出这 5

Jetson Orin NX + Fast-LIO2自主无人机完整部署方案

Jetson Orin NX + Fast-LIO2自主无人机完整部署方案 🚀 本文完整介绍如何在Jetson Orin NX上构建一套完整的自主飞行四旋翼无人机系统，包括实时SLAM定位、自主路径规划和动态避障。预计阅读时间: 15分钟 📑 文章目录 * 一、系统概述 * 二、硬件配置 * 三、软件架构 * 四、环境配置 * 五、关键模块部署 * 六、系统集成 * 七、常见问题 * 八、参考资源一、系统概述 1.1 项目背景在自主无人机领域，实现高精度定位和自主飞行一直是重要研究课题。本项目结合最新的SLAM算法（Fast-LIO2）、高效的路径规划和实时避障，在Jetson Orin NX这个边缘计算平台上实现了完整的自主飞行系统。 1.2 核心特性 ✨ 实时SLAM定位 - Fast-LIO2算法，100Hz频率，<2%

【数学建模】用代码搞定无人机烟幕：怎么挡导弹最久？

前言：欢迎各位光临本博客，这里小编带你直接手撕**，文章并不复杂，愿诸君耐其心性，忘却杂尘，道有所长！！！！ **🔥个人主页：IF’Maxue-ZEEKLOG博客 🎬作者简介：C++研发方向学习者 📖**个人专栏：《C语言》《C++深度学习》《Linux》《数据结构》《数学建模》** ⭐️人生格言：生活是默默的坚持，毅力是永久的享受。不破不立，远方请直行！文章目录 * 一、先搞懂：我们要解决啥问题？ * 二、核心计算：代码怎么判断“烟幕有没有用”？ * 1. 先算单个烟幕的“有效时间段” * 2. 合并重叠的时间段（避免重复计算） * 3. 只算“导弹到达前”的有效时间 * 三、代码优化：加了2个实用功能，结果直接看 * 1. 跑完直接显示“最优遮蔽时长”

论文笔记DiT：Scalable Diffusion Models with Transformers（含transformer的可扩展扩散模型）

Abstract：论文的核心思想非常直接：用一个标准的 Transformer 架构替换掉扩散模型中常用的 U-Net 主干网络，并证明这种新架构（称为 DiT, Diffusion Transformer）具有出色的可扩展性（Scalability）。 Background & Motivation：在论文发表前，Transformer 已经在自然语言处理（BERT, GPT）和计算机视觉（ViT）等领域取得了巨大成功，成为了一种“统一”的架构。然而，在图像生成领域，特别是扩散模型中，大家仍然普遍使用 U-Net。U-Net 因其多尺度特征融合和卷积的局部归纳偏置而被广泛采用。在深度学习中，一个好的架构应该具备良好的“可扩展性”——即投入更多的计算资源（更大的模型、更多的数据），性能应该会持续稳定地提升。ViT 已经证明了 Transformer 在视觉识别任务上具有这种特性。作者们希望验证 DiT 是否也具备这种优良特性，为未来的生成模型发展指明一条清晰的路径。