Spring AI 实战指南：从概念到流式输出

Spring AI 实战指南

基本概念

什么是 AI

AI（Artificial Intelligence）即人工智能，核心是让机器模拟人类智能。我们可以这样理解差异：

普通计算机程序像自动售货机，输入特定按钮就输出特定饮料，行为完全由预设规则决定。而 AI 程序更像在学习的孩子，给它看大量猫狗图片并标注，它就能自己学会规律，识别从未见过的猫咪。

目前最主流的是生成式人工智能（AIGC），目标是利用 AI 自动生成内容，比如写文章、翻译或编程。

模型（Model）

模型是 AI 系统的核心，本质是通过算法在数据上训练后得到的数学函数。我们常说的'调用 AI'，实际上就是在使用这个模型。它可以想象成一个'虚拟大脑'，通过训练掌握技能，回答问题时运用这些知识。

大语言模型（LLM）

LLM（Large Language Model）是基于深度学习、使用海量文本训练的模型。特点是'大'，体现在训练数据量和参数数量巨大。它像一个经过超大规模训练的专家大脑，掌握了语法、事实和逻辑，能应对各种话题。

提示词（Prompt）

提示词是用户提供给 AI 的指令或上下文。提示词的质量直接决定回答质量。设计优化提示词的过程叫'提示词工程'。

简单提示词：'法国的首都是哪里？' -> '巴黎。' 复杂提示词（角色扮演）：'假设你是资深营养师，为我设计一周健康午餐食谱。' -> 模型会以营养师口吻提供详细方案。

词元（Token）

Token 是模型处理文本的基本单位，不完全等同于单词或汉字。它是计费和衡量长度的基本单位。

英文 unbelievable 可能拆分为 ["un", "believe", "able"]
中文'我喜欢编程'可能拆分为 ['我', '喜', '欢', '编程']

不同模型分词规则不同，同一个词在不同模型中拆分结果也可能不同。

Spring AI 是什么

Spring AI 是一个基于 Spring 生态的开源 AI 应用框架，旨在简化 Java 应用中集成 AI 功能的过程。它提供了开发 AI 应用的基础抽象，支持多种实现，可以通过最少代码更改切换组件。

主要特性包括：

统一的多模型支持：兼容 OpenAI、Microsoft、Amazon、Google、Anthropic 等主流提供商，云端或本地部署（如 Ollama）均可通过一致接口调用。
强大的数据集成能力：内置对向量数据库（Chroma、Pinecone、Redis 等）的支持。
与 Spring 生态无缝集成：自然协同 Spring Boot、Spring Data 等项目。
简化的开发模式：允许 AI 模型请求执行客户端定义的函数，接入实时信息或触发动作。

快速入门

环境要求

JDK 版本：JDK 17 或以上（推荐 JDK 21），Spring Boot 3.x 强制要求。
Spring Boot 版本：3.2 或以上，选择稳定的 3.x 最新版本即可。
AI 服务凭证：有效的 API Key，需来自 AI 服务提供商（如 OpenAI、DeepSeek、阿里百炼等）。

本文以 DeepSeek 为例进行演示。

申请 API Key

访问 DeepSeek 官网进入 API 开放平台，创建 API Key。注意 Key 仅在创建时可见可复制。学习使用充值少量金额即可。

项目创建

Spring AI 为 OpenAI 及兼容 API 服务设计了 spring-ai-openai-spring-boot-starter。

创建 Maven 项目并添加依赖：

<>
    org.springframework.ai
    spring-ai-openai-spring-boot-starter
    1.0.0-M6

维度	ChatModel	ChatClient
抽象层级	底层，接近原始模型	高层，面向业务
返回值	ChatResponse（含丰富元数据）	ChatResponse（纯文本）或流式响应
使用方法	手动构造 Prompt 对象	流式 builder 模式
控制粒度	精细控制	快捷简便

消息类型	对应角色	核心作用
SystemMessage	系统 / 导演	设定背景、角色、风格，定基调
UserMessage	用户 / 提问者	驱动对话前进
AssistantMessage	助理 / AI	代表 AI 回复，保障连贯性
FunctionMessage	函数 / 工具	代表函数调用结果
MediaMessage	多媒体	图像等非文本数据

Spring AI 实战指南：从概念到流式输出