Spring AI 多轮对话记忆机制实战指南 | 极客日志

JavaAIjava

Spring AI 多轮对话记忆机制实战指南

综述由AI生成介绍 Spring AI 中 ChatMemory 机制的实现方案，涵盖短期、长期及摘要三种记忆类型的设计逻辑。对比了 Redis 缓存与数据库持久化的选型策略，并提供了过期配置示例。针对 Token 限制问题，阐述了基于语义相似度的关键信息提取和基于大模型的对话摘要生成两种压缩技巧。最后通过混合压缩策略与双存储架构，展示了支持 100 轮超长对话的智能客服系统实战案例，确保高并发下的上下文连贯性与数据一致性。

灰度发布发布于 2026/4/6更新于 2026/5/2125 浏览

Spring AI 多轮对话记忆机制实战指南

摘要

在大模型应用开发中，上下文丢失是多轮对话场景的核心痛点，直接导致 AI 回复割裂、用户体验下降。本文基于 Spring AI 生态，从对话记忆的本质出发，深度拆解短期、长期、摘要三类记忆的设计逻辑，对比 Redis 缓存与数据库持久化的技术选型方案，详解上下文压缩的关键技巧，并通过完整实战案例，演示构建支持 100 轮对话的高可用智能客服。全程贯穿从内存存储到分布式记忆的进阶思路，既有底层原理剖析，又有可直接落地的代码实现。

引言

用过 Spring AI 开发对话应用的同学都懂：默认情况下 LLM 是无状态的，每次请求都是独立会话，无法记住上一轮的对话内容。比如智能客服场景中，用户先说明我要查询订单物流，再提供订单号 12345，AI 却无法关联两者，还得让用户重复信息。

这背后的核心问题是 LLM 的无状态特性，而 Spring AI 提供的 ChatMemory 体系正是解决该问题的关键。但实际开发中，你可能会遇到：

短期对话没问题，长期多轮后内存暴涨、响应变慢；单机内存存储重启就丢数据，分布式部署下会话同步困难；对话历史过长导致 Token 超限，模型调用失败。

本文将从记忆类型选型、存储方案落地、上下文压缩优化、实战落地四个维度，提供一套完整的解决方案，让你轻松打造具备长期记忆且高性能的多轮对话应用。

一、对话记忆的三大类型：短期、长期、摘要记忆深度解析

Spring AI 的记忆机制核心是 ChatMemory 接口，其底层通过记忆类型 + 存储介质的组合模式，适配不同业务场景。我们先搞懂三类核心记忆类型的设计逻辑与适用场景。

1.1 三类记忆的核心定义与实现

短期记忆：存储最近 N 轮对话，基于滑动窗口机制自动淘汰旧消息，默认实现为 MessageWindowChatMemory。核心特点是轻量、高性能，适合实时性要求高的短对话场景（如 10 轮内的咨询）。存储介质通常为内存或 Redis，默认保留最近 20 条消息（可通过 maxMessages 配置）。 长期记忆：持久化存储完整对话历史，支持跨会话、跨服务节点共享，适用于需要追溯完整对话轨迹的场景（如客服工单、合规审计）。存储介质多为数据库（MySQL/PostgreSQL）或 Redis 集群，需配合 TTL 策略避免数据膨胀。 摘要记忆：对长对话历史进行语义压缩，提取核心信息（如用户意图、关键参数）存储，而非保留原始消息。适合超长时间对话（如 100 轮+），解决 Token 超限问题，存储介质可灵活选择 Redis 或数据库。

1.2 三类记忆的关键对比

记忆类型	存储内容	存储介质	适用场景	核心优势	局限性
短期记忆	最近 N 轮原始消息	内存 / Redis	短对话、实时交互	读写速度快、配置简单	数据易失、不支持超长对话
长期记忆	完整原始对话历史	数据库 / Redis 集群	工单追溯、合规审计	数据持久化、跨节点共享	存储成本高、查询效率随数据量下降
摘要记忆	对话核心信息摘要	任意存储介质	超长对话、Token 敏感场景	节省存储和 Token 成本	存在少量信息损耗

三类记忆的业务流转示意图

文章配图

1.3 选型建议

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online

<!-- Spring AI Core -->
<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-core</artifactId>
    <version>1.0.0</version>
</dependency>
<!-- Redis 依赖 -->
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>

spring:
  redis:
    host: localhost
    port: 6379
    password: 123456
    lettuce:
      pool:
        max-active: 16 # 连接池最大活跃数
        max-wait: 2000ms # 最大等待时间
  timeout: 5000ms
  ai:
    chat:
      memory:
        redis:
          key-prefix: "spring-ai:chat:memory:" # 键前缀
          ttl: 86400 # 会话过期时间（秒），默认 24 小时

@Configuration
public class RedisChatMemoryConfig {
    @Bean
    public ChatMemory redisChatMemory(RedisTemplate<String, Object> redisTemplate,
                                      @Value("${spring.ai.chat.memory.redis.key-prefix}") String keyPrefix,
                                      @Value("${spring.ai.chat.memory.redis.ttl}") long ttl) {
        // 配置序列化方式（避免默认 JDK 序列化导致的兼容性问题）
        redisTemplate.setKeySerializer(new StringRedisSerializer());
        redisTemplate.setValueSerializer(new GenericJackson2JsonRedisSerializer());
        return new RedisChatMemory(redisTemplate, keyPrefix, ttl);
    }

    // 自定义 RedisChatMemory 实现 ChatMemory 接口
    public static class RedisChatMemory implements ChatMemory {
        private final RedisTemplate<String, Object> redisTemplate;
        private final String keyPrefix;
        private final long ttl;

        public RedisChatMemory(RedisTemplate<String, Object> redisTemplate, String keyPrefix, long ttl) {
            this.redisTemplate = redisTemplate;
            this.keyPrefix = keyPrefix;
            this.ttl = ttl;
        }

        @Override
        public void add(String conversationId, Message message) {
            String key = keyPrefix + conversationId;
            // 从 Redis 获取会话，不存在则创建新会话
            Conversation conversation = (Conversation) redisTemplate.opsForValue().get(key);
            if (conversation == null) {
                conversation = new Conversation();
                conversation.setConversationId(conversationId);
                conversation.setMessages(new ArrayList<>());
                conversation.setCreateTime(LocalDateTime.now());
            }
            // 添加新消息并更新时间
            conversation.getMessages().add(message);
            conversation.setUpdateTime(LocalDateTime.now());
            // 存入 Redis 并设置 TTL
            redisTemplate.opsForValue().set(key, conversation, ttl, TimeUnit.SECONDS);
        }

        @Override
        public List<Message> getMessages(String conversationId) {
            String key = keyPrefix + conversationId;
            Conversation conversation = (Conversation) redisTemplate.opsForValue().get(key);
            return conversation != null ? conversation.getMessages() : Collections.emptyList();
        }

        // 实现 clear、delete 等其他接口方法...
    }

    // 会话实体类
    @Data
    public static class Conversation implements Serializable {
        private String conversationId;
        private List<Message> messages;
        private LocalDateTime createTime;
        private LocalDateTime updateTime;
    }
}

// 对话实体类
@Entity
@Table(name = "chat_conversation")
@Data
public class ConversationEntity {
    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    private Long id;
    private String conversationId; // 会话 ID（与用户 ID 绑定）
    private String userId; // 用户 ID
    private LocalDateTime createTime;
    private LocalDateTime updateTime;
    private boolean isExpired; // 是否过期
}

// 消息实体类
@Entity
@Table(name = "chat_message")
@Data
public class MessageEntity {
    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    private Long id;
    private Long conversationId; // 关联对话 ID
    private String role; // 角色：user/assistant/system
    private String content; // 消息内容
    private LocalDateTime sendTime;
}

// Spring Data JPA Repository
public interface ConversationRepository extends JpaRepository<ConversationEntity, Long> {
    Optional<ConversationEntity> findByConversationIdAndIsExpiredFalse(String conversationId);
}

public interface MessageRepository extends JpaRepository<MessageEntity, Long> {
    List<MessageEntity> findByConversationIdOrderBySendTimeAsc(Long conversationId);
}

@Service
public class JdbcChatMemory implements ChatMemory {
    @Autowired
    private ConversationRepository conversationRepository;
    @Autowired
    private MessageRepository messageRepository;

    @Override
    @Transactional
    public void add(String conversationId, Message message) {
        // 1. 查找或创建对话
        ConversationEntity conversation = conversationRepository
                .findByConversationIdAndIsExpiredFalse(conversationId)
                .orElseGet(() -> {
                    ConversationEntity newConv = new ConversationEntity();
                    newConv.setConversationId(conversationId);
                    newConv.setUserId(extractUserId(conversationId)); // 从会话 ID 中提取用户 ID
                    newConv.setCreateTime(LocalDateTime.now());
                    newConv.setUpdateTime(LocalDateTime.now());
                    newConv.setExpired(false);
                    return conversationRepository.save(newConv);
                });
        // 2. 保存消息
        MessageEntity messageEntity = new MessageEntity();
        messageEntity.setConversationId(conversation.getId());
        messageEntity.setRole(getRoleName(message)); // 转换为数据库存储的角色名称
        messageEntity.setContent(message.getContent());
        messageEntity.setSendTime(LocalDateTime.now());
        messageRepository.save(messageEntity);
        // 3. 更新对话更新时间
        conversation.setUpdateTime(LocalDateTime.now());
        conversationRepository.save(conversation);
    }

    // 其他方法实现...

    // 辅助方法：提取用户 ID（假设 conversationId 格式为 user-xxx-xxx）
    private String extractUserId(String conversationId) {
        return conversationId.split("-")[1];
    }

    // 辅助方法：转换 Message 角色为字符串
    private String getRoleName(Message message) {
        if (message instanceof UserMessage) return "user";
        if (message instanceof AssistantMessage) return "assistant";
        if (message instanceof SystemMessage) return "system";
        return "unknown";
    }
}

import org.springframework.ai.embedding.EmbeddingClient;
import org.springframework.ai.openai.OpenAiEmbeddingClient;
import org.springframework.ai.openai.OpenAiEmbeddingOptions;
import java.util.List;
import java.util.stream.Collectors;

public class SemanticFilterCompressor {
    // 嵌入模型客户端（使用 OpenAI Embedding，也可替换为本地化模型如 all-MiniLM-L6-v2）
    private final EmbeddingClient embeddingClient;
    private final double similarityThreshold; // 相似度阈值，默认 0.7

    public SemanticFilterCompressor(EmbeddingClient embeddingClient, double similarityThreshold) {
        this.embeddingClient = embeddingClient;
        this.similarityThreshold = similarityThreshold;
    }

    // 压缩对话历史：保留与当前查询高相关的消息
    public List<Message> compress(List<Message> historyMessages, String currentQuery) {
        // 计算当前查询的嵌入向量
        var queryEmbedding = embeddingClient.embed(currentQuery);
        // 过滤高相似度消息
        return historyMessages.stream()
                .filter(message -> {
                    // 计算历史消息与当前查询的相似度
                    var messageEmbedding = embeddingClient.embed(message.getContent());
                    double similarity = calculateCosineSimilarity(queryEmbedding, messageEmbedding);
                    return similarity >= similarityThreshold;
                })
                .collect(Collectors.toList());
    }

    // 计算余弦相似度
    private double calculateCosineSimilarity(List<Double> vec1, List<Double> vec2) {
        double dotProduct = 0.0;
        double norm1 = 0.0;
        double norm2 = 0.0;
        for (int i = 0; i < vec1.size() && i < vec2.size(); i++) {
            dotProduct += vec1.get(i) * vec2.get(i);
            norm1 += Math.pow(vec1.get(i), 2);
            norm2 += Math.pow(vec2.get(i), 2);
        }
        return dotProduct / (Math.sqrt(norm1) * Math.sqrt(norm2));
    }

    // 配置嵌入模型（Spring Boot 配置类）
    @Configuration
    public static class EmbeddingConfig {
        @Bean
        public EmbeddingClient embeddingClient() {
            return new OpenAiEmbeddingClient(
                    new OpenAiApi("your-api-key"),
                    OpenAiEmbeddingOptions.builder()
                            .withModel("text-embedding-3-small")
                            .withDimensions(1536)
                            .build()
            );
        }
    }
}

import org.springframework.ai.chat.ChatClient;
import org.springframework.ai.chat.ChatResponse;
import org.springframework.ai.chat.prompt.Prompt;
import org.springframework.ai.chat.prompt.PromptTemplate;

public class SummaryCompressor {
    private final ChatClient chatClient;
    private final int maxSummaryLength; // 摘要最大长度（字符数）

    public SummaryCompressor(ChatClient chatClient, int maxSummaryLength) {
        this.chatClient = chatClient;
        this.maxSummaryLength = maxSummaryLength;
    }

    // 生成对话历史摘要
    public Message generateSummary(List<Message> historyMessages) {
        // 拼接历史消息为纯文本
        String historyText = historyMessages.stream()
                .map(msg -> String.format("[%s]: %s", getRoleLabel(msg), msg.getContent()))
                .collect(Collectors.joining("\n"));
        // 构建摘要生成提示词
        String promptTemplate = "请将以下对话历史生成简洁摘要，保留核心信息（用户意图、关键参数、已达成共识），忽略无关闲聊，摘要长度不超过%d字符：对话历史：%s 摘要：";
        Prompt prompt = new PromptTemplate(promptTemplate, maxSummaryLength, historyText).create();
        // 调用大模型生成摘要
        ChatResponse response = chatClient.generate(prompt);
        String summary = response.getResult().getOutput().getContent();
        // 返回摘要消息（角色设为 system，方便模型识别）
        return new SystemMessage("对话历史摘要：" + summary);
    }

    // 辅助方法：获取消息角色标签
    private String getRoleLabel(Message message) {
        if (message instanceof UserMessage) return "用户";
        if (message instanceof AssistantMessage) return "助手";
        return "系统";
    }
}

public class HybridCompressionStrategy {
    private final int windowSize = 20; // 滑动窗口大小
    private final SemanticFilterCompressor semanticFilter;
    private final SummaryCompressor summaryCompressor;

    public HybridCompressionStrategy(SemanticFilterCompressor semanticFilter, SummaryCompressor summaryCompressor) {
        this.semanticFilter = semanticFilter;
        this.summaryCompressor = summaryCompressor;
    }

    // 混合压缩：滑动窗口 + 语义过滤 + 摘要生成
    public List<Message> compress(List<Message> historyMessages, String currentQuery) {
        if (historyMessages.size() <= windowSize) {
            // 消息数未超窗口，仅做语义过滤
            return semanticFilter.compress(historyMessages, currentQuery);
        } else {
            // 拆分消息：近期原始消息 + 早期摘要
            List<Message> recentMessages = historyMessages.subList(historyMessages.size() - windowSize, historyMessages.size());
            List<Message> earlyMessages = historyMessages.subList(0, historyMessages.size() - windowSize);
            // 对早期消息生成摘要
            Message earlySummary = summaryCompressor.generateSummary(earlyMessages);
            // 对近期消息进行语义过滤
            List<Message> filteredRecent = semanticFilter.compress(recentMessages, currentQuery);
            // 组合：摘要 + 过滤后的近期消息
            List<Message> compressed = new ArrayList<>();
            compressed.add(earlySummary);
            compressed.addAll(filteredRecent);
            return compressed;
        }
    }
}

@Service
public class ConversationManager {
    @Autowired
    private RedisChatMemory redisChatMemory;
    @Autowired
    private JdbcChatMemory jdbcChatMemory;
    @Autowired
    private RedisTemplate<String, Object> redisTemplate;

    // 会话 ID 前缀（区分不同用户类型）
    private static final String GUEST_PREFIX = "guest-";
    private static final String USER_PREFIX = "user-";
    private static final String TTL_KEY = "spring-ai:chat:ttl:";

    // 创建会话（游客用户）
    public String createGuestConversation() {
        String conversationId = GUEST_PREFIX + UUID.randomUUID();
        // 设置游客会话 TTL 为 1 小时
        redisTemplate.opsForValue().set(TTL_KEY + conversationId, "guest", 3600, TimeUnit.SECONDS);
        return conversationId;
    }

    // 创建会话（登录用户）
    public String createUserConversation(String userId) {
        String conversationId = USER_PREFIX + userId + "-" + System.currentTimeMillis();
        // 设置登录用户会话 TTL 为 7 天
        redisTemplate.opsForValue().set(TTL_KEY + conversationId, userId, 7 * 86400, TimeUnit.SECONDS);
        return conversationId;
    }

    // 保存对话消息（同时写入 Redis 和 MySQL）
    public void saveMessage(String conversationId, Message message) {
        // 写入 Redis（短期记忆）
        redisChatMemory.add(conversationId, message);
        // 写入 MySQL（长期记忆）
        jdbcChatMemory.add(conversationId, message);
    }

    // 获取压缩后的对话历史（用于 LLM 调用）
    public List<Message> getCompressedHistory(String conversationId, String currentQuery) {
        // 从 Redis 获取原始历史消息
        List<Message> history = redisChatMemory.getMessages(conversationId);
        // 初始化混合压缩策略
        SemanticFilterCompressor semanticFilter = new SemanticFilterCompressor(embeddingClient(), 0.7);
        SummaryCompressor summaryCompressor = new SummaryCompressor(chatClient(), 300);
        HybridCompressionStrategy compression = new HybridCompressionStrategy(semanticFilter, summaryCompressor);
        // 压缩历史消息
        return compression.compress(history, currentQuery);
    }

    // 会话过期清理（定时任务）
    @Scheduled(cron = "0 0 3 * * ?") // 每天凌晨 3 点执行
    public void cleanExpiredConversations() {
        // 1. 清理 Redis 中过期的会话
        Set<String> ttlKeys = redisTemplate.keys(TTL_KEY + "*");
        if (ttlKeys != null) {
            for (String key : ttlKeys) {
                String conversationId = key.replace(TTL_KEY, "");
                redisChatMemory.delete(conversationId);
                redisTemplate.delete(key);
            }
        }
        // 2. 清理 MySQL 中 30 天前的过期会话
        jdbcChatMemory.cleanExpiredConversations(LocalDate.now().minusDays(30));
    }

    // 注入必要的 Bean（实际项目中应通过配置类注入）
    @Bean
    public EmbeddingClient embeddingClient() {
        return new OpenAiEmbeddingClient(new OpenAiApi("your-api-key"), OpenAiEmbeddingOptions.builder().withModel("text-embedding-3-small").build());
    }

    @Bean
    public ChatClient chatClient() {
        return new OpenAiChatClient(new OpenAiApi("your-api-key"));
    }
}

@Service
public class ChatbotService {
    @Autowired
    private ConversationManager conversationManager;
    @Autowired
    private ChatClient chatClient;

    // 处理用户消息（核心入口）
    public String handleUserMessage(String conversationId, String userId, String content) {
        // 1. 创建用户消息对象
        UserMessage userMessage = new UserMessage(content);
        // 2. 保存用户消息到双存储
        conversationManager.saveMessage(conversationId, userMessage);
        // 3. 获取压缩后的对话历史
        List<Message> compressedHistory = conversationManager.getCompressedHistory(conversationId, content);
        // 4. 构建系统提示词（定义客服角色）
        SystemMessage systemMessage = new SystemMessage("你是一款智能客服，负责解答用户的订单查询、业务咨询、问题反馈等需求，回答要简洁明了，基于对话历史提供连贯的响应，不编造信息。");
        // 5. 组合所有消息（系统提示词 + 压缩历史 + 当前用户消息）
        List<Message> messages = new ArrayList<>();
        messages.add(systemMessage);
        messages.addAll(compressedHistory);
        messages.add(userMessage);
        // 6. 调用 LLM 生成响应
        ChatResponse response = chatClient.generate(messages);
        AssistantMessage assistantMessage = response.getResult().getOutput();
        // 7. 保存 AI 回复到双存储
        conversationManager.saveMessage(conversationId, assistantMessage);
        // 8. 返回回复内容
        return assistantMessage.getContent();
    }
}

@RestController
@RequestMapping("/api/chatbot")
public class ChatController {
    @Autowired
    private ConversationManager conversationManager;
    @Autowired
    private ChatbotService chatbotService;

    // 创建游客会话
    @PostMapping("/conversation/guest")
    public ResponseEntity<Map<String, String>> createGuestConversation() {
        String conversationId = conversationManager.createGuestConversation();
        Map<String, String> response = Map.of("conversationId", conversationId, "msg", "会话创建成功");
        return ResponseEntity.ok(response);
    }

    // 创建登录用户会话
    @PostMapping("/conversation/user")
    public ResponseEntity<Map<String, String>> createUserConversation(@RequestParam String userId) {
        String conversationId = conversationManager.createUserConversation(userId);
        Map<String, String> response = Map.of("conversationId", conversationId, "msg", "会话创建成功");
        return ResponseEntity.ok(response);
    }

    // 发送消息
    @PostMapping("/message")
    public ResponseEntity<Map<String, String>> sendMessage(
            @RequestParam String conversationId,
            @RequestParam(required = false) String userId,
            @RequestBody String content) {
        try {
            String reply = chatbotService.handleUserMessage(conversationId, userId, content);
            Map<String, String> response = Map.of("reply", reply, "conversationId", conversationId);
            return ResponseEntity.ok(response);
        } catch (Exception e) {
            return ResponseEntity.status(500).body(Map.of("msg", "处理失败：" + e.getMessage()));
        }
    }

    // 查询对话历史
    @GetMapping("/history/{conversationId}")
    public ResponseEntity<List<Message>> getConversationHistory(@PathVariable String conversationId) {
        List<Message> history = conversationManager.getCompressedHistory(conversationId, "");
        return ResponseEntity.ok(history);
    }
}

Spring AI 多轮对话记忆机制实战指南

Spring AI 多轮对话记忆机制实战指南

摘要

引言

一、对话记忆的三大类型：短期、长期、摘要记忆深度解析

1.1 三类记忆的核心定义与实现

1.2 三类记忆的关键对比

三类记忆的业务流转示意图

1.3 选型建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、记忆存储实现：Redis 缓存 vs 数据库持久化（附过期策略）

2.1 技术选型核心考量维度

2.2 Redis 缓存方案：高性能首选

核心优势

实战配置步骤

过期策略优化

2.3 数据库持久化方案：强一致性首选

核心优势

实战配置步骤

过期策略实现

2.4 两种方案对比与选型建议

三、上下文压缩技巧：突破 Token 限制，支持超长对话

3.1 压缩的核心目标

3.2 两大核心压缩策略（附代码实现）

策略一：关键信息提取（基于语义相似度）

策略二：对话摘要生成（基于大模型）

3.3 历史剪枝：滑动窗口 + 摘要协同

3.4 压缩效果验证

四、实战：构建支持 100 轮对话的智能客服（附会话管理）

4.1 系统架构设计

4.2 核心模块实现

模块一：会话管理模块（ConversationManager）

模块二：智能客服核心服务（ChatbotService）

模块三：API 接口（ChatController）

4.3 测试验证：100 轮对话稳定性测试

测试环境

测试结果

关键优化点

五、总结与展望

未来展望

参考文献

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具