Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能 | 极客日志

JavaAIjava算法

Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能

综述由AI生成基于 Spring Boot 项目示例，详解如何使用 Spring AI Alibaba 框架集成 Redis 向量数据库。内容涵盖环境配置、Redis 记忆存储、多模型（DeepSeek/Qwen）配置、文档加载与向量化、RESTful API 实现等核心模块。通过检索增强生成（RAG）和对话记忆管理，构建具备知识库检索和上下文记忆的 AI 应用。提供了完整的 Maven 依赖、配置文件及代码示例，支持流式响应和多会话隔离，适用于智能客服、知识问答等场景。

GopherDev发布于 2026/3/21更新于 2026/5/2225 浏览

Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能

概述

本文基于一个完整的 Spring Boot 项目示例，详细讲解如何使用 Spring AI Alibaba 框架集成 Redis 向量数据库，实现检索增强生成（RAG）和对话记忆功能。项目包含向量存储、文档加载、多模型配置、记忆管理等核心模块，适用于构建具备知识库检索和上下文记忆的 AI 应用。

项目架构概览

整个项目采用分层架构设计，主要包含以下核心组件：

配置层：Redis 连接配置、AI 模型配置、向量存储配置
数据层：文档加载器、向量存储实现
业务层：RAG 检索、对话记忆管理
控制层：RESTful API 接口

一、环境准备与依赖配置

1.1 Maven 依赖配置

在 pom.xml 中配置 Spring AI Alibaba 相关依赖：

<properties>
    <spring-ai.version>1.0.0</spring-ai.version>
    <spring-ai-alibaba.version>1.0.0.2</spring-ai-alibaba.version>
    <spring-boot.version>3.4.5</spring-boot.version>
    <java.version>17</java.version>
</properties>
<dependencies>
    <!-- Spring AI Alibaba BOM -->
    <dependency>
        <groupId>com.alibaba.cloud.ai</groupId>
        <artifactId>spring-ai-alibaba-bom</artifactId>
        <version>${spring-ai-alibaba.version}</>
        pom
        import
    
    
    
        com.alibaba.cloud.ai
        spring-ai-alibaba-starter-dashscope
        ${spring-ai-alibaba.version}
    
    
    
        com.alibaba.cloud.ai
        spring-ai-alibaba-starter-memory-redis
        ${spring-ai-alibaba.version}
    
    
    
        org.springframework.ai
        spring-ai-vector-store
        ${spring-ai.version}
    
    
    
        redis.clients
        jedis
    
    
    
        org.springframework.boot
        spring-boot-starter-web
    
    
        org.projectlombok
        lombok
        true

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online

spring:
  data:
    redis:
      host: localhost
      port: 6379
      password: 123456
  lettuce:
    pool:
      max-active: 16
      max-idle: 8
      min-idle: 4
      timeout: 2000ms
  servlet:
    multipart:
      max-file-size: 100MB
      max-request-size: 100MB
application:
  name: Roadnetworktraffic
ai:
  vectorstore:
    redis:
      initialize-schema: true
      index-name: custom-index
      prefix: custom-prefix
  dashscope:
    embedding:
      baseUrl: https://dashscope.aliyuncs.com # 向量模型
      api-key: your-api-key-here
      options:
        model: text-embedding-v4
    api-key: your-api-key-here
    base-url: https://dashscope.aliyuncs.com/compatible-mode/v1
    chat:
      options:
        model: qwen-flash

@Configuration
public class RedisMemoryConfig {
    @Value("${spring.data.redis.host}")
    private String host;

    @Value("${spring.data.redis.port}")
    private int port;

    @Value("${spring.data.redis.password}")
    private String password;

    @Bean
    public RedisChatMemoryRepository redisChatMemoryRepository() {
        return RedisChatMemoryRepository.builder()
                .host(host)
                .password(password)
                .port(port)
                .build();
    }
}

@Configuration
public class SaaLLMConfig {
    @Value("${spring.ai.dashscope.api-key}")
    private String apiKey;

    // 模型名称常量
    private final String DEEPSEEK_MODEL = "deepseek-v3.2";
    private final String QWEN_MODEL = "qwen-flash";

    @Bean(name = "deepseek")
    public ChatClient deepSeek(RedisChatMemoryRepository redisChatMemoryRepository) {
        DashScopeChatModel dashScopeChatModel = DashScopeChatModel.builder()
                .dashScopeApi(DashScopeApi.builder().apiKey(apiKey).build())
                .defaultOptions(DashScopeChatOptions.builder().withModel(DEEPSEEK_MODEL).build())
                .build();
        return ChatClient.builder(dashScopeChatModel)
                .defaultAdvisors(MessageChatMemoryAdvisor.builder(
                        MessageWindowChatMemory.builder()
                                .chatMemoryRepository(redisChatMemoryRepository)
                                .maxMessages(10)
                                .build()).build())
                .defaultOptions(ChatOptions.builder().model(DEEPSEEK_MODEL).build())
                .build();
    }

    @Bean(name = "qwen")
    public ChatClient qwen(RedisChatMemoryRepository redisChatMemoryRepository) {
        DashScopeChatModel dashScopeChatModel = DashScopeChatModel.builder()
                .dashScopeApi(DashScopeApi.builder().apiKey(apiKey).build())
                .defaultOptions(DashScopeChatOptions.builder().withModel(QWEN_MODEL).build())
                .build();
        return ChatClient.builder(dashScopeChatModel)
                .defaultAdvisors(MessageChatMemoryAdvisor.builder(
                        MessageWindowChatMemory.builder()
                                .chatMemoryRepository(redisChatMemoryRepository)
                                .maxMessages(10)
                                .build()).build())
                .defaultOptions(ChatOptions.builder().model(QWEN_MODEL).build())
                .build();
    }
}

@Slf4j
@Component
public class AppDocumentLoader {
    @Value("classpath:/prompt/Gompt.txt")
    private Resource opsFile;

    public List<Document> loadMarkdowns() {
        TextReader textReader = new TextReader(opsFile);
        textReader.setCharset(Charset.defaultCharset());
        // 使用 TokenTextSplitter 进行文本分割
        List<Document> list = new TokenTextSplitter().transform(textReader.read());
        return list;
    }
}

@Configuration
public class VectorStoreBean {
    @Resource
    private AppDocumentLoader appDocumentLoader;

    @Resource
    private EmbeddingModel embeddingModel;

    @Bean
    public VectorStore vectorStore() {
        // 创建 SimpleVectorStore（底层使用 Redis）
        VectorStore build = SimpleVectorStore.builder(embeddingModel).build();
        // 加载文档并添加到向量库
        List<Document> documents = appDocumentLoader.loadMarkdowns();
        build.add(documents);
        return build;
    }
}

@RestController
@RequestMapping("/aichat/stream")
@Slf4j
public class AiController {
    @Qualifier("deepseek")
    @Autowired
    private ChatClient deepseekModel;

    @Qualifier("qwen")
    @Autowired
    private ChatClient qwenModel;

    @Autowired
    private VectorStore vectorStore;

    @Value("classpath:/prompt/story-prompt.txt")
    private Resource storyPrompt;

    @GetMapping(value = "/deepseek")
    public Flux<String> chatDeepseek(@RequestParam String sessionId, @RequestParam String userContent) {
        return deepseekModel.prompt()
                .system(storyPrompt) // 系统提示词
                .user(userContent) // 用户输入
                .advisors(message -> {
                    // 设置会话 ID，用于记忆隔离
                    if (message != null) {
                        message.param(CONVERSATION_ID, sessionId);
                    }
                })
                .advisors(RetrievalAugmentationAdvisor.builder()
                        .documentRetriever(VectorStoreDocumentRetriever.builder()
                                .vectorStore(vectorStore)
                                .build())
                        .build())
                .stream() // 流式输出
                .content()
                .doOnError(e -> log.error("Stream error: " + e.getMessage()));
    }

    @GetMapping("/qwen")
    public Flux<String> chatQwen(@RequestParam String sessionId, @RequestParam String userContent) {
        return qwenModel.prompt()
                .system(storyPrompt)
                .user(userContent)
                .advisors(message -> {
                    if (message != null) {
                        message.param(CONVERSATION_ID, sessionId);
                    }
                })
                .stream()
                .content()
                .doOnError(e -> log.error("Stream error: " + e.getMessage()));
    }
}

接口路径	方法	参数	功能
`/aichat/stream/deepseek`	GET	sessionId, userContent	DeepSeek 模型流式对话（带 RAG）
`/aichat/stream/qwen`	GET	sessionId, userContent	Qwen 模型流式对话

用户提问 → 向量化查询 → Redis 向量库相似度检索 → 获取 top-k 相关文档 ↓ 构建提示词（系统提示 + 检索文档 + 历史对话 + 用户问题） ↓ 调用 AI 模型生成 → 返回响应

// 记忆存储接口
public interface ChatMemory {
    void add(ChatMessage message);
    List<ChatMessage> getMessages();
    void clear();
}

// Redis 实现
public class RedisChatMemory implements ChatMemory {
    // 使用 Redis 存储，key 格式：memory:sessionId
}

public class RedisVectorStore implements VectorStore {
    // 使用 RedisSearch 模块创建向量索引
    public void createIndex(String indexName, VectorFieldSchema fieldSchema) {
        // 创建 HNSW 索引 FT.CREATE indexName ...
    }

    public void add(List<Document> documents) {
        // 调用 embeddingModel 生成向量
        List<Float> vector = embeddingModel.embed(document.getContent());
        // 存储到 Redis Hash
        redis.hset(key, "vector", vector, "content", content);
    }
}

redis-server --loadmodule /path/to/redisearch.so

docker run -p 6379:6379 redislabs/redisearch:latest

mvn clean package java -jar target/your-app.jar

# 测试 DeepSeek 模型（带 RAG）
curl "http://localhost:8080/aichat/stream/deepseek?sessionId=test123&userContent=什么是 GIS？"
# 测试 Qwen 模型（不带 RAG）
curl "http://localhost:8080/aichat/stream/qwen?sessionId=test123&userContent=你好"

# 第一次对话
curl "http://localhost:8080/aichat/stream/deepseek?sessionId=user1&userContent=我叫张三"
# 第二次对话（会记住上下文）
curl "http://localhost:8080/aichat/stream/deepseek?sessionId=user1&userContent=我的名字是什么？"

@Bean(name = "vectorStoreA")
public VectorStore vectorStoreA() {
    ...
}

@Bean(name = "vectorStoreB")
public VectorStore vectorStoreB() {
    ...
}
// 根据业务场景选择不同的向量库

Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能

Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能

概述

项目架构概览

一、环境准备与依赖配置

1.1 Maven 依赖配置

更多推荐文章

相关免费在线工具

1.2 配置文件（application.yml）

二、核心组件实现

2.1 Redis 记忆存储配置

2.2 多模型配置（DeepSeek + Qwen）

2.3 文档加载与向量存储

2.3.1 文档加载器

2.3.2 向量存储 Bean

三、RESTful API 实现

3.1 控制器层

四、RAG 与记忆功能原理解析

4.1 检索增强生成（RAG）工作流程

4.2 对话记忆实现机制

4.3 向量存储底层实现

五、部署与测试

5.1 环境要求

5.2 Redis 配置

5.3 应用启动

5.4 API 测试

六、常见问题与优化建议

6.1 性能优化

6.2 功能扩展

6.3 监控与日志

七、总结

更多推荐文章

相关免费在线工具

Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能

Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能

概述

项目架构概览

一、环境准备与依赖配置

1.1 Maven 依赖配置

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.2 配置文件（application.yml）

二、核心组件实现

2.1 Redis 记忆存储配置

2.2 多模型配置（DeepSeek + Qwen）

2.3 文档加载与向量存储

2.3.1 文档加载器

2.3.2 向量存储 Bean

三、RESTful API 实现

3.1 控制器层

四、RAG 与记忆功能原理解析

4.1 检索增强生成（RAG）工作流程

4.2 对话记忆实现机制

4.3 向量存储底层实现

五、部署与测试

5.1 环境要求

5.2 Redis 配置

5.3 应用启动

5.4 API 测试

六、常见问题与优化建议

6.1 性能优化

6.2 功能扩展

6.3 监控与日志

七、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具