Spring AI 集成 PGvector：向量存储与相似性搜索实战 | 极客日志

JavaAIjava算法

Spring AI 集成 PGvector：向量存储与相似性搜索实战

PGvector 作为 PostgreSQL 的向量扩展，结合 Spring AI 框架，为 RAG 应用提供了高效的向量存储与检索方案。文章涵盖了从环境搭建、依赖配置到实际代码实现的完整流程，重点演示了文档存储、相似度搜索及元数据过滤等核心操作。通过对比 HNSW 与 IVFFlat 索引特性，并给出性能优化与安全实践建议，帮助开发者快速构建基于向量数据库的智能应用系统。

雾岛听风发布于 2026/3/15更新于 2026/6/1720 浏览

Spring AI 集成 PGvector：向量存储与相似性搜索实战

一、PGvector 概述与核心价值

1.1 什么是 PGvector

PGvector 是 PostgreSQL 的开源扩展，专为向量相似性搜索设计。它允许开发者直接在 PostgreSQL 中存储和搜索机器学习生成的嵌入（embeddings），支持精确和近似最近邻搜索。

选择 PGvector 的理由很直接：

无缝集成：作为原生扩展，与现有 Postgres 生态协作无感。
ACID 合规：保持数据库的事务完整性，数据一致性有保障。
功能丰富：支持多种距离度量和索引类型，适应不同场景。
高性能：针对大规模向量搜索进行了专门优化。
易用性：提供标准 SQL 接口，无需学习新的查询语言。

1.2 关键特性一览

特性	描述	优势
向量存储	支持 `vector`, `halfvec`, `bit`, `sparsevec` 等类型	适应不同精度和内存需求
距离度量	L2、内积、余弦距离、L1、汉明距离等	适用于不同场景的相似性度量
索引类型	HNSW、IVFFlat	平衡查询速度和召回率
元数据过滤	基于 JSON 的元数据过滤	精确控制检索结果
混合搜索	结合向量搜索和文本搜索	提高检索相关性

1.3 与 Spring AI 的集成

Spring AI 通过 spring-ai-starter-vector-store-pgvector 提供了开箱即用的支持，让开发者能轻松将向量数据库集成到 RAG（检索增强生成）应用中。

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-starter-vector-store-pgvector</artifactId>
</dependency>

二、环境准备与配置

2.1 前提条件

在使用 PGvector 之前，需要确保 PostgreSQL 实例已启用必要的扩展。执行以下 SQL 命令初始化环境：

 EXTENSION IF   vector;
 EXTENSION IF   hstore;
 EXTENSION IF   "uuid-ossp";

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online

CREATE TABLE IF NOT EXISTS vector_store (
    id uuid DEFAULT uuid_generate_v4() PRIMARY KEY,
    content text,
    metadata json,
    embedding vector(1536) -- 1536 是默认的嵌入维度
);

CREATE INDEX IF NOT EXISTS vector_index 
ON vector_store USING hnsw (embedding vector_cosine_ops);

<!-- Spring Boot JDBC 支持 -->
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-jdbc</artifactId>
</dependency>
<!-- PostgreSQL JDBC 驱动 -->
<dependency>
    <groupId>org.postgresql</groupId>
    <artifactId>postgresql</artifactId>
    <scope>runtime</scope>
</dependency>
<!-- Spring AI PGvector Store -->
<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-pgvector-store</artifactId>
</dependency>

spring:
  datasource:
    url: jdbc:postgresql://localhost:5432/postgres
    username: postgres
    password: postgres
  ai:
    vectorstore:
      pgvector:
        index-type: HNSW
        distance-type: COSINE_DISTANCE
        dimensions: 1536
        max-document-batch-size: 10000
        initialize-schema: true

@Configuration
public class PgVectorConfig {
    @Bean
    public VectorStore vectorStore(JdbcTemplate jdbcTemplate, EmbeddingModel embeddingModel) {
        return PgVectorStore.builder(jdbcTemplate, embeddingModel)
                .dimensions(1536) // 默认为模型维度
                .distanceType(COSINE_DISTANCE)
                .indexType(HNSW)
                .initializeSchema(true) // 启用自动表创建
                .schemaName("public")
                .vectorTableName("vector_store")
                .maxDocumentBatchSize(10000)
                .build();
    }
}

@Resource
@Qualifier("pgVectorStore")
private VectorStore vectorStore;

public void storeDocuments() {
    List<Document> documents = List.of(
        new Document("Spring AI rocks!!", Map.of("author", "john", "article_type", "blog")),
        new Document("The World is Big and Salvation Lurks Around the Corner", Map.of("author", "jill", "category", "philosophy")),
        new Document("Artificial Intelligence is transforming the tech industry.", Map.of("author", "bob", "category", "ai"))
    );

    System.out.println("开始存储文档...");
    vectorStore.add(documents);
    System.out.println("文档存储完成！");

    // 验证存储
    List<Document> results = vectorStore.similaritySearch(
        SearchRequest.builder().query("Spring").topK(5).build()
    );
    results.forEach(doc -> {
        System.out.println("内容：" + doc.getText());
        System.out.println("元数据：" + doc.getMetadata());
    });
}

public List<Document> basicSimilaritySearch() {
    SearchRequest searchRequest = SearchRequest.builder()
            .query("Spring")
            .topK(3)
            .similarityThreshold(0.5) // 相似度阈值（0-1 之间）
            .build();
    
    List<Document> results = vectorStore.similaritySearch(searchRequest);
    results.forEach(doc -> {
        System.out.println("内容：" + doc.getText());
        System.out.println("相似度：" + doc.getMetadata().get("distance"));
    });
    return results;
}

public List<Document> searchWithTextFilter() {
    SearchRequest searchRequest = SearchRequest.builder()
            .query("technology")
            .topK(5)
            .filterExpression("author in ['john', 'jill'] && article_type == 'blog'")
            .build();
    return vectorStore.similaritySearch(searchRequest);
}

public List<Document> searchWithProgrammaticFilter() {
    FilterExpressionBuilder b = new FilterExpressionBuilder();
    List<Document> results = vectorStore.similaritySearch(
        SearchRequest.builder()
            .query("technology")
            .topK(5)
            .filterExpression(b.and(
                b.in("author", "john", "jill"),
                b.eq("article_type", "blog")
            ).build())
            .build()
    );
    return results;
}

public void deleteDocumentsByMetadata() {
    FilterExpressionBuilder builder = new FilterExpressionBuilder();
    Filter.Expression filter = builder.eq("author", "john").build();
    
    List<Document> docsToDelete = vectorStore.similaritySearch(
        SearchRequest.builder().query("").topK(100).filterExpression(filter).build()
    );
    
    if (!docsToDelete.isEmpty()) {
        List<String> ids = docsToDelete.stream()
            .map(Document::getId)
            .filter(Objects::nonNull)
            .toList();
        System.out.println("找到 " + ids.size() + " 个要删除的文档");
        vectorStore.delete(ids);
    }
}

索引类型	构建时间	查询性能	内存使用	适用场景
HNSW	较慢	优秀	较高	高性能要求，数据量大
IVFFlat	快	一般	较低	数据量小，内存有限
NONE	无	一般	低	测试环境，小数据量

-- 调整构建参数
CREATE INDEX ON vector_store USING hnsw (embedding vector_cosine_ops) 
WITH (m = 16, ef_construction = 64);

-- 设置查询时的动态候选列表大小
SET hnsw.ef_search = 100;

CREATE ROLE app_user;
GRANT CONNECT ON DATABASE postgres TO app_user;
GRANT USAGE ON SCHEMA public TO app_user;
GRANT SELECT, INSERT, UPDATE, DELETE ON TABLE vector_store TO app_user;

@Bean
public Advisor questionAnswerAdvisor(VectorStore vectorStore) {
    return QuestionAnswerAdvisor.builder(vectorStore)
            .searchRequest(SearchRequest.builder()
                    .similarityThreshold(0.7)
                    .topK(5)
                    .build())
            .build();
}

Spring AI 集成 PGvector：向量存储与相似性搜索实战

Spring AI 集成 PGvector：向量存储与相似性搜索实战

一、PGvector 概述与核心价值

1.1 什么是 PGvector

1.2 关键特性一览

1.3 与 Spring AI 的集成

二、环境准备与配置

2.1 前提条件

更多推荐文章

相关免费在线工具

2.2 创建向量存储表

三、Spring AI 集成实践

3.1 依赖配置

3.2 自动配置

3.3 手动配置（高级用法）

四、核心操作实战

4.1 存储文档

4.2 基本相似性搜索

4.3 元数据过滤

4.4 删除文档

五、性能优化与最佳实践

5.1 索引类型对比

5.2 参数调优

5.3 安全与 RAG 集成

六、常见问题排查

6.1 查询性能差

6.2 向量维度不匹配

6.3 元数据过滤无效

七、总结

更多推荐文章

相关免费在线工具

Spring AI 集成 PGvector：向量存储与相似性搜索实战

Spring AI 集成 PGvector：向量存储与相似性搜索实战

一、PGvector 概述与核心价值

1.1 什么是 PGvector

1.2 关键特性一览

1.3 与 Spring AI 的集成

二、环境准备与配置

2.1 前提条件

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 创建向量存储表

三、Spring AI 集成实践

3.1 依赖配置

3.2 自动配置

3.3 手动配置（高级用法）

四、核心操作实战

4.1 存储文档

4.2 基本相似性搜索

4.3 元数据过滤

4.4 删除文档

五、性能优化与最佳实践

5.1 索引类型对比

5.2 参数调优

5.3 安全与 RAG 集成

六、常见问题排查

6.1 查询性能差

6.2 向量维度不匹配

6.3 元数据过滤无效

七、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具