LangChain 进阶：Vector Stores 向量存储详解 | 极客日志

PythonAI算法

LangChain 进阶：Vector Stores 向量存储详解

综述由AI生成LangChain 中 Vector Stores 的核心概念与使用方法。内容涵盖向量嵌入原理、相似性搜索（similarity_search）、本地保存与加载（save_local/load_local）、数据库合并（merge_from）及异步操作。详细解析了欧氏距离、余弦相似度等距离策略，并阐述了在 RAG 应用中引入向量存储以提升检索效率和 LLM 输出准确性的必要性。文章还提供了文本切分最佳实践、元数据过滤示例及主流向量库选型对比，帮助开发者构建高效的知识检索系统。

观心发布于 2025/2/6更新于 2026/6/321 浏览

LangChain 进阶：Vector Stores 向量存储详解

01 介绍

在构建基于大语言模型（LLM）的应用时，Vector Stores（向量存储）是连接语言模型与实际应用数据的关键桥梁。它为构建智能化、高效的语言处理应用提供了强大的基础设施支持，特别是在检索增强生成（RAG）架构中扮演着核心角色。

理解向量存储前需了解向量嵌入（Embeddings）。文本向量化是将非结构化的文本转换成数值向量的过程，这些向量能够在多维空间中捕捉词语或文档之间的语义相似性。常见的嵌入模型如 Word2Vec、BERT、Sentence Transformers 等，可以被用来生成这样的向量。

Vector Stores 的核心用途

高效检索：Vector Stores 主要用于存储这些嵌入向量，并支持高效的相似性搜索，使得用户能够根据输入的查询（也是一个向量）快速找到最相关的文档、段落或信息。
语义搜索：由于向量能够表达语义关系，Vector Stores 使得基于内容而非关键词的搜索成为可能，大大提高了搜索的准确性和相关性，解决了传统关键词匹配无法理解上下文的问题。

Vector Stores 实现方式

LangChain 支持多种向量存储后端，开发者可以根据项目需求选择本地部署或云服务：

FAISS：Facebook AI Similarity Search，一个高效的相似性搜索库，特别适合大规模的向量数据集，常用于本地开发测试。
Pinecone、Qdrant：云原生的向量数据库服务，提供了 API 接口，便于管理和检索向量数据，适合生产环境的高可用需求。
Weaviate：一个语义搜索引擎，支持向量搜索和知识图谱管理，具备较强的扩展性。
Chroma：一个开源的向量数据库，专为机器学习和 NLP 应用设计，轻量级且易于集成。

Vector Stores 功能特性

索引构建：可以为文档集合创建索引，这个过程涉及将文档转换为向量并存储起来，以便后续快速检索。
更新与删除：支持对向量数据的动态管理，包括源文档更新时的向量重计算以及删除不再需要的向量。
检索优化：通过近似最近邻（Approximate Nearest Neighbor, ANN）算法，在保证较高精度的同时，实现了对大规模数据集的高效检索。

Vector Stores 应用场景

问答系统：快速从大量文档中找到与问题最相关的答案，减少模型幻觉。
个性化推荐：基于用户历史行为和偏好生成的向量，来推荐相似或相关的内容。
知识图谱增强：结合向量搜索提高知识图谱节点间链接的发现和查询效率。
文档检索系统：企业内部文档、网页内容的快速语义搜索。

LangChain 提供了统一的 API 接口来与不同的 Vector Stores 交互，使得开发者无需深入了解每个后端的具体实现细节，即可轻松集成和切换向量存储解决方案，提升了开发效率和灵活性。

02 Vector Store 使用指南

LangChain 中向量数据库的使用基本遵循四个标准步骤：加载文档、切分文本、生成嵌入、构建索引。

1. 相似性搜索 (Similarity Search)

如果我们使用的 OpenAI 相关的模型，我们可以这么使用：

from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import CharacterTextSplitter
 langchain_community.embeddings  OpenAIEmbeddings
 langchain_community.vectorstores  FAISS



embeddings = OpenAIEmbeddings(openai_api_key=)


text_loader = TextLoader(, encoding=, autodetect_encoding=)
raw_documents = text_loader.load()



text_splitter = CharacterTextSplitter(chunk_size=, chunk_overlap=)
documents = text_splitter.split_documents(raw_documents)



db = FAISS.from_documents(documents=documents, embedding=embeddings)


query = 
docs = db.similarity_search(query)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from langchain_community.vectorstores.utils import DistanceStrategy
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import CharacterTextSplitter
from transformers.utils import is_torch_cuda_available, is_torch_mps_available
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS

# 词嵌入模型设备选择
EMBEDDING_DEVICE = "cuda" if is_torch_cuda_available() else "mps" if is_torch_mps_available() else "cpu"
embedding = HuggingFaceEmbeddings(
    model_name='D:\models\m3e-base', 
    model_kwargs={'device': EMBEDDING_DEVICE}
)

text_loader = TextLoader('./index.txt', encoding='utf-8', autodetect_encoding=True)
raw_documents = text_loader.load()

text_splitter = CharacterTextSplitter(chunk_size=150, chunk_overlap=80)
documents = text_splitter.split_documents(raw_documents)

# 指定距离策略为余弦相似度
db = FAISS.from_documents(
    documents=documents, 
    embedding=embedding, 
    distance_strategy=DistanceStrategy.COSINE
)

db.save_local(folder_path='./vector/FAISS.db', index_name='cpm-index')

query = '生活就像巧克力'
docs = db.similarity_search(query)

docs = db.similarity_search_with_score(query='第一行')

# 返回格式为 [(Document, score), ...]
for doc, score in docs:
    print(f"Score: {score}, Content: {doc.page_content[:50]}...")

embedding_vector = OpenAIEmbeddings().embed_query(query)
docs = db.similarity_search_by_vector(embedding_vector)

db = FAISS.from_documents(documents=documents, embedding=embedding)
db.save_local(folder_path='./vector/FAISS.db', index_name='cpm-index')

db = FAISS.load_local(
    folder_path='./vector/FAISS.db', 
    embeddings=embedding, 
    index_name='cpm-index',
    allow_dangerous_deserialization=True  # 生产环境请谨慎使用此参数
)
docs = db.similarity_search(query='狮子王', k=1)

db1 = FAISS.from_documents(documents=documents, embedding=embedding)
db2 = FAISS.from_documents(documents=documents, embedding=embedding)

# 将 db1 的数据合并到 db2 中
db2.merge_from(db1)

import asyncio

async def main():
    # 异步初始化 Qdrant
    db = await Qdrant.afrom_documents(
        documents, 
        embeddings, 
        "http://localhost:6333"
    )
    query = "What did the president say about Ketanji Brown Jackson"
    
    # 异步搜索
    docs = await db.asimilarity_search(query)
    
    # 或者使用向量搜索
    embedding_vector = embeddings.embed_query(query)
    docs = await db.asimilarity_search_by_vector(embedding_vector)
    return docs

# asyncio.run(main())

query = "What did the president say about Ketanji Brown Jackson"
# k: 返回数量，fetch_k: 初始检索数量，lambda_mult: 多样性权重 (0~1)
found_docs = await qdrant.amax_marginal_relevance_search(query, k=2, fetch_k=10, lambda_mult=0.5)

from langchain_community.vectorstores.utils import DistanceStrategy

class DistanceStrategy(str, Enum):
    EUCLIDEAN_DISTANCE = "EUCLIDEAN_DISTANCE"
    MAX_INNER_PRODUCT = "MAX_INNER_PRODUCT"
    DOT_PRODUCT = "DOT_PRODUCT"
    JACCARD = "JACCARD"
    COSINE = "COSINE"

# 省略部分代码...
db = FAISS.from_documents(
    documents=documents, 
    embedding=embedding, 
    distance_strategy=DistanceStrategy.COSINE
)

from langchain_text_splitters import RecursiveCharacterTextSplitter

splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=50,
    separators=["\n\n", "\n", " ", ""]
)
documents = splitter.split_documents(raw_documents)

from langchain.schema import Document

# 假设文档带有 metadata 字段
docs = db.similarity_search(
    query="金融政策",
    filter={"source": "./policy.txt"}  # 仅搜索该来源的文档
)

向量库	类型	优点	缺点	适用场景
FAISS	本地库	速度快，内存占用低，免费	不支持持久化存储，无服务端	原型开发，本地测试
Qdrant	云服务/本地	支持过滤，高性能，REST API	需要部署维护	生产环境，复杂查询
Chroma	本地/云	易用，Python 友好，轻量	大规模并发能力较弱	小型项目，快速验证
Pinecone	云服务	托管服务，免运维，高可用	成本较高，闭源	企业级应用，高 SLA 要求

LangChain 进阶：Vector Stores 向量存储详解

LangChain 进阶：Vector Stores 向量存储详解

01 介绍

Vector Stores 的核心用途

Vector Stores 实现方式

Vector Stores 功能特性

Vector Stores 应用场景

02 Vector Store 使用指南

1. 相似性搜索 (Similarity Search)

更多推荐文章

相关免费在线工具

2. 带分数值的相似性搜索

3. 本地保存与加载 (Save & Load)

4. 向量库合并 (Vector Merge)

5. 异步操作 (Asynchronous Operations)

6. 最大边际相关性搜索 (MMR)

03 相似度计算策略

04 最佳实践与选型建议

1. 文本切分策略

2. 元数据过滤

3. 向量库选型对比

4. 安全性与序列化

05 总结

更多推荐文章

相关免费在线工具

LangChain 进阶：Vector Stores 向量存储详解

LangChain 进阶：Vector Stores 向量存储详解

01 介绍

Vector Stores 的核心用途

Vector Stores 实现方式

Vector Stores 功能特性

Vector Stores 应用场景

02 Vector Store 使用指南

1. 相似性搜索 (Similarity Search)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 带分数值的相似性搜索

3. 本地保存与加载 (Save & Load)

4. 向量库合并 (Vector Merge)

5. 异步操作 (Asynchronous Operations)

6. 最大边际相关性搜索 (MMR)

03 相似度计算策略

04 最佳实践与选型建议

1. 文本切分策略

2. 元数据过滤

3. 向量库选型对比

4. 安全性与序列化

05 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具