Zvec 架构深度解析：阿里开源轻量级进程内向量数据库 | 极客日志

C++Node.jsAI算法

Zvec 架构深度解析：阿里开源轻量级进程内向量数据库

Zvec 是阿里巴巴开源的轻量级进程内向量数据库，基于 Proxima 引擎构建。支持稠密与稀疏向量混合搜索，提供毫秒级低延迟性能。架构采用分层设计，包含用户层、绑定层、数据库层及核心索引框架，存储层结合 RocksDB 与 MMap。支持 C++ 原生及 Python、Node.js 绑定。目前 PyPI 包尚未发布，源码构建需初始化 Git 子模块。适用于 RAG、推荐系统及边缘计算等对延迟敏感场景。

栈溢出发布于 2026/3/30更新于 2026/7/2039 浏览

Zvec 架构深度解析：阿里开源轻量级进程内向量数据库

Zvec 是阿里巴巴开源的一个轻量级、闪电般快速的进程内向量数据库。本文将深入分析 Zvec 的代码架构，揭示其核心设计理念和技术实现细节。

一、项目概览

1.1 核心特性

Zvec 基于 Alibaba 久经考验的 Proxima 向量搜索引擎构建，提供生产级的低延迟、可扩展的相似度搜索能力：

极致性能：毫秒级搜索数十亿级向量
简单易用：无需服务器配置，零依赖安装
混合向量支持：同时支持稠密向量（Dense）和稀疏向量（Sparse）
混合搜索：语义相似度 + 结构化过滤
随处运行：嵌入到应用进程内运行

1.2 技术栈

组件	技术
语言	C++17
构建系统	CMake
Python 绑定	Pybind11
存储引擎	RocksDB
向量索引	Proxima (IVF, HNSW, Flat)
序列化	Protobuf
压缩	LZ4
位图	CRoaring
距离计算	SIMD 加速

1.3 目录结构

zvec/
├── src/
│   ├── include/zvec/ # 公共头文件
│   │   ├── core/ # 核心索引框架
│   │   │   ├── framework/ # 索引组件框架
│   │   │   └── interface/ # 索引接口定义
│   │   ├── db/ # 数据库层
│   │   └── ailego/ # 基础工具库
│   ├── binding/python/ # Python 绑定
│   └── ailego/ # 辅助工具实现
├── thirdparty/ # 第三方依赖
├── python/ # Python 包
├── tests/ # 测试用例
└── CMakeLists.txt

二、分层架构设计

2.1 整体架构图

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

索引类型	适用场景	特点
Flat	小数据集 (<10 万)	100% 召回率，暴力搜索
IVF	中等数据集 (10 万 -1 亿)	聚类分区，速度与精度平衡
HNSW	大数据集 (>1 亿)	图结构，极快查询

class Index {
public:
    virtual int Add(const VectorData &vector, uint32_t doc_id);
    virtual int Search(const VectorData &query, SearchParams *, SearchResult *);
    virtual int Train();
    virtual int Open(const std::string &file_path, StorageOptions);
};

// 三种索引类型实现
class FlatIndex : public Index {};
// 暴力搜索
class IVFIndex : public Index {};
// 倒排文件索引
class HNSWIndex : public Index {};
// 层次导航小世界图

struct SparseVector {
    uint32_t count;
    const void* indices; // uint32_t*
    const void* values; // 类型特定*
};

struct HybridVector {
    // 组合稠密和稀疏向量
    // 支持混合搜索策略
};

Holder 类型	容器	迭代特性	内存策略	适用场景
OnePass	`std::list`	消费数据	迭代后释放	单次遍历（索引构建）
MultiPass	`std::vector`	保留数据	holder 销毁时释放	多次遍历（搜索精炼）
RandomAccess	紧凑数组 + key 向量	随机访问	紧凑布局	O(1) 查找需求

class HnswQueryParams : public QueryParams {
    int ef_; // 探索因子
    float radius_; // 搜索半径
    bool is_linear_; // 是否使用线性扫描
    bool is_using_refiner_; // 是否使用精炼器
};

class IVFQueryParams : public QueryParams {
    int nprobe_; // 探测的簇数量
    float scale_factor_; // 缩放因子
};

class CollectionImpl : public Collection {
    // 路径管理
    std::string path_;
    bool destroyed_{false};
    // Schema 和选项
    CollectionSchema::Ptr schema_;
    CollectionOptions options_;
    mutable std::shared_mutex schema_handle_mtx_;
    // 分片管理
    std::atomic<SegmentID> segment_id_allocator_;
    std::atomic<SegmentID> tmp_segment_id_allocator_;
    Segment::Ptr writing_segment_;
    SegmentManager::Ptr segment_manager_;
    // 版本管理
    VersionManager::Ptr version_manager_;
    // 并发控制
    mutable std::shared_mutex write_mtx_;
    // 文件锁和元数据
    ailego::File lock_file_;
    IDMap::Ptr id_map_;
    DeleteStore::Ptr delete_store_;
    sqlengine::SQLEngine::Ptr sql_engine_;
};

enum class WriteMode : uint8_t {
    UNDEFINED = 0,
    INSERT, // 仅插入新文档
    UPDATE, // 更新现有文档
    UPSERT, // 更新或插入
};

SegmentID allocate_segment_id() {
    return segment_id_allocator_.fetch_add(1);
}

collection_root/
├── _CollectionLock # 进程锁文件
├── meta/ # 元数据
│   ├── schema.pb # 集合 schema
│   ├── config.pb # 选项配置
│   └── version.pb # 版本信息
├── segments/ # 数据分片
│   ├── segment_00001/
│   │   ├── meta.pb # 分片元数据
│   │   ├── data/ # 原始向量数据
│   │   ├── indexes/ # 向量索引
│   │   │   ├── flat/
│   │   │   ├── ivf/
│   │   │   └── hnsw/
│   │   ├── forward/ # 标量字段
│   │   │   └── rocksdb/
│   │   └── sql.db # SQL 引擎数据库
│   └── ...
├── writing_segment/ # 活动写入分片
├── id_map/ # PK → DocID 映射
├── delete_store/ # 删除墓碑标记
└── version_manager/ # 版本跟踪

struct MemoryBlock {
    enum MemoryBlockType {
        MBT_MMAP = 1, // 内存映射文件
        MBT_BUFFERPOOL = 2 // 内存池缓冲区
    };
    // 支持零拷贝访问
    const void* data;
    BufferHandle buffer_handle_;
};

class IndexStorage {
    // 段管理
    virtual int open(const std::string &path, bool create) = 0;
    virtual int append(const std::string &id, size_t size) = 0;
    virtual Segment::Pointer get(const std::string &id) = 0;
};

// 内存映射文件，零拷贝访问
class MMapFile {
    int fd_;
    void* mapped_data_;
    size_t size_;
    int map(const std::string &path, size_t size, int prot, int flags);
    int unmap();
};

PYBIND11_MODULE(_zvec, m){
    ZVecPyTyping::Initialize(m); // 类型定义
    ZVecPyParams::Initialize(m); // 参数绑定
    ZVecPySchemas::Initialize(m); // Schema 绑定
    ZVecPyConfig::Initialize(m); // 配置绑定
    ZVecPyDoc::Initialize(m); // 文档绑定
    ZVecPyCollection::Initialize(m); // 集合绑定
}

void throw_if_error(const Status &status) {
    switch(status.code()) {
        case StatusCode::NOT_FOUND: throw py::key_error(status.message());
        case StatusCode::INVALID_ARGUMENT: throw py::value_error(status.message());
        default: throw std::runtime_error(status.message());
    }
}

template<typename T>
T unwrap_expected(const tl::expected<T, Status>& exp) {
    if(exp.has_value()) { return exp.value(); }
    throw_if_error(exp.error());
}

import zvec

# 定义 Schema
schema = zvec.CollectionSchema(
    name="example",
    vectors=zvec.VectorSchema("embedding", zvec.DataType.VECTOR_FP32, 4)
)

# 创建并打开集合
collection = zvec.create_and_open(path="./zvec_example", schema=schema)

# 插入文档
collection.insert([
    zvec.Doc(id="doc_1", vectors={"embedding": [0.1, 0.2, 0.3, 0.4]}),
    zvec.Doc(id="doc_2", vectors={"embedding": [0.2, 0.3, 0.4, 0.1]}),
])

# 向量搜索
results = collection.query(
    zvec.VectorQuery("embedding", vector=[0.4, 0.3, 0.3, 0.1]),
    topk=10
)

// SIMD 优化的批量计算
namespace math_batch {
    // 批量点积计算
    void dot_product_simd(const float* a, const float* b, size_t n, float* result);
    // 批量 L2 距离计算
    void l2_distance_simd(const float* a, const float* b, size_t n, float* result);
}

class BufferManager {
    // 预分配内存池
    void* allocate(size_t size);
    // 回收内存到池中
    void deallocate(void* ptr);
    // 批量分配，减少系统调用
    std::vector<void*> batch_allocate(size_t size, size_t count);
};

依赖	用途	原因
RocksDB	结构化数据存储	高性能 KV 引擎
Arrow	列式数据格式	零拷贝互操作性
Protobuf	元数据序列化	跨语言兼容
LZ4	数据压缩	极快压缩/解压
CRoaring	位图索引	压缩集合运算
SparseHash	稀疏数据存储	内存高效
glog	日志记录	Google 风格日志
ANTLR	表达式解析	过滤表达式
googletest	单元测试	Google 测试框架

Python API ↓ Pybind11 包装器 (throw_if_error) ↓ Collection::Insert() ↓ CollectionImpl::write_impl(INSERT) ↓ 
1. 获取写锁 (std::shared_mutex) 
2. 检查分片容量 
3. 如需要切换到新分片 
4. 分配文档 ID (IDMap) 
5. 写入向量数据 (VectorSegment) 
6. 写入标量数据 (RocksDB) 
7. 更新分片元数据 
8. 释放写锁 ↓ 
返回 WriteResults ↓ Python WriteResults 对象

Python VectorQuery ↓ Pybind11 包装器 ↓ Collection::Query() ↓ CollectionImpl::Query() ↓ 
1. 解析查询参数 
2. 识别相关分片 
3. 查询每个分片索引 - HNSWIndex::Search() - 或 IVFIndex::Search() - 或 FlatIndex::Search() 
4. 应用过滤器（如果有） 
5. 合并和排序结果 
6. 精炼 top-K 结果（如果配置） ↓ 
返回 DocPtrList ↓ Python Doc 对象列表

特性	Zvec (进程内)	Milvus/Pinecone (服务器)
延迟	~1ms	~10-100ms
部署	嵌入式	独立服务
扩展性	单机	水平扩展
配置	无	必需
资源占用	与应用共享	专用

功能	文件路径
索引接口	`src/include/zvec/core/interface/index.h`
集合接口	`src/include/zvec/db/collection.h`
索引 Holder	`src/include/zvec/core/framework/index_holder.h`
索引存储	`src/include/zvec/core/framework/index_storage.h`
集合实现	`src/db/collection.cc`
Python 绑定	`src/binding/python/model/python_collection.cc`
Schema	`src/include/zvec/db/schema.h`
查询参数	`src/include/zvec/db/query_params.h`

# 激活 Python 环境
source ~/miniforge3/bin/activate py311

# 克隆仓库
git clone https://github.com/alibaba/zvec.git
cd zvec

# 初始化 Git Submodules
git submodule update --init --recursive

# 配置构建
mkdir -p test_build && cd test_build
cmake -S .. -B . -DCMAKE_BUILD_PYTHON_BINDINGS=OFF

# 构建
make -j4

Zvec 架构深度解析：阿里开源轻量级进程内向量数据库

Zvec 架构深度解析：阿里开源轻量级进程内向量数据库

一、项目概览

1.1 核心特性

1.2 技术栈

1.3 目录结构

二、分层架构设计

2.1 整体架构图

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

三、核心索引框架详解

3.1 索引类型与选择策略

3.2 IndexHolder 系统：模板化的数据管理

三个设计维度

内存管理策略

稀疏与混合向量支持

设计决策表

模板特化模式

3.3 查询参数系统

四、数据库层架构

4.1 CollectionImpl 结构

4.2 写入模式

4.3 分片管理策略

4.4 并发策略

五、存储与持久化架构

5.1 文件组织结构

5.2 存储层组件

5.3 MMap 优化

六、Python 绑定架构

6.1 绑定模块结构

6.2 错误处理机制

6.3 结果解包

6.4 Python API 示例

七、性能优化技术

7.1 向量化计算

7.2 内存池管理

7.3 压缩与位图

八、核心依赖库分析

九、数据流详解

9.1 插入流程

9.2 查询流程

十、与服务器型向量数据库对比

十一、架构亮点总结

11.1 设计优势

11.2 技术亮点

十二、适用场景

十三、代码位置参考

十四、部署与安装说明

14.1 安装现状

14.2 源码构建步骤

14.3 潜在问题与解决

十五、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具