Milvus 开源向量数据库技术解析与实战 | 极客日志

PythonAI算法

Milvus 开源向量数据库技术解析与实战

Milvus 是一款专为非结构化数据检索设计的开源向量数据库。它支持高效存储和查询大规模高维向量数据，广泛应用于智能推荐、AIGC 增强、多模态搜索等场景。核心特性包括云原生架构、混合查询能力及 GPU 加速。通过 Docker 或 Python SDK 可快速部署，结合 Embedding 模型实现语义搜索。作为 LF AI & Data 基金会项目，Milvus 已成为 AI 基础设施的重要组成部分。

ApiHolic发布于 2026/3/15更新于 2026/7/530 浏览

Milvus 开源向量数据库技术解析与实战

什么是 Milvus？

Milvus 是一个专为非结构化数据检索设计的开源向量数据库，由 Zilliz 公司开发并捐赠给 LF AI & Data 基金会托管。它专注于高效存储、索引和查询大规模高维向量数据（如图像特征、文本嵌入、音频指纹等），支持以图搜图、语义搜索、推荐系统等 AI 核心应用。

与传统关系型数据库处理结构化表格数据不同，Milvus 处理的是 AI 模型生成的高维向量（768 维、1024 维甚至更高），通过近似最近邻（ANN）搜索技术，在毫秒级时间内从十亿级向量中找到最相似的结果。

核心定位：为生产级 AI 应用而生的云原生向量数据库。

官网：https://milvus.io/zh

通俗理解：如果把传统数据库比作'图书馆目录'，Milvus 就是'大脑海马体'——它不记文字，而是存储'语义指纹'，实现'以意搜意'。

发展历程

2019 年：Milvus 正式开源，年底获得约 30 个用户
2020 年：用户增长至 200+，加入 LF AI 基金会
2021 年：发布 Milvus 2.0，全面云原生架构重构
2023 年：RAG（检索增强生成）元年，随着大模型爆发，GitHub 星标骤增
2024 年：被 Forrester 评为向量数据库类别领导者，GitHub 突破 30,000+ Stars

自推出以来，Milvus 在 GitHub 上拥有超过 26,000 个星标和 260 多位贡献者，全球下载和安装量超过 2000 万次，已经成为全球使用最广泛的向量数据库之一。Milvus 已经被 5,000 多家企业所采用，服务于 AIGC、电子商务、媒体、金融、电信和医疗等多个行业。

核心特点

特性	说明	价值
极致性能	IVF_PQ/HNSW 索引 + GPU 加速	10 亿向量 <100ms 检索（P99）
云原生架构	存算分离、K8s Operator 管理	弹性扩缩容，运维成本降低 70%
混合查询	向量 + 标量（WHERE age>18）	满足真实业务复杂过滤需求
多模态支持	文本/图像/音频/视频统一向量化	一套系统支撑全场景 AI 应用
生态无缝集成	LangChain/LlamaIndex/Spring AI 官方支持	5 行代码接入 RAG 应用
企业级可靠	多副本、快照备份、审计日志	金融级数据安全与合规

典型应用场景

场景	案例	Milvus 作用
智能推荐	电商'猜你喜欢'、短视频推荐	实时计算用户兴趣向量相似度

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 1. 启动 Milvus 单机版（含 Attu 可视化界面）
wget https://github.com/milvus-io/milvus/releases/download/v2.4.0/milvus-standalone-docker-compose.yml -O docker-compose.yml
docker-compose up -d

# 2. 访问 Web 管理界面
# 浏览器打开：http://localhost:3000
# Attu 管理后台

pip install pymilvus

from pymilvus import connections, Collection, FieldSchema, CollectionSchema, DataType, utility
import numpy as np

# 1. 连接 Milvus
connections.connect(host='localhost', port='19530')

# 2. 定义 Schema（向量 + 标量）
fields = [
    FieldSchema(name="id", dtype=DataType.INT64, is_primary=True, auto_id=True),
    FieldSchema(name="title", dtype=DataType.VARCHAR, max_length=200),
    FieldSchema(name="genre", dtype=DataType.VARCHAR, max_length=50),
    FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=768) # BERT 向量维度
]
schema = CollectionSchema(fields, "movie_collection")
collection = Collection("movies", schema)

# 3. 插入模拟数据（实际用 Embedding 模型生成）
movies = [
    {"title": "星际穿越", "genre": "科幻", "embedding": np.random.random(768).tolist()},
    {"title": "肖申克的救赎", "genre": "剧情", "embedding": np.random.random(768).tolist()}
]
collection.insert([[m["title"] for m in movies], [m["genre"] for m in movies], [m["embedding"] for m in movies]])

# 4. 创建索引（HNSW 高精度）
index_params = {
    "metric_type": "COSINE",
    "index_type": "HNSW",
    "params": {"M": 8, "efConstruction": 200}
}
collection.create_index("embedding", index_params)
collection.load() # 加载到内存

# 5. 语义搜索：找'关于希望与自由的电影'
query_vec = np.random.random(768).tolist() # 实际应为'希望 自由'文本的 Embedding
results = collection.search(
    data=[query_vec],
    anns_field="embedding",
    param={"metric_type": "COSINE", "params": {"ef": 50}},
    limit=3,
    expr="genre in ['剧情', '励志']" # 混合查询：先过滤类型
)

# 6. 输出结果
for hit in results[0]:
    print(f"推荐电影：{hit.entity.get('title')} | 相似度：{1- hit.distance:.4f}")

Milvus 开源向量数据库技术解析与实战

Milvus 开源向量数据库技术解析与实战

什么是 Milvus？

发展历程

核心特点

典型应用场景

更多推荐文章

相关免费在线工具

原理流程

快速开始

方式一：Docker 一键启动（推荐新手）

方式二：Python SDK 快速验证

使用示例：构建一个'电影语义搜索'小应用

更多推荐文章

相关免费在线工具

Milvus 开源向量数据库技术解析与实战

Milvus 开源向量数据库技术解析与实战

什么是 Milvus？

发展历程

核心特点

典型应用场景

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

原理流程

快速开始

方式一：Docker 一键启动（推荐新手）

方式二：Python SDK 快速验证

使用示例：构建一个'电影语义搜索'小应用

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具