Milvus 实战：Attu 可视化安装与 Python 整合指南 | 极客日志

Milvus 实战：Attu 可视化安装与 Python 整合指南 | 极客日志

docker run -p 8080:3000 -e MILVUS_URL=xxx.xxx.xxx.xxx:19530 zilliz/attu:v2.5.3

pip install pymilvus==2.5.5

python -c "from pymilvus import Collection"

# 方式 1：使用 connections.connect（传统方式）
from pymilvus import connections, db
conn = connections.connect(host="192.168.229.128", port=19530)

# 方式 2：使用 MilvusClient（推荐，Milvus 2.3+ 支持）
from pymilvus import MilvusClient
client = MilvusClient("http://192.168.229.128:19530")

from pymilvus import connections, db

# 连接服务
connections.connect(host="192.168.229.128", port=19530)

# 1. 创建数据库（名称自定义）
db.create_database("my_rag_database")

# 2. 切换使用目标数据库
db.using_database("my_rag_database")

# 3. 列出所有数据库
all_dbs = db.list_database()
print("所有数据库：", all_dbs)
# 输出：['default', 'my_rag_database']

# 4. 删除数据库（谨慎操作！）
db.drop_database("my_rag_database")

数据类型	说明	示例
INT64	64 位整型，常用作主键	DataType.INT64
VARCHAR	变长字符串，需指定 max_length	DataType.VARCHAR(max_length=50)
FLOAT	单精度浮点数	DataType.FLOAT
FLOAT_VECTOR	浮点型向量，需指定 dim（维度）	DataType.FLOAT_VECTOR(dim=128)

from pymilvus import connections, FieldSchema, DataType, CollectionSchema, Collection

# 1. 连接服务并切换数据库
connections.connect(host="192.168.229.128", port=19530)
db.using_database("my_rag_database")

# 2. 定义字段（静态 Schema：所有字段提前声明）
fields = [
    # 主键字段：id（自增或手动指定）
    FieldSchema(name="id", dtype=DataType.INT64, is_primary=True),
    # 向量字段：dim=128（需与嵌入模型输出维度一致）
    FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=128),
    # 标量字段：文档标签
    FieldSchema(name="doc_tag", dtype=DataType.VARCHAR, max_length=50)
]

# 3. 创建 Schema（添加描述）
schema = CollectionSchema(
    fields=fields,
    description="RAG 系统文档向量集合（静态字段）",
    enable_dynamic_field=False  # 关闭动态字段
)

# 4. 创建 Collection（指定分片数，分布式场景关键）
collection = Collection(
    name="static_doc_collection",
    schema=schema,
    shards_num=2  # 推荐值：集群节点数×2，单节点场景默认 2 即可
)
print("Collection 创建成功！")

from pymilvus import connections, FieldSchema, DataType, CollectionSchema, Collection

# 1. 连接服务
connections.connect(host="192.168.229.128", port=19530)
db.using_database("my_rag_database")

# 2. 定义核心字段（仅声明必要字段）
fields = [
    FieldSchema(name="id", dtype=DataType.INT64, is_primary=True),
    FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=128)
]

# 3. 创建 Schema（启用动态字段）
dynamic_schema = CollectionSchema(
    fields=fields,
    description="RAG 系统动态字段集合",
    enable_dynamic_field=True  # 关键：开启动态字段
)

# 4. 创建 Collection
dynamic_collection = Collection(
    name="dynamic_doc_collection",
    schema=dynamic_schema,
    shards_num=2
)

# 5. 插入数据（包含未定义的动态字段 color、doc_source）
data = [
    {
        "id": 0,
        "embedding": [0.358, -0.602, 0.184, -0.263, 0.903],  # 简化为 5 维示例
        "color": "pink_8682",
        "doc_source": "pdf_file_1.pdf"
    },
    {
        "id": 1,
        "embedding": [-0.334, -0.257, 0.899, 0.940, 0.538],
        "color": "grey_8510",
        "doc_source": "docx_file_2.docx"
    }
]

# 插入数据（动态字段会自动作为键值对存储）
insert_result = dynamic_collection.insert(data=data)
print("数据插入成功，插入 ID：", insert_result.primary_keys)