Retriever 不是向量库的糖衣，而是 Eino 的读侧统一协议 | 极客日志

Go / GolangAI算法

Retriever 不是向量库的糖衣，而是 Eino 的读侧统一协议

Eino 的 Retriever 组件不只是对搜索接口的简单封装，它定义了一套统一的读侧检索协议，将查询、向量化、过滤、结果规范化及运行时回调整合在一起，让 RAG 链路中的检索步骤可以干净地进入 Chain 和 Graph 编排。文章从常见误区入手，拆解了 Retrieve 接口的核心边界、公共 Option 的真实作用，并通过 VikingDB 示例和自定义实现骨架展示了如何正确对接后端、管理 metadata 并接入 Callback 排障。

魔尊发布于 2026/6/170 浏览

为什么很多人用了 Retriever，却没看懂它真正的边界

很多人第一眼看到 Retriever，下意识觉得：这不就是调一下向量库或搜索引擎的 search，把最像的几条文档捞出来吗？代码看上去也确实是这么回事。

但只要往工程里多走两步，问题马上冒出来：

query 到底在哪里做 embedding？
多知识库、多子索引怎么切？
TopK 和相似度阈值该放配置里，还是放运行时？
过滤条件写在 SDK 调用里，还是写在组件 option 里？
一次检索怎么进入 Chain、Graph、Callback 这条正式运行时链路？

这些事如果都散在业务代码里，不是不能跑，而是跑不久就会乱。

之前聊 Indexer 的时候，我强调它解决的是写入侧如何统一。现在换到 Retriever，重心就要转到读侧：

Retriever 是 Eino 在读侧给出的统一检索协议，不是某家向量库 SDK 的语法糖。

不只是'搜一下'

先别看 Retrieve(ctx, query, opts...) 这个方法，怕你直接把它定位成'检索调用的统一壳子'。

真正让 Retriever 发挥作用的是读侧这几件事：

把 query 变成标准检索入口。 上层只需要给查询字符串，后面是关键词、向量、混合检索还是带过滤的召回，组件内部去接。

把结果统一成 []*schema.Document。 不管底层是 VikingDB、Milvus、ES 还是 OpenSearch，最后交上来的都不是某家 SDK 的 hit 结构，而是标准文档协议。

把检索纳入运行时链路。 这里要认清：Retriever 不是工具函数，是能进 Chain、Graph、挂 Callback 的正式组件。

放到 RAG 里看，这层价值更清楚：

Embedding 把文本变成向量
Indexer 把文档写成可检索对象
Retriever 把 query 变成召回动作
ChatModel 基于召回结果生成答案

Rerank 通常放在 Retriever 之后，对候选结果做重排，那不是 Retriever 本体的事。

所以别把它理解成'搜索函数封装'。更准确的说法是：

Retriever 解决的是'查询如何以统一协议进入检索系统，并把结果以统一协议返回出来'。

Retrieve 动作的核心

官方接口其实很短：

type Retriever interface {
    Retrieve(ctx context.Context, query string, opts ...Option) ([]*schema.Document, error)
}

比 Indexer 还简单。但真正要看的是它画的边界。

retriever.Retriever 说明 Eino 在组件层明确区分了写入协议和读取协议。前面有 Indexer 负责 Store，这里再单独给 Retrieve 一层抽象，意图明显：写进去怎么做，和查出来怎么做，是两条边界。

再看签名里四个要点：

在 Eino 里，它还承担请求级信息和 callback manager 的传递。检索这一步从一开始就被当成正式运行时行为，不是藏在工具函数里的黑盒调用。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

type Document struct {
    ID       string
    Content  string
    MetaData map[string]any
}

type Options struct {
    Index          *string
    SubIndex       *string
    TopK           *int
    ScoreThreshold *float64
    Embedding      embedding.Embedder
    DSLInfo        map[string]any
}

Loader / Parser -> Indexer -> Retriever -> ChatModel

原始资料 -> Loader / Parser -> []*schema.Document -> 切块 / 清洗 -> Indexer.Store -> 可检索后端 -> Retriever.Retrieve(query) -> []*schema.Document -> ChatModel

package main

import (
    "context"
    "log"

    "github.com/cloudwego/eino-ext/components/retriever/volc_vikingdb"
)

// ptr 用来快速生成指针字段，便于给 TopK / ScoreThreshold 这类可选配置赋值。
func ptr[T any](v T) *T {
    return &v
}

func main() {
    ctx := context.Background()
    // RetrieverConfig 描述的是'读侧'检索配置：
    // 查询发往哪个集合 / 索引、怎么做向量化、召回多少条、过滤条件是什么。
    cfg := &volc_vikingdb.RetrieverConfig{
        // VikingDB 服务连接信息。
        Host:            "api-vikingdb.volces.com",
        Region:          "cn-beijing",
        AK:              "your-ak",
        SK:              "your-sk",
        Scheme:          "https",
        ConnectionTimeout: 0, // 0 表示使用默认超时策略。
        // 目标检索位置：集合 + 索引。
        Collection: "eino_test",
        Index:      "test_index_1",
        // 查询侧向量化配置：
        // 这里使用内置 embedding 模型 bge-m3，并开启稀疏 + 稠密混合检索。
        EmbeddingConfig: volc_vikingdb.EmbeddingConfig{
            UseBuiltin: true,
            ModelName:  "bge-m3",
            UseSparse:  true,
            DenseWeight: 0.4, // 稠密向量权重；其余权重可理解为给稀疏召回。
        },
        Partition: "",
        // 检索参数：
        // TopK 控制最多召回多少条，ScoreThreshold 控制最低分数阈值。
        TopK:           ptr(10),
        ScoreThreshold: ptr(0.1),
        // 可选过滤条件；这里不加过滤，表示直接查整个索引。
        FilterDSL: nil,
    }
    // 创建 Retriever。此时完成的是'查询入口'初始化，而不是写入逻辑。
    r, err := volc_vikingdb.NewRetriever(ctx, cfg)
    if err != nil {
        log.Fatal(err)
    }
    // 发起一次查询，返回召回到的 Document 列表。
    docs, err := r.Retrieve(ctx, "怎么申请退款")
    if err != nil {
        log.Fatal(err)
    }
    // 输出召回结果的基础信息。
    for _, doc := range docs {
        log.Printf("id=%s metadata=%v content=%s", doc.ID, doc.MetaData, doc.Content)
    }
}

docs, err := retriever.Retrieve(ctx, query, opts...)

chain := compose.NewChain[string, []*schema.Document]()
chain.AppendRetriever(retriever)
graph := compose.NewGraph[string, []*schema.Document]()
graph.AddRetrieverNode("retriever_node", retriever)

handler := &callbacksHelper.RetrieverCallbackHandler{
    OnStart: func(ctx context.Context, info *callbacks.RunInfo, input *retriever.CallbackInput) context.Context {
        log.Printf("query=%s topK=%d", input.Query, input.TopK)
        return ctx
    },
    OnEnd: func(ctx context.Context, info *callbacks.RunInfo, output *retriever.CallbackOutput) context.Context {
        log.Printf("docs=%d", len(output.Docs))
        return ctx
    },
}
helper := callbacksHelper.NewHandlerHelper().Retriever(handler).Handler()
chain := compose.NewChain[string, []*schema.Document]()
chain.AppendRetriever(retriever)
runner, _ := chain.Compile(ctx)
docs, _ := runner.Invoke(ctx, "怎么申请退款", compose.WithCallbacks(helper))
_ = docs

type MyRetriever struct {
    index   string
    topK    int
    embedder embedding.Embedder
}

func (r *MyRetriever) Retrieve(
    ctx context.Context,
    query string,
    opts ...retriever.Option,
) ([]*schema.Document, error) {
    // 合并默认配置和本次调用传入的可选项。
    commonOpts := retriever.GetCommonOptions(&retriever.Options{
        Index:     &r.index,
        TopK:      &r.topK,
        Embedding: r.embedder,
    }, opts...)

    // 从 context 中取出 callback manager，用于统一派发开始 / 结束 / 错误事件。
    cm := callbacks.ManagerFromContext(ctx)
    runInfo := &callbacks.RunInfo{}

    // 检索开始前触发 OnStart，把这次调用的输入信息暴露给 callback 链路。
    ctx = cm.OnStart(ctx, runInfo, &retriever.CallbackInput{
        Query:          query,
        TopK:           *commonOpts.TopK,
        ScoreThreshold: commonOpts.ScoreThreshold,
        Extra: map[string]any{
            "index":     commonOpts.Index,
            "sub_index": commonOpts.SubIndex,
            "dsl":       commonOpts.DSLInfo,
        },
    })

    // 真正执行检索逻辑。
    docs, err := r.doRetrieve(ctx, query, commonOpts)
    if err != nil {
        // 检索失败时触发 OnError，便于日志、trace、监控等统一处理。
        ctx = cm.OnError(ctx, runInfo, err)
        return nil, err
    }

    // 检索成功后触发 OnEnd，把结果交给 callback 链路。
    ctx = cm.OnEnd(ctx, runInfo, &retriever.CallbackOutput{
        Docs: docs,
    })
    return docs, nil
}

func (r *MyRetriever) doRetrieve(
    ctx context.Context,
    query string,
    opts *retriever.Options,
) ([]*schema.Document, error) {
    var queryVector []float64
    // 如果配置了 Embedding，就先把 query 向量化，再交给后端检索。
    if opts.Embedding != nil {
        vectors, err := opts.Embedding.EmbedStrings(ctx, []string{query})
        if err != nil {
            return nil, err
        }
        queryVector = vectors[0]
    }
    _ = queryVector // 这里用静态结果模拟后端召回。
    docs := []*schema.Document{{
        ID: "doc_1",
        Content: "退款申请一般需要先提交订单号和支付凭证。",
        MetaData: map[string]any{
            "score":    0.92,
            "source":   "faq/refund.md",
            "backend":  "my_store",
        },
    }}
    return docs, nil
}

Retriever 不是向量库的糖衣，而是 Eino 的读侧统一协议

为什么很多人用了 Retriever，却没看懂它真正的边界

不只是'搜一下'

Retrieve 动作的核心

更多推荐文章

相关免费在线工具

公共 Option 不是几个小参数

Retriever 的使命：把查询送进检索系统

用 VikingDB 走一遍最小检索闭环

为什么它能直接进 Chain、Graph 和 Callback

自己实现一个 Retriever 时，哪些细节不能省

5 个最容易把 Retriever 用浅的坑

总结

参考资料

更多推荐文章

相关免费在线工具

Retriever 不是向量库的糖衣，而是 Eino 的读侧统一协议

为什么很多人用了 Retriever，却没看懂它真正的边界

不只是'搜一下'

Retrieve 动作的核心

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

公共 Option 不是几个小参数

Retriever 的使命：把查询送进检索系统

用 VikingDB 走一遍最小检索闭环

为什么它能直接进 Chain、Graph 和 Callback

自己实现一个 Retriever 时，哪些细节不能省

5 个最容易把 Retriever 用浅的坑

总结

参考资料

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具