Eino 组件核心篇：Retriever 在 RAG 中的检索应用 | 极客日志

Go / GolangAI算法

Eino 组件核心篇：Retriever 在 RAG 中的检索应用

Eino 框架中的 Retriever 组件是读侧统一检索协议，负责将查询以标准协议送入检索系统并返回统一文档结构。它不仅是 SDK 封装，而是能进入 Chain、Graph 和 Callback 的正式运行时节点。核心接口包含 Context、Query、Options 和 Document 列表。公共 Option 支持索引、子索引、TopK、阈值及 Embedding 配置。实现时需遵循标准回调生命周期，注意元数据完整性及向量模型一致性。常见误区包括将其视为薄封装、忽略 MetaData、写死参数及未接入追踪链路。

芝士奶盖发布于 2026/4/6更新于 2026/7/641 浏览

为什么很多人会用 Retriever，却没真正看懂 Retrieve

很多人第一次看到 Retriever，第一反应都很直接：

不就是调一下向量库或者搜索引擎的 search，把最像的几条文档捞出来吗？

代码看起来也确实像这么回事。

可只要你继续往工程里走，问题马上就来了：

query 到底在哪里做 embedding？
多知识库、多子索引怎么切？
TopK 和相似度阈值该放配置里，还是放运行时？
过滤条件到底写在 SDK 调用里，还是写在组件 option 里？
一次检索到底怎么进 Chain、Graph、Callback 这条正式运行时链路？

如果这些事都散在业务代码里，检索当然也能跑，但通常跑不久就会乱。

之前的 Indexer 组件，讲的是在存一侧，如何统一的存。而 Retriever 组件，讲的是如何统一取：即：

Retriever 是 Eino 在读侧给出的统一检索协议，不是某家向量库 SDK 的语法糖。

1. Retriever 真正解决的，不只是'搜一下'

我先不讲解 Retrieve(ctx, query, opts...) 这个方法，怕你把它只定位成'检索调用的统一壳子'。

发挥 Retriever 真正作用的，其实是读侧这几件事：

第一，把 query 变成标准检索入口。

上层只需要给出查询字符串，至于后面是关键词检索、向量检索、混合检索，还是带过滤条件的召回，都由组件自己去接具体实现。

第二，把结果统一成 []*schema.Document。

不管底层是 VikingDB、Milvus、ES，还是 OpenSearch，最后交给上层的都不是某家 SDK 的 hit 结构，而是标准文档协议。

第三，把检索正式纳入运行时链路。

首先你要认清 Retriever 不是帮助函数，而是能进 Chain、Graph、挂到 Callback 里的正式组件。

你放到 RAG 里看，这层价值会更清楚。

一条典型链路里：

Embedding 负责把文本变成向量
Indexer 负责把文档写成可检索对象
Retriever 负责把 query 变成召回动作
ChatModel 负责基于召回结果生成答案

至于 Rerank，它通常在 Retriever 之后，对候选结果再做一轮重排；这不是 Retriever 本体要解决的事。

所以别把它理解成'搜索函数封装'。

更准确一点说：

Retriever 解决的是'查询如何以统一协议进入检索系统，并把结果以统一协议返回出来'。

2. Retrieve 动作的核心

官方给出的核心接口其实非常短：

type Retriever interface {
	Retrieve(ctx context.Context, query string, opts ...Option) ([]*schema.Document, error)
}

如果只看长度，这接口甚至比 Indexer 还简单。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

type Document struct {
	ID       string
	Content  string
	MetaData map[string]any
}

type Options struct {
	Index          *string
	SubIndex       *string
	TopK           *int
	ScoreThreshold *float64
	Embedding      embedding.Embedder
	DSLInfo        map[string]any
}

Loader / Parser -> Indexer -> Retriever -> ChatModel

原始资料 -> Loader / Parser -> []*schema.Document -> 切块 / 清洗 -> Indexer.Store -> 可检索后端 -> Retriever.Retrieve(query) -> []*schema.Document -> ChatModel

package main

import (
	"context"
	"log"
	"github.com/cloudwego/eino-ext/components/retriever/volc_vikingdb"
)

// ptr 用来快速生成指针字段，便于给 TopK / ScoreThreshold 这类可选配置赋值。
func ptr[T any](v T) *T {
	return &v
}

func main() {
	ctx := context.Background()
	// RetrieverConfig 描述的是'读侧'检索配置：
	// 查询发往哪个集合 / 索引、怎么做向量化、召回多少条、过滤条件是什么。
	cfg := &volc_vikingdb.RetrieverConfig{
		// VikingDB 服务连接信息。
		Host:         "api-vikingdb.volces.com",
		Region:       "cn-beijing",
		AK:           "your-ak",
		SK:           "your-sk",
		Scheme:       "https",
		ConnectionTimeout: 0, // 0 表示使用默认超时策略。
		// 目标检索位置：集合 + 索引。
		Collection: "eino_test",
		Index:      "test_index_1",
		// 查询侧向量化配置：
		// 这里使用内置 embedding 模型 bge-m3，并开启稀疏 + 稠密混合检索。
		EmbeddingConfig: volc_vikingdb.EmbeddingConfig{
			UseBuiltin: true,
			ModelName:  "bge-m3",
			UseSparse:  true,
			DenseWeight: 0.4, // 稠密向量权重；其余权重可理解为给稀疏召回。
		},
		Partition: "",
		// 检索参数：
		// TopK 控制最多召回多少条，ScoreThreshold 控制最低分数阈值。
		TopK:           ptr(10),
		ScoreThreshold: ptr(0.1),
		// 可选过滤条件；这里不加过滤，表示直接查整个索引。
		FilterDSL: nil,
	}
	// 创建 Retriever。此时完成的是'查询入口'初始化，而不是写入逻辑。
	r, err := volc_vikingdb.NewRetriever(ctx, cfg)
	if err != nil {
		log.Fatal(err)
	}
	// 发起一次查询，返回召回到的 Document 列表。
	docs, err := r.Retrieve(ctx, "怎么申请退款")
	if err != nil {
		log.Fatal(err)
	}
	// 输出召回结果的基础信息。
	for _, doc := range docs {
		log.Printf("id=%s metadata=%v content=%s", doc.ID, doc.MetaData, doc.Content)
	}
}

docs, err := retriever.Retrieve(ctx, query, opts...)

chain := compose.NewChain[string, []*schema.Document]()
chain.AppendRetriever(retriever)

graph := compose.NewGraph[string, []*schema.Document]()
graph.AddRetrieverNode("retriever_node", retriever)

handler := &callbacksHelper.RetrieverCallbackHandler{
	OnStart: func(ctx context.Context, info *callbacks.RunInfo, input *retriever.CallbackInput) context.Context {
		log.Printf("query=%s topK=%d", input.Query, input.TopK)
		return ctx
	},
	OnEnd: func(ctx context.Context, info *callbacks.RunInfo, output *retriever.CallbackOutput) context.Context {
		log.Printf("docs=%d", len(output.Docs))
		return ctx
	},
}
helper := callbacksHelper.NewHandlerHelper().Retriever(handler).Handler()
chain := compose.NewChain[string, []*schema.Document]()
chain.AppendRetriever(retriever)
runner, _ := chain.Compile(ctx)
docs, _ := runner.Invoke(ctx, "怎么申请退款", compose.WithCallbacks(helper))
_ = docs

type MyRetriever struct {
	index   string
	topK    int
	embedder embedding.Embedder
}

func (r *MyRetriever) Retrieve(
	ctx context.Context,
	query string,
	opts ...retriever.Option,
) ([]*schema.Document, error) {
	// 合并默认配置和本次调用传入的可选项。
	commonOpts := retriever.GetCommonOptions(&retriever.Options{
		Index:     &r.index,
		TopK:      &r.topK,
		Embedding: r.embedder,
	}, opts...)

	// 从 context 中取出 callback manager，用于统一派发开始 / 结束 / 错误事件。
	cm := callbacks.ManagerFromContext(ctx)
	runInfo := &callbacks.RunInfo{}

	// 检索开始前触发 OnStart，把这次调用的输入信息暴露给 callback 链路。
	ctx = cm.OnStart(ctx, runInfo, &retriever.CallbackInput{
		Query:          query,
		TopK:           *commonOpts.TopK,
		ScoreThreshold: commonOpts.ScoreThreshold,
		Extra: map[string]any{
			"index":     commonOpts.Index,
			"sub_index": commonOpts.SubIndex,
			"dsl":       commonOpts.DSLInfo,
		},
	})

	// 真正执行检索逻辑。
	docs, err := r.doRetrieve(ctx, query, commonOpts)
	if err != nil {
		// 检索失败时触发 OnError，便于日志、trace、监控等统一处理。
		ctx = cm.OnError(ctx, runInfo, err)
		return nil, err
	}

	// 检索成功后触发 OnEnd，把结果交给 callback 链路。
	ctx = cm.OnEnd(ctx, runInfo, &retriever.CallbackOutput{
		Docs: docs,
	})
	return docs, nil
}

func (r *MyRetriever) doRetrieve(
	ctx context.Context,
	query string,
	opts *retriever.Options,
) ([]*schema.Document, error) {
	var queryVector []float64
	// 如果配置了 Embedding，就先把 query 向量化，再交给后端检索。
	if opts.Embedding != nil {
		vectors, err := opts.Embedding.EmbedStrings(ctx, []string{query})
		if err != nil {
			return nil, err
		}
		queryVector = vectors[0]
	}
	_ = queryVector // 这里用静态结果模拟后端召回。
	docs := []*schema.Document{
		{
			ID:      "doc_1",
			Content: "退款申请一般需要先提交订单号和支付凭证。",
			MetaData: map[string]any{
				"score":    0.92,
				"source":   "faq/refund.md",
				"backend":  "my_store",
			},
		},
	}
	return docs, nil
}

Eino 组件核心篇：Retriever 在 RAG 中的检索应用

为什么很多人会用 Retriever，却没真正看懂 Retrieve

1. Retriever 真正解决的，不只是'搜一下'

2. Retrieve 动作的核心

更多推荐文章

相关免费在线工具

3. 不要对公共 Option 理解，局限于几个小参数

3.1 `Index`

3.2 `SubIndex`

3.3 `TopK`

3.4 `ScoreThreshold`

3.5 `Embedding`

3.6 不止公共 option，具体实现还能继续扩展

4. Retriever 的使命，是把查询送进检索系统

5. 用 VikingDB 看一遍最小检索闭环

`Collection`

`Index`

`Partition`

`FilterDSL`

`EmbeddingConfig`

`TopK` 和 `ScoreThreshold`

6. 为什么它能直接进 Chain、Graph 和 Callback

7. 亲手实现一个 Retriever 时，哪些细节不可省

8. 5 个最容易把 Retriever 用浅的坑

8.1 把 `Retriever` 当成 SDK 薄封装

8.2 不看 `MetaData`，后面就追不动来源和分数

8.3 `TopK` 和阈值写死

8.4 查询 embedding 和底库向量配置不匹配

8.5 不接 callback，召回问题很难排

9. 总结

参考资料

更多推荐文章

相关免费在线工具

Eino 组件核心篇：Retriever 在 RAG 中的检索应用

为什么很多人会用 Retriever，却没真正看懂 Retrieve

1. Retriever 真正解决的，不只是'搜一下'

2. Retrieve 动作的核心

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 不要对公共 Option 理解，局限于几个小参数

3.1 Index

3.2 SubIndex

3.3 TopK

3.4 ScoreThreshold

3.5 Embedding

3.6 不止公共 option，具体实现还能继续扩展

4. Retriever 的使命，是把查询送进检索系统

5. 用 VikingDB 看一遍最小检索闭环

Collection

Index

Partition

FilterDSL

EmbeddingConfig

TopK 和 ScoreThreshold

6. 为什么它能直接进 Chain、Graph 和 Callback

7. 亲手实现一个 Retriever 时，哪些细节不可省

8. 5 个最容易把 Retriever 用浅的坑

8.1 把 Retriever 当成 SDK 薄封装

8.2 不看 MetaData，后面就追不动来源和分数

8.3 TopK 和阈值写死

8.4 查询 embedding 和底库向量配置不匹配

8.5 不接 callback，召回问题很难排

9. 总结

参考资料

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.1 `Index`

3.2 `SubIndex`

3.3 `TopK`

3.4 `ScoreThreshold`

3.5 `Embedding`

`Collection`

`Index`

`Partition`

`FilterDSL`

`EmbeddingConfig`

`TopK` 和 `ScoreThreshold`

8.1 把 `Retriever` 当成 SDK 薄封装

8.2 不看 `MetaData`，后面就追不动来源和分数

8.3 `TopK` 和阈值写死