Eino 组件核心：Retriever 在 RAG 中的检索协议与实现

Eino 组件核心：Retriever 在 RAG 中的检索协议与实现 | 极客日志

type Retriever interface {
	Retrieve(ctx context.Context, query string, opts ...Option) ([]*schema.Document, error)
}

type Document struct {
	ID       string
	Content  string
	MetaData map[string]any
}

type Options struct {
	Index          *string
	SubIndex       *string
	TopK           *int
	ScoreThreshold *float64
	Embedding      embedding.Embedder
	DSLInfo        map[string]any
}

Loader / Parser -> Indexer -> Retriever -> ChatModel

原始资料 -> Loader / Parser -> []*schema.Document -> 切块 / 清洗 -> Indexer.Store -> 可检索后端 -> Retriever.Retrieve(query) -> []*schema.Document -> ChatModel

package main

import (
	"context"
	"log"
	"github.com/cloudwego/eino-ext/components/retriever/volc_vikingdb"
)

// ptr 用来快速生成指针字段，便于给 TopK / ScoreThreshold 这类可选配置赋值。
func ptr[T any](v T) *T {
	return &v
}

func main() {
	ctx := context.Background()

	// RetrieverConfig 描述的是'读侧'检索配置：
	// 查询发往哪个集合 / 索引、怎么做向量化、召回多少条、过滤条件是什么。
	cfg := &volc_vikingdb.RetrieverConfig{
		// VikingDB 服务连接信息。
		Host:           "api-vikingdb.volces.com",
		Region:         "cn-beijing",
		AK:             "your-ak",
		SK:             "your-sk",
		Scheme:         "https",
		ConnectionTimeout: 0, // 0 表示使用默认超时策略。

		// 目标检索位置：集合 + 索引。
		Collection: "eino_test",
		Index:      "test_index_1",

		// 查询侧向量化配置：
		// 这里使用内置 embedding 模型 bge-m3，并开启稀疏 + 稠密混合检索。
		EmbeddingConfig: volc_vikingdb.EmbeddingConfig{
			UseBuiltin:  true,
			ModelName:   "bge-m3",
			UseSparse:   true,
			DenseWeight: 0.4, // 稠密向量权重；其余权重可理解为给稀疏召回。
		},

		Partition: "",

		// 检索参数：
		// TopK 控制最多召回多少条，ScoreThreshold 控制最低分数阈值。
		TopK:           ptr(10),
		ScoreThreshold: ptr(0.1),

		// 可选过滤条件；这里不加过滤，表示直接查整个索引。
		FilterDSL: nil,
	}

	// 创建 Retriever。此时完成的是'查询入口'初始化，而不是写入逻辑。
	r, err := volc_vikingdb.NewRetriever(ctx, cfg)
	if err != nil {
		log.Fatal(err)
	}

	// 发起一次查询，返回召回到的 Document 列表。
	docs, err := r.Retrieve(ctx, "怎么申请退款")
	if err != nil {
		log.Fatal(err)
	}

	// 输出召回结果的基础信息。
	for _, doc := range docs {
		log.Printf("id=%s metadata=%v content=%s", doc.ID, doc.MetaData, doc.Content)
	}
}

docs, err := retriever.Retrieve(ctx, query, opts...)

chain := compose.NewChain[string, []*schema.Document]()
chain.AppendRetriever(retriever)

graph := compose.NewGraph[string, []*schema.Document]()
graph.AddRetrieverNode("retriever_node", retriever)

handler := &callbacksHelper.RetrieverCallbackHandler{
	OnStart: func(ctx context.Context, info *callbacks.RunInfo, input *retriever.CallbackInput) context.Context {
		log.Printf("query=%s topK=%d", input.Query, input.TopK)
		return ctx
	},
	OnEnd: func(ctx context.Context, info *callbacks.RunInfo, output *retriever.CallbackOutput) context.Context {
		log.Printf("docs=%d", len(output.Docs))
		return ctx
	},
}
helper := callbacksHelper.NewHandlerHelper().Retriever(handler).Handler()
chain := compose.NewChain[string, []*schema.Document]()
chain.AppendRetriever(retriever)
runner, _ := chain.Compile(ctx)
docs, _ := runner.Invoke(ctx, "怎么申请退款", compose.WithCallbacks(helper))
_ = docs

type MyRetriever struct {
	index   string
	topK    int
	embedder embedding.Embedder
}

func (r *MyRetriever)Retrieve(
	ctx context.Context,
	query string,
	opts ...retriever.Option,
) ([]*schema.Document, error) {
	// 合并默认配置和本次调用传入的可选项。
	commonOpts := retriever.GetCommonOptions(&retriever.Options{
		Index:     &r.index,
		TopK:      &r.topK,
		Embedding: r.embedder,
	}, opts...)

	// 从 context 中取出 callback manager，用于统一派发开始 / 结束 / 错误事件。
	cm := callbacks.ManagerFromContext(ctx)
	runInfo := &callbacks.RunInfo{}

	// 检索开始前触发 OnStart，把这次调用的输入信息暴露给 callback 链路。
	ctx = cm.OnStart(ctx, runInfo, &retriever.CallbackInput{
		Query:          query,
		TopK:           *commonOpts.TopK,
		ScoreThreshold: commonOpts.ScoreThreshold,
		Extra: map[string]any{
			"index":     commonOpts.Index,
			"sub_index": commonOpts.SubIndex,
			"dsl":       commonOpts.DSLInfo,
		},
	})

	// 真正执行检索逻辑。
	docs, err := r.doRetrieve(ctx, query, commonOpts)
	if err != nil {
		// 检索失败时触发 OnError，便于日志、trace、监控等统一处理。
		ctx = cm.OnError(ctx, runInfo, err)
		return nil, err
	}

	// 检索成功后触发 OnEnd，把结果交给 callback 链路。
	ctx = cm.OnEnd(ctx, runInfo, &retriever.CallbackOutput{
		Docs: docs,
	})
	return docs, nil
}

func (r *MyRetriever)doRetrieve(
	ctx context.Context,
	query string,
	opts *retriever.Options,
) ([]*schema.Document, error) {
	var queryVector []float64

	// 如果配置了 Embedding，就先把 query 向量化，再交给后端检索。
	if opts.Embedding != nil {
		vectors, err := opts.Embedding.EmbedStrings(ctx, []string{query})
		if err != nil {
			return nil, err
		}
		queryVector = vectors[0]
	}
	_ = queryVector // 这里用静态结果模拟后端召回。

	docs := []*schema.Document{
		{
			ID:      "doc_1",
			Content: "退款申请一般需要先提交订单号和支付凭证。",
			MetaData: map[string]any{
				"score":   0.92,
				"source":  "faq/refund.md",
				"backend": "my_store",
			},
		},
	}
	return docs, nil
}

Eino 组件核心：Retriever 在 RAG 中的检索协议与实现

为什么很多人会用 Retriever，却没真正看懂 Retrieve

更多推荐文章

相关免费在线工具

1. Retriever 真正解决的，不只是'搜一下'

2. Retrieve 动作的核心

3. 不要对公共 Option 局限于几个小参数

3.1 Index

3.2 SubIndex

3.3 TopK

3.4 ScoreThreshold

3.5 Embedding

3.6 不止公共 option，具体实现还能继续扩展

4. Retriever 的使命，是把查询送进检索系统

5. 用 VikingDB 看一遍最小检索闭环

Collection

Index

Partition

FilterDSL

EmbeddingConfig

TopK 和 ScoreThreshold

6. 为什么它能直接进 Chain、Graph 和 Callback

7. 亲手实现一个 Retriever 时，哪些细节不可省

8. 5 个最容易把 Retriever 用浅的坑

8.1 把 Retriever 当成 SDK 薄封装

8.2 不看 MetaData，后面就追不动来源和分数

8.3 TopK 和阈值写死

8.4 查询 embedding 和底库向量配置不匹配

8.5 不接 callback，召回问题很难排

9. 总结

参考资料

更多推荐文章

相关免费在线工具

Eino 组件核心：Retriever 在 RAG 中的检索协议与实现

为什么很多人会用 Retriever，却没真正看懂 Retrieve

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1. Retriever 真正解决的，不只是'搜一下'

2. Retrieve 动作的核心

3. 不要对公共 Option 局限于几个小参数

3.1 Index

3.2 SubIndex

3.3 TopK

3.4 ScoreThreshold

3.5 Embedding

3.6 不止公共 option，具体实现还能继续扩展

4. Retriever 的使命，是把查询送进检索系统

5. 用 VikingDB 看一遍最小检索闭环

Collection

Index

Partition

FilterDSL

EmbeddingConfig

TopK 和 ScoreThreshold

6. 为什么它能直接进 Chain、Graph 和 Callback

7. 亲手实现一个 Retriever 时，哪些细节不可省

8. 5 个最容易把 Retriever 用浅的坑

8.1 把 Retriever 当成 SDK 薄封装

8.2 不看 MetaData，后面就追不动来源和分数

8.3 TopK 和阈值写死

8.4 查询 embedding 和底库向量配置不匹配

8.5 不接 callback，召回问题很难排

9. 总结

参考资料

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具