Eino Embedding 组件核心解析：文本向量化与语义检索 | 极客日志

Go / GolangAI算法

Eino Embedding 组件核心解析：文本向量化与语义检索

综述由AI生成介绍 Eino 框架中 Embedding 组件的核心功能与应用。Embedding 将文本转换为向量，用于语义相似度计算、搜索及 RAG 知识库问答。文章涵盖基础调用（NewEmbedder, EmbedStrings）、Option 配置、Chain/Graph 编排集成以及 Callback 监控，并详细展示了从知识库切块到向量检索的完整业务流程。

PgDevote发布于 2026/4/6更新于 2026/5/2634 浏览

Embedding 组件说明

说到 embedding 组件，本质上就是把文本变成一串数字向量，让程序能'按语义理解文本'，而不只是按字符串匹配。

你可以把它理解成：

原始文本："今天天气不错"
转成向量后：[0.12, -0.87, 0.44, ...]

这串向量人是看不懂的，因为他是拿个程序看的。机器可以拿它来算'两个文本像不像'。

应用场景

它能做什么？

平时大家会用到的地方最常见就是这几类：

1. 文本相似度计算 比如：

'怎么退款'
'我要申请退钱'

虽然字不一样，但意思接近。Embedding 后，这两句话的向量距离会比较近，所以系统知道它们语义相似。

2. 语义搜索 这也是最常见的用途。比如你有很多文档、知识库、FAQ，用户问：

'怎么修改收货地址'

系统不是只搜关键词'修改''地址'，而是把这个问题也做成向量，然后去找语义最接近的文档片段。这样即使文档里写的是'变更配送地址'，也能搜出来。

3. RAG / 知识库问答 这类项目里 embedding 基本是核心组件之一了。流程通常是：

先把知识库里的文本切块
然后为每个文本块生成 embedding
存到向量库里
用户提问时，也生成一个 embedding
去向量库里找最相关的内容
再把找到的内容喂给大模型回答

也就是说，它是'先找资料'这一步的关键。

4. 文本聚类 / 分类 / 去重 这个是生活中其他方面的应用，非 AI。比如你有很多评论、工单、反馈，可以用 embedding 做：

相似工单归类
重复问题合并
用户反馈主题聚类

它不能直接做什么？

它不是直接拿来生成回答的。它更像一个'文本编码器'或者'语义检索工具'。

也就是：

LLM：负责生成、总结、对话
Embedding：负责把文本映射到语义空间，方便检索、匹配、聚类

总结

这个组件的核心用途就一句话：

把文字转换成可计算的语义特征，方便程序判断哪些文本意思接近。

基础用法

接下来，我先说下基础语法。

EmbedStrings(ctx, texts []string, opts ...Option)([][]float64,error)

意思就是：

输入：多段文本
输出：每段文本对应的一个向量

例如：

texts := []string{"hello", "how are you"}
vectors, err := embedder.EmbedStrings(ctx, texts)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

import (
    "github.com/cloudwego/eino-ext/components/embedding/openai"
)

// 这个导入的包，是兼容 openai 的。如果你要用豆包，可以专门调用 embedding/ark 这个包。
embedder, err := openai.NewEmbedder(ctx, &openai.EmbeddingConfig{
    APIKey: accessKey,
    Model:  "text-embedding-3-large",
    Dimensions: &defaultDim,
    Timeout:  0,
})
if err != nil {
    panic(err)
}

texts := []string{"hello", "how are you"}
vectors, err := embedder.EmbedStrings(ctx, texts)
if err != nil {
    panic(err)
}

package main

import (
    "context"
    "fmt"
    "log"
    "github.com/cloudwego/eino-ext/components/embedding/openai"
)

func main() {
    ctx := context.Background()
    defaultDim := 3072
    accessKey := "your-api-key"
    embedder, err := openai.NewEmbedder(ctx, &openai.EmbeddingConfig{
        APIKey:     accessKey,
        Model:      "text-embedding-3-large",
        Dimensions: &defaultDim,
        Timeout:    0,
    })
    if err != nil {
        log.Fatal(err)
    }
    texts := []string{"退款怎么申请", "如何进行退钱操作", "今天天气不错"}
    vectors, err := embedder.EmbedStrings(ctx, texts)
    if err != nil {
        log.Fatal(err)
    }
    fmt.Println("文本数量:", len(vectors))
    fmt.Println("第一条文本向量维度:", len(vectors[0]))
}

vectors, err := embedder.EmbedStrings(ctx, texts, embedding.WithModel("text-embedding-3-small"))

chain := compose.NewChain[[]string, [][]float64]()
chain.AppendEmbedding(embedder)

graph := compose.NewGraph[[]string, [][]float64]()
graph.AddEmbeddingNode("embedding_node", embedder)

handler := &callbacksHelper.EmbeddingCallbackHandler{
    OnStart: func(ctx context.Context, runInfo *callbacks.RunInfo, input *embedding.CallbackInput) context.Context {
        log.Printf("开始 embedding，文本数：%d, 内容：%v\n", len(input.Texts), input.Texts)
        return ctx
    },
    OnEnd: func(ctx context.Context, runInfo *callbacks.RunInfo, output *embedding.CallbackOutput) context.Context {
        log.Printf("embedding 完成，生成向量数：%d\n", len(output.Embeddings))
        return ctx
    },
}

callbackHandler := callbacksHelper.NewHandlerHelper().Embedding(handler).Handler()
runnable, _ := chain.Compile(ctx)
vectors, err := runnable.Invoke(ctx, []string{"hello", "how are you"}, compose.WithCallbacks(callbackHandler))

chunks := []string{"退款申请需要在订单完成后 7 天内提交", "修改收货地址请在发货前联系人工客服", "发票可在订单详情页申请"}

chunkVectors, err := embedder.EmbedStrings(ctx, chunks)

query := []string{"订单下完以后地址还能改吗"}
queryVector, err := embedder.EmbedStrings(ctx, query)

Eino Embedding 组件核心解析：文本向量化与语义检索

Embedding 组件说明

应用场景

它能做什么？

它不能直接做什么？

总结

基础用法

更多推荐文章

相关免费在线工具

进阶用法

一、最基本用法：直接调用 `EmbedStrings`

1. 创建 embedder

2. 调用 `EmbedStrings`

3. 向量拿来干嘛

二、完整 demo

三、带 Option 怎么用

四、在编排中怎么用

在 Chain 中使用

在 Graph 中使用

五、带 Callback 怎么用

六、真实场景

场景：做知识库问答

第一步：把知识库切块

第二步：给每个 chunk 生成向量

第三步：存起来

第四步：用户提问时，也生成向量

第五步：拿 query 的向量去检索最相近的 chunk

第六步：把召回结果交给大模型回答

语法总结

最小步骤

常见增强

更多推荐文章

相关免费在线工具

Eino Embedding 组件核心解析：文本向量化与语义检索

Embedding 组件说明

应用场景

它能做什么？

它不能直接做什么？

总结

基础用法

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

进阶用法

一、最基本用法：直接调用 EmbedStrings

1. 创建 embedder

2. 调用 EmbedStrings

3. 向量拿来干嘛

二、完整 demo

三、带 Option 怎么用

四、在编排中怎么用

在 Chain 中使用

在 Graph 中使用

五、带 Callback 怎么用

六、真实场景

场景：做知识库问答

第一步：把知识库切块

第二步：给每个 chunk 生成向量

第三步：存起来

第四步：用户提问时，也生成向量

第五步：拿 query 的向量去检索最相近的 chunk

第六步：把召回结果交给大模型回答

语法总结

最小步骤

常见增强

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

一、最基本用法：直接调用 `EmbedStrings`

2. 调用 `EmbedStrings`