Eino Embedding 组件详解：从文本向量化到 RAG 应用 | 极客日志

Go / GolangAI算法

Eino Embedding 组件详解：从文本向量化到 RAG 应用

综述由AI生成Embedding 是将文本转换为向量表示的技术，使程序能按语义理解文本而非仅做字符串匹配。 Eino 框架中 Embedding 组件的核心用法，包括初始化 embedder、调用 EmbedStrings 生成向量、通过 Option 动态调整参数、结合 Chain 与 Graph 进行编排以及使用 Callback 监控流程。重点阐述了其在 RAG 知识库问答中的实际应用，涵盖文本切块、向量生成、存储检索及最终由大模型回答的完整链路。掌握 Embedding 不仅是学会调用接口，更是构建语义检索与智能问答系统的基础。

lzdxwyh发布于 2026/4/11更新于 2026/5/2524 浏览

Embedding 组件详解

说到 Embedding，本质上就是把文本变成一串数字向量，让程序能'按语义理解文本'，而不只是按字符串匹配。

你可以把它理解成：

原始文本："今天天气不错"
转成向量后：[0.12, -0.87, 0.44, ...]

这串向量人看不太懂，但机器可以拿它来算'两个文本像不像'。

它能做什么？

平时大家会用到的地方，最常见就是这几类：

1. 文本相似度计算 比如：

'怎么退款'
'我要申请退钱'

虽然字不一样，但意思接近。Embedding 后，这两句话的向量距离会比较近，系统就知道它们语义相似。

2. 语义搜索 这也是最常见的用途。比如你有很多文档、知识库、FAQ，用户问：

'怎么修改收货地址'

系统不是只搜关键词'修改''地址'，而是把这个问题也做成向量，然后去找语义最接近的文档片段。这样即使文档里写的是'变更配送地址'，也能搜出来。

3. RAG / 知识库问答 这类项目里 Embedding 基本是核心组件之一了。流程通常是：

先把知识库里的文本切块
然后为每个文本块生成 embedding
存到向量库里
用户提问时，也生成一个 embedding
去向量库里找最相关的内容
再把找到的内容喂给大模型回答

也就是说，它是'先找资料'这一步的关键。

4. 文本聚类 / 分类 / 去重 比如你有很多评论、工单、反馈，可以用 embedding 做：

相似工单归类
重复问题合并
用户反馈主题聚类

它不能直接干嘛？

它不是直接拿来生成回答的。它更像一个'文本编码器'或者'语义检索工具'。

也就是：

LLM：负责生成、总结、对话
Embedding：负责把文本映射到语义空间，方便检索、匹配、聚类

基础用法

接下来，我先说下基础语法。

EmbedStrings(ctx, texts []string, opts ...Option)([][]float64, error)

意思就是：

输入：多段文本
输出：每段文本对应的一个向量

例如：

texts := []string{"hello", "how are you"}
vectors, err := embedder.EmbedStrings(ctx, texts)

返回的 vectors 就是两段文本的向量表示。后面你可以拿这些向量去做相似度比较、存入向量数据库、召回相关知识片段或聚类分析。

实战用法

它的使用可以分成两层来看：一是直接给几段文本生成向量，二是配合检索、向量库、RAG 一起用。我直接教你上手怎么写。

一、最基本用法：直接调用

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

EmbedStrings

import (
    "github.com/cloudwego/eino-ext/components/embedding/openai"
)

// 这个导入的包，是兼容 openai 的。如果你要用豆包，可以专门调用 embedding/ark 这个包。
embedder, err := openai.NewEmbedder(ctx, &openai.EmbeddingConfig{
    APIKey:   accessKey,
    Model:    "text-embedding-3-large",
    Dimensions: &defaultDim,
    Timeout:  0,
})
if err != nil {
    panic(err)
}

texts := []string{"hello", "how are you"}
vectors, err := embedder.EmbedStrings(ctx, texts)
if err != nil {
    panic(err)
}

package main

import (
    "context"
    "fmt"
    "log"

    "github.com/cloudwego/eino-ext/components/embedding/openai"
)

func main() {
    ctx := context.Background()
    defaultDim := 3072
    accessKey := "your-api-key"

    embedder, err := openai.NewEmbedder(ctx, &openai.EmbeddingConfig{
        APIKey:     accessKey,
        Model:      "text-embedding-3-large",
        Dimensions: &defaultDim,
        Timeout:    0,
    })
    if err != nil {
        log.Fatal(err)
    }

    texts := []string{"退款怎么申请", "如何进行退钱操作", "今天天气不错"}
    vectors, err := embedder.EmbedStrings(ctx, texts)
    if err != nil {
        log.Fatal(err)
    }

    fmt.Println("文本数量:", len(vectors))
    fmt.Println("第一条文本向量维度:", len(vectors[0]))
}

vectors, err := embedder.EmbedStrings(ctx, texts, embedding.WithModel("text-embedding-3-small"))

chain := compose.NewChain[[]string, [][]float64]()
chain.AppendEmbedding(embedder)

graph := compose.NewGraph[[]string, [][]float64]()
graph.AddEmbeddingNode("embedding_node", embedder)

handler := &callbacksHelper.EmbeddingCallbackHandler{
    OnStart: func(ctx context.Context, runInfo *callbacks.RunInfo, input *embedding.CallbackInput) context.Context {
        log.Printf("开始 embedding，文本数：%d, 内容：%v\n", len(input.Texts), input.Texts)
        return ctx
    },
    OnEnd: func(ctx context.Context, runInfo *callbacks.RunInfo, output *embedding.CallbackOutput) context.Context {
        log.Printf("embedding 完成，生成向量数：%d\n", len(output.Embeddings))
        return ctx
    },
}

callbackHandler := callbacksHelper.NewHandlerHelper().Embedding(handler).Handler()
runnable, _ := chain.Compile(ctx)
vectors, err := runnable.Invoke(ctx, []string{"hello", "how are you"}, compose.WithCallbacks(callbackHandler))

chunks := []string{
    "退款申请需要在订单完成后 7 天内提交",
    "修改收货地址请在发货前联系人工客服",
    "发票可在订单详情页申请",
}

chunkVectors, err := embedder.EmbedStrings(ctx, chunks)

query := []string{"订单下完以后地址还能改吗"}
queryVector, err := embedder.EmbedStrings(ctx, query)

package main

import (
    "context"
    "fmt"
    "log"

    "github.com/cloudwego/eino/components/embedding"
    embeddingOpenAI "github.com/cloudwego/eino-ext/components/embedding/openai"
)

func main() {
    ctx := context.Background()
    defaultDim := 3072 // 通常是定死的
    accessKey := "your-api-key"

    embedder, err := embeddingOpenAI.NewEmbedder(ctx, &embeddingOpenAI.EmbeddingConfig{
        APIKey:     accessKey,
        Model:      "text-embedding-3-large",
        Dimensions: &defaultDim,
        Timeout:    0,
    })
    if err != nil {
        log.Fatal(err)
    }

    texts := []string{"退款怎么申请", "如何退钱", "修改收货地址的方法"}
    vectors, err := embedder.EmbedStrings(
        ctx, texts,
        embedding.WithModel("text-embedding-3-small"),
    )
    if err != nil {
        log.Fatal(err)
    }

    fmt.Printf("生成了 %d 个向量\n", len(vectors))
    fmt.Printf("每个向量维度：%d\n", len(vectors[0]))
}

Eino Embedding 组件详解：从文本向量化到 RAG 应用

Embedding 组件详解

它能做什么？

它不能直接干嘛？

基础用法

实战用法

一、最基本用法：直接调用

更多推荐文章

相关免费在线工具

1. 创建 embedder

2. 调用 `EmbedStrings`

3. 向量拿来干嘛

二、完整 demo

三、带 Option 怎么用

四、在编排中怎么用

在 Chain 中使用

在 Graph 中使用

五、带 Callback 怎么用

六、真实场景

场景：做知识库问答

七、语法总结

最小步骤

常见增强

八、模板总结

九、尾声

更多推荐文章

相关免费在线工具

Eino Embedding 组件详解：从文本向量化到 RAG 应用

Embedding 组件详解

它能做什么？

它不能直接干嘛？

基础用法

实战用法

一、最基本用法：直接调用

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1. 创建 embedder

2. 调用 EmbedStrings

3. 向量拿来干嘛

二、完整 demo

三、带 Option 怎么用

四、在编排中怎么用

在 Chain 中使用

在 Graph 中使用

五、带 Callback 怎么用

六、真实场景

场景：做知识库问答

七、语法总结

最小步骤

常见增强

八、模板总结

九、尾声

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 调用 `EmbedStrings`