Eino Embedding 组件核心解析：实现文本语义向量化 | 极客日志

Go / GolangAI算法

Eino Embedding 组件核心解析：实现文本语义向量化

Embedding 组件将文本转换为向量，使程序能理解语义而非仅进行字符串匹配。主要用于文本相似度计算、语义搜索及 RAG 知识库问答。使用流程包括初始化 Embedder、调用 EmbedStrings 生成向量，并可将结果存入向量库进行检索。支持在 Chain 或 Graph 中编排，配合 Option 和 Callback 增强功能。

栈溢出发布于 2026/4/6更新于 2026/7/948 浏览

Embedding 使用说明

核心用途

Embedding 组件本质上就是把文本变成一串数字向量，让程序能'按语义理解文本'，而不只是按字符串匹配。

你可以把它理解成：

原始文本："今天天气不错"
转成向量后：[0.12, -0.87, 0.44, ...]

这串向量人是看不懂的，因为他是拿个程序看的。
机器可以拿它来算'两个文本像不像'。

他能干嘛？

平时大家会用到的地方最常见就是这几类：

1. 文本相似度计算
比如：

'怎么退款'
'我要申请退钱'

虽然字不一样，但意思接近。
Embedding 后，这两句话的向量距离会比较近，所以系统知道它们语义相似。

2. 语义搜索
这也是最常见的用途。
比如你有很多文档、知识库、FAQ，用户问：

'怎么修改收货地址'

系统不是只搜关键词'修改''地址'，而是把这个问题也做成向量，然后去找语义最接近的文档片段。
这样即使文档里写的是'变更配送地址'，也能搜出来。

3. RAG / 知识库问答
这类项目里 embedding 基本是核心组件之一了。流程通常是：

先把知识库里的文本切块
然后为每个文本块生成 embedding
存到向量库里
用户提问时，也生成一个 embedding
去向量库里找最相关的内容
再把找到的内容喂给大模型回答

也就是说，它是'先找资料'这一步的关键。

4. 文本聚类 / 分类 / 去重
这个是生活中其他方面的应用，非 AI
比如你有很多评论、工单、反馈，可以用 embedding 做：

相似工单归类
重复问题合并
用户反馈主题聚类

它不能直接干嘛？

它不是直接拿来生成回答的。
它更像一个'文本编码器'或者'语义检索工具'。

也就是：

LLM：负责生成、总结、对话
Embedding：负责把文本映射到语义空间，方便检索、匹配、聚类

总结：

这个组件的核心用途就一句话：

把文字转换成可计算的语义特征，方便程序判断哪些文本意思接近。

基础用法

接下来，我先说下基础语法。

EmbedStrings(ctx, texts []string, opts ...Option)([][]float64,error)

意思就是：

输入：多段文本
输出：每段文本对应的一个向量

例如：

texts := []string{"hello", }
vectors, err := embedder.EmbedStrings(ctx, texts)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

import (
	"github.com/cloudwego/eino-ext/components/embedding/openai"
)

// 这个导入的包，是兼容 openai 的。
// 如果你要用豆包，可以专门调用 embedding/ark 这个包。
embedder, err := openai.NewEmbedder(ctx, &openai.EmbeddingConfig{
	APIKey:   accessKey,
	Model:    "text-embedding-3-large",
	Dimensions: &defaultDim,
	Timeout:  0,
})
if err != nil {
	panic(err)
}

texts := []string{"hello", "how are you"}
vectors, err := embedder.EmbedStrings(ctx, texts)
if err != nil {
	panic(err)
}

package main

import (
	"context"
	"fmt"
	"log"
	"github.com/cloudwego/eino-ext/components/embedding/openai"
)

func main() {
	ctx := context.Background()
	defaultDim := 3072
	accessKey := "your-api-key"
	embedder, err := openai.NewEmbedder(ctx, &openai.EmbeddingConfig{
		APIKey:   accessKey,
		Model:    "text-embedding-3-large",
		Dimensions: &defaultDim,
		Timeout:  0,
	})
	if err != nil {
		log.Fatal(err)
	}
	texts := []string{"退款怎么申请", "如何进行退钱操作", "今天天气不错"}
	vectors, err := embedder.EmbedStrings(ctx, texts)
	if err != nil {
		log.Fatal(err)
	}
	fmt.Println("文本数量:", len(vectors))
	fmt.Println("第一条文本向量维度:", len(vectors[0]))
}

vectors, err := embedder.EmbedStrings(ctx, texts, embedding.WithModel("text-embedding-3-small"))

chain := compose.NewChain[[]string, [][]float64]()
chain.AppendEmbedding(embedder)

graph := compose.NewGraph[[]string, [][]float64]()
graph.AddEmbeddingNode("embedding_node", embedder)

handler := &callbacksHelper.EmbeddingCallbackHandler{
	OnStart: func(ctx context.Context, runInfo *callbacks.RunInfo, input *embedding.CallbackInput) context.Context {
		log.Printf("开始 embedding，文本数：%d, 内容：%v\n", len(input.Texts), input.Texts)
		return ctx
	},
	OnEnd: func(ctx context.Context, runInfo *callbacks.RunInfo, output *embedding.CallbackOutput) context.Context {
		log.Printf("embedding 完成，生成向量数：%d\n", len(output.Embeddings))
		return ctx
	},
}

callbackHandler := callbacksHelper.NewHandlerHelper().Embedding(handler).Handler()
runnable, _ := chain.Compile(ctx)
vectors, err := runnable.Invoke(ctx, []string{"hello", "how are you"}, compose.WithCallbacks(callbackHandler))

chunks := []string{"退款申请需要在订单完成后 7 天内提交", "修改收货地址请在发货前联系人工客服", "发票可在订单详情页申请"}

chunkVectors, err := embedder.EmbedStrings(ctx, chunks)

query := []string{"订单下完以后地址还能改吗"}
queryVector, err := embedder.EmbedStrings(ctx, query)

package main

import (
	"context"
	"fmt"
	"log"
	"github.com/cloudwego/eino/components/embedding"
	embeddingOpenAI "github.com/cloudwego/eino-ext/components/embedding/openai"
)

func main() {
	ctx := context.Background()
	defaultDim := 3072 // 通常是定死的
	accessKey := "your-api-key"
	embedder, err := embeddingOpenAI.NewEmbedder(ctx, &embeddingOpenAI.EmbeddingConfig{
		APIKey:   accessKey,
		Model:    "text-embedding-3-large",
		Dimensions: &defaultDim,
		Timeout:  0,
	})
	if err != nil {
		log.Fatal(err)
	}
	texts := []string{"退款怎么申请", "如何退钱", "修改收货地址的方法"}
	vectors, err := embedder.EmbedStrings(
		ctx,
		texts,
		embedding.WithModel("text-embedding-3-small"),
	)
	if err != nil {
		log.Fatal(err)
	}
	fmt.Printf("生成了 %d 个向量\n", len(vectors))
	fmt.Printf("每个向量维度：%d\n", len(vectors[0]))
}

Eino Embedding 组件核心解析：实现文本语义向量化

Embedding 使用说明

核心用途

他能干嘛？

它不能直接干嘛？

总结：

基础用法

更多推荐文章

相关免费在线工具

进阶用法

1. 直接调用 EmbedStrings

1. 创建 Embedder

2. 调用 EmbedStrings

3. 向量拿来干嘛

2. 完整 Demo

3. 带 Option 怎么用

4. 在编排中怎么用

在 Chain 中使用

在 Graph 中使用

5. 带 Callback 怎么用

6. 真实场景

场景：做知识库问答

第一步：把知识库切块

第二步：给每个 chunk 生成向量

第三步：存起来

第四步：用户提问时，也生成向量

第五步：拿 query 的向量去检索最相近的 chunk

第六步：把召回结果交给大模型回答

7. 语法总结

最小步骤

常见增强

8. 模板总结

总结

更多推荐文章

相关免费在线工具

Eino Embedding 组件核心解析：实现文本语义向量化

Embedding 使用说明

核心用途

他能干嘛？

它不能直接干嘛？

总结：

基础用法

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

进阶用法

1. 直接调用 EmbedStrings

1. 创建 Embedder

2. 调用 EmbedStrings

3. 向量拿来干嘛

2. 完整 Demo

3. 带 Option 怎么用

4. 在编排中怎么用

在 Chain 中使用

在 Graph 中使用

5. 带 Callback 怎么用

6. 真实场景

场景：做知识库问答

第一步：把知识库切块

第二步：给每个 chunk 生成向量

第三步：存起来

第四步：用户提问时，也生成向量

第五步：拿 query 的向量去检索最相近的 chunk

第六步：把召回结果交给大模型回答

7. 语法总结

最小步骤

常见增强

8. 模板总结

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具