AI大模型落地系列:一文读懂 Eino 的 Embedding

AI大模型落地系列:一文读懂 Eino 的 Embedding

Embedding 使用说明

说到 embedding 组件,本质上就是把文本变成一串数字向量,让程序能“按语义理解文本”,而不只是按字符串匹配。

你可以把它理解成:

  • 原始文本:"今天天气不错"
  • 转成向量后:[0.12, -0.87, 0.44, ...]

这串向量人是看不懂的,因为他是拿个程序看的。
机器可以拿它来算“两个文本像不像”。

有啥用?!

他能干嘛?

平时大家会用到的地方

最常见就是这几类:

1. 文本相似度计算
比如:

  • “怎么退款”
  • “我要申请退钱”

虽然字不一样,但意思接近。
Embedding 后,这两句话的向量距离会比较近,所以系统知道它们语义相似。
这个我在之前的博客<ai基础知识>中提到过

2. 语义搜索
这也是最常见的用途。
比如你有很多文档、知识库、FAQ,用户问:

  • “怎么修改收货地址”

系统不是只搜关键词“修改”“地址”,而是把这个问题也做成向量,然后去找语义最接近的文档片段。
这样即使文档里写的是“变更配送地址”,也能搜出来。

3. RAG / 知识库问答
这类项目里 embedding 基本是核心组件之一了。流程通常是:

  • 先把知识库里的文本切块
  • 然后为每个文本块生成 embedding
  • 存到向量库里
  • 用户提问时,也生成一个 embedding
  • 去向量库里找最相关的内容
  • 再把找到的内容喂给大模型回答

也就是说,它是“先找资料”这一步的关键。

4. 文本聚类 / 分类 / 去重
这个是生活中其他方面的应用,非AI
比如你有很多评论、工单、反馈,可以用 embedding 做:

  • 相似工单归类
  • 重复问题合并
  • 用户反馈主题聚类

它不能直接干嘛?

不是直接拿来生成回答的
它更像一个“文本编码器”或者“语义检索工具”。

也就是:

  • LLM:负责生成、总结、对话
  • Embedding:负责把文本映射到语义空间,方便检索、匹配、聚类

总结:

这个组件的核心用途就一句话:

把文字转换成可计算的语义特征,方便程序判断哪些文本意思接近。

浅用之法

接下来,我先说下基础语法。

EmbedStrings(ctx, texts []string, opts ...Option)([][]float64,error)

意思就是:

  • 输入:多段文本
  • 输出:每段文本对应的一个向量

例如:

texts :=[]string{"hello","how are you",} vectors, err := embedder.EmbedStrings(ctx, texts)

返回的 vectors 就是两段文本的向量表示。
后面你可以拿这些向量去做:

  • 相似度比较
  • 存入向量数据库
  • 召回相关知识片段
  • 聚类分析

食用之法

它的使用可以分成两层来看:

  1. 最直接的用法:给几段文本生成向量也就是我在浅用之法中提到的
  2. 真正落地的用法:配合检索 / 向量库 / RAG 一起用

我直接教你 “你上手怎么写”。


一、最基本用法:直接调用 EmbedStrings

本质核心就这几步:

1. 创建 embedder
import"github.com/cloudwego/eino-ext/components/embedding/openai"// 这个导入的包,是兼容openai的。// 如果你要用豆包,可以专门调用embedding/ark 这个包。 embedder, err := openai.NewEmbedder(ctx,&openai.EmbeddingConfig{ APIKey: accessKey, Model:"text-embedding-3-large", Dimensions:&defaultDim, Timeout:0,})if err !=nil{panic(err)}

这里的作用是初始化一个“文本转向量”的对象。

几个关键参数:

  • APIKey:调用模型服务的密钥
  • Model:选哪个 embedding 模型
  • Dimensions:向量维度
  • Timeout:超时时间

2. 调用 EmbedStrings
texts :=[]string{"hello","how are you",} vectors, err := embedder.EmbedStrings(ctx, texts)if err !=nil{panic(err)}

这一步做完后:

  • texts[0] 对应 vectors[0]
  • texts[1] 对应 vectors[1]

也就是说,输入几段文本,输出几组向量。


3. 向量拿来干嘛

生成出来的 vectors 一般不会直接打印给用户看,而是继续做下面这些事:

  • 存到向量数据库
  • 跟别的向量算相似度
  • 做召回
  • 做聚类
  • 做去重

二、完整demo

你可以把它理解成一个普通组件,哪里需要文本转向量,哪里调用。

例如:

package main import("context""fmt""log""github.com/cloudwego/eino-ext/components/embedding/openai")funcmain(){ ctx := context.Background() defaultDim :=3072 accessKey :="your-api-key" embedder, err := openai.NewEmbedder(ctx,&openai.EmbeddingConfig{ APIKey: accessKey, Model:"text-embedding-3-large", Dimensions:&defaultDim, Timeout:0,})if err !=nil{ log.Fatal(err)} texts :=[]string{"退款怎么申请","如何进行退钱操作","今天天气不错",} vectors, err := embedder.EmbedStrings(ctx, texts)if err !=nil{ log.Fatal(err)} fmt.Println("文本数量:",len(vectors)) fmt.Println("第一条文本向量维度:",len(vectors[0]))}

这就是最标准的“用”了!


三、带 Option 怎么用

公共 option 其实也挺有用的,比如 WithModel

这表示你在调用时,可以临时覆盖模型参数。

vectors, err := embedder.EmbedStrings(ctx, texts, embedding.WithModel("text-embedding-3-small"),)

大致意思就是:

  • embedder 初始化时有一个默认模型
  • 这次调用时,临时改成另一个模型

这个适合:

  • 平时默认用大模型
  • 某些场景为了省钱/提速,改用小模型

但是我在此,不得点明一下,虽然向量在不同模型之前还是有一定的兼容,但是尽量不切换,就不要切换,影响效果


四、在编排中怎么用

如果你不是手动一行一行写,而是用 Eino 的 ChainGraph,就可以把 embedding 当成节点塞进去。

在 Chain 中使用

初次接触chain的话,你可以将其当成一条流水线

chain := compose.NewChain[[]string,[][]float64]() chain.AppendEmbedding(embedder)

意思是:

  • 输入:[]string
  • 输出:[][]float64

也就是整条链专门做“文本 -> 向量”。


在 Graph 中使用
graph := compose.NewGraph[[]string,[][]float64]() graph.AddEmbeddingNode("embedding_node", embedder)

意思是把 embedding 作为图里的一个节点,后面可以接别的节点一起跑。


五、带 Callback 怎么用

这个一般用于:

  • 记录日志
  • 统计 token
  • 监控调用过程
  • 调试输入输出

Callback有点像 给整个链路,外挂了一层“生命周期 中间件 / 钩子机制"

通常是:定义 handler,然后通过 compose.WithCallbacks 传进去。

例如:

handler :=&callbacksHelper.EmbeddingCallbackHandler{ OnStart:func(ctx context.Context, runInfo *callbacks.RunInfo, input *embedding.CallbackInput) context.Context { log.Printf("开始 embedding,文本数: %d, 内容: %v\n",len(input.Texts), input.Texts)return ctx }, OnEnd:func(ctx context.Context, runInfo *callbacks.RunInfo, output *embedding.CallbackOutput) context.Context { log.Printf("embedding 完成,生成向量数: %d\n",len(output.Embeddings))return ctx },}

然后运行时:

callbackHandler := callbacksHelper.NewHandlerHelper().Embedding(handler).Handler() runnable,_:= chain.Compile(ctx) vectors, err := runnable.Invoke(ctx,[]string{"hello","how are you"}, compose.WithCallbacks(callbackHandler),)

这样你就能看到:

  • 输入了什么
  • 什么时候开始
  • 什么时候结束
  • 输出了多少向量
  • token 消耗多少

六、真实场景

真正业务里,embedding 很少是“调一下就结束”,
我拿知识库问答,给大家描绘一下整体流程。

场景:做知识库问答
第一步:把知识库切块

比如一篇文档切成很多段:

chunks :=[]string{"退款申请需要在订单完成后7天内提交","修改收货地址请在发货前联系人工客服","发票可在订单详情页申请",}
第二步:给每个 chunk 生成向量
chunkVectors, err := embedder.EmbedStrings(ctx, chunks)
第三步:存起来

通常会存到向量数据库里,同时保存原文:

  • 文本内容
  • 对应向量
  • 文档来源
  • chunk id
第四步:用户提问时,也生成向量
query :=[]string{"订单下完以后地址还能改吗"} queryVector, err := embedder.EmbedStrings(ctx, query)
第五步:拿 query 的向量去检索最相近的 chunk

找出最相似的几段知识。

第六步:把召回结果交给大模型回答

这才变成完整的 RAG。


七、语法总结

最小步骤
  1. 初始化 embedder
  2. EmbedStrings
  3. 拿到 [][]float64
常见增强
  1. Option 临时覆盖参数
  2. Callback 打日志和监控
  3. 放进 Chain / Graph 编排

八、模板总结

package main import("context""fmt""log""github.com/cloudwego/eino/components/embedding" embeddingOpenAI "github.com/cloudwego/eino-ext/components/embedding/openai")funcmain(){ ctx := context.Background() defaultDim :=3072// 通常是定死的 accessKey :="your-api-key" embedder, err := embeddingOpenAI.NewEmbedder(ctx,&embeddingOpenAI.EmbeddingConfig{ APIKey: accessKey, Model:"text-embedding-3-large", Dimensions:&defaultDim, Timeout:0,})if err !=nil{ log.Fatal(err)} texts :=[]string{"退款怎么申请","如何退钱","修改收货地址的方法",} vectors, err := embedder.EmbedStrings( ctx, texts, embedding.WithModel("text-embedding-3-small"),)if err !=nil{ log.Fatal(err)} fmt.Printf("生成了 %d 个向量\n",len(vectors)) fmt.Printf("每个向量维度: %d\n",len(vectors[0]))}

九、尾声

大家可以把它记成:

Embedding 的“用法”就是:先把文本喂进去生成向量,再把这个向量用于检索、匹配、聚类等后续处理。

相信大家看到这里,应该也明白了:
“会调用 embedding”“会用 embedding 做业务” 是两回事。

前者很简单,就是:

  • NewEmbedder
  • EmbedStrings

后者才是完整链路,比如:

  • 文本切块
  • 向量生成
  • 向量存储
  • 相似检索
  • 大模型回答

1、OpenAI开发者(向量嵌入)
2、官方文档 CloudWeGo(Embedding 使用说明)

Read more

Java WebFlux技术在百度地图深度检索集成中的实践应用

Java WebFlux技术在百度地图深度检索集成中的实践应用

目录 前言 一、WebFlux技术简介 1、WebFlux是什么 2、WebFlux有哪些组件 3、WebFlux的使用场景 二、WebFlux集成百度深度检索 1、Maven资源引入 2、业务层实现 3、控制层实现 4、程序启动 三、成果输出及对比 1、百度深度检索输出 2、DeepSeek检索输出 3、Kimi检索输出 四、总结 前言         随着地理信息技术的飞速发展以及移动互联网的普及,地图服务已成为人们日常生活中不可或缺的一部分。从出行导航到位置查询,从周边设施搜索到地理信息分析,地图服务的应用场景日益丰富。百度地图凭借其庞大的地理数据资源、精准的定位技术和强大的检索功能,为用户提供了全方位的地理信息服务。然而,对于众多企业和开发者而言,如何将百度地图的深度检索能力与自身业务系统或应用进行高效集成,以满足用户对地理信息检索的个性化需求,是一个极具挑战性且意义重大的课题。在之前的博文中,我们对百度地图的深度检索服务进行了详细的介绍,对如何使用DeepSeek和地图的结合进行了很好的实践,智绘未来:当 DeepSeek

By Ne0inhk
基于飞算JavaAI的在线图书借阅平台设计与实现

基于飞算JavaAI的在线图书借阅平台设计与实现

引言 在数字化转型背景下,高校图书管理系统面临智能化升级需求。本文以飞算JavaAI为开发工具,通过智能引导式开发流程,实现一个包含用户管理、图书借阅、权限控制等核心功能的在线平台。系统采用Spring Boot + MyBatis技术栈,结合飞算AI的代码生成能力,将传统3周的开发周期压缩至3天,验证了AI辅助开发在Java企业级应用中的高效性。 文章目录 * 引言 * 飞算介绍 * 环境准备 * 1. 下载“IDEA” * 2.安装 * 3. 下载“飞算Java AI”扩展 * 4.登录 * 需求分析与规划 * 核心功能模块 * 技术选型 * 系统实现 * 1. 自然语言描述需求 * 2. 理解需求 * 3. 设计接口 * 4. 表结构设计 * 5. 处理逻辑接口 * 6. 生成源码 * 优化与调试心得 * 遇到的问题 * 调试技巧 * 成果展示与总结

By Ne0inhk
【从0开始学习Java | 第23篇】动态代理

【从0开始学习Java | 第23篇】动态代理

文章目录 * Java动态代理概述 * 一、动态代理的核心概念 * 形象解释 * 二、两种主流动态代理实现 * 1. JDK动态代理(基于接口) * 原理 * 示例代码 * 优缺点 * 2. CGLIB动态代理(基于子类) * 原理 * 示例代码(需引入CGLIB依赖) * 优缺点 * 三、JDK与CGLIB动态代理对比 * 四、实际应用场景 * 五、总结 Java动态代理概述 在Java开发中,代理模式设计模式之一,而动态代理作为代理模式的进阶形式,在框架开发(如Spring AOP)、日志记录、权限控制等场景中发挥着关键作用。本文将从核心概念出发,拆解两种主流动态代理的实现逻辑,并分析其适用场景。 一、动态代理的核心概念 动态代理指在程序运行时,通过反射机制动态生成代理类,而非在编译期预先定义。其核心价值在于:无需为每个目标类手动编写代理类,即可统一为多个目标类添加横切逻辑(如日志、事务、异常处理),降低代码耦合度。

By Ne0inhk
基于Java+SpringBoot+SSM音乐分享与交流平台(源码+LW+调试文档+讲解等)/音乐交流社区/音乐分享网站/音乐互动平台/音乐共享与沟通平台/音乐交流论坛

基于Java+SpringBoot+SSM音乐分享与交流平台(源码+LW+调试文档+讲解等)/音乐交流社区/音乐分享网站/音乐互动平台/音乐共享与沟通平台/音乐交流论坛

博主介绍 💗博主介绍:✌全栈领域优质创作者,专注于Java、小程序、Python技术领域和计算机毕业项目实战✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 2025-2026年最新1000个热门Java毕业设计选题大全✅ 2025-2026年最新500个热门微信小程序毕业设计选题大全✅ Java毕业设计最新1000套项目精品实战案例 微信小程序毕业设计最新500套项目精品案例 🌟文末获取源码+数据库🌟 感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人 本文项目技术选型介绍 前端:Spring+SpringMVC+Mybatis 后端:SpringBoot+Mybatis 数据库:MySQL、SQLServer 开发工具:IDEA、Eclipse、Navicat等 ✌关于毕设项目技术实现问题讲解也可以给我留言咨询!!! 详细视频演示 请联系博主获取更详细的演示视频-源码编号4473 具体实现截图 框架介绍 前端技术介绍 SSM 框架的整合使用,为程序设计带来了诸多优势。在开发过程中,Spring

By Ne0inhk