基于 Rokid 灵珠平台构建 AI Glasses 作业辅导助手
介绍利用灵珠智能体平台,结合知识库与工作流,开发运行于 AI Glasses 上的作业辅导应用。方案涵盖视觉识别、知识点检索及引导式讲解逻辑,通过多模态大模型实现“看题即问”的交互体验,旨在缓解家长辅导压力并提升学生学习专注度。

介绍利用灵珠智能体平台,结合知识库与工作流,开发运行于 AI Glasses 上的作业辅导应用。方案涵盖视觉识别、知识点检索及引导式讲解逻辑,通过多模态大模型实现“看题即问”的交互体验,旨在缓解家长辅导压力并提升学生学习专注度。

春节假期本是阖家团圆的日子,但对于很多家长来说,'辅导寒假作业'往往是打破祥和气氛的导火索。面对孩子'这题怎么做'的灵魂拷问,家长们常常面临两个痛点:
传统的搜题 App 需要掏出手机、拍照、上传,不仅打断孩子思路,还容易让孩子分心玩手机。而 AI Glasses 的第一视角采集与实时语音交互特性,天然适合作为'随身家教'——看着题就能问,边看边讲解。
本文将详细介绍如何利用灵珠 AI 平台的零代码/低代码能力,快速搭建一个具备'识题讲解、知识点回顾、错题整理'的 AI Glasses 应用(形态为:智能体 + 工作流,可在眼镜端使用)。
我们希望打造一个名为'作业救星 (Homework Savior)'的智能体,它具备以下能力:
请求触发 -> 卡片 + 语音 -> Rokid Glasses (语音 + 第一视角) -> 灵珠智能体 -> 工作流 -> 多模态理解 (OCR/题干提取) -> 知识库检索 (公式/定理/例题) -> 推理生成 (引导式讲解)
利用 Mermaid 绘制的业务流程图如下:
flowchart TD
User[用户 (Rokid Glasses)] -->|语音指令 + 拍摄图片 | Workflow[灵珠 AI 平台工作流]
Workflow --> OCR[调用视觉模型 OCR + 题目提取]
OCR --> KB[检索相关公式/定理]
KB --> Prompt[Prompt: 结合题目 + 知识点,生成分步讲解思路]
Prompt --> Output[返回结构化的讲解文本]
Output --> Display[输出最终讲解内容:语音播放 + 屏幕显示关键公式]
阶段一:视觉理解与意图识别 阶段二:知识检索与推理
进入左侧导航的'资源' -> '知识库',创建知识库:初中数学公式与定理。
人设与回复逻辑(Prompt):在对应区域输入提示词:
# Role 你是一位耐心、幽默且知识渊博的清华学霸家教。你的目标是辅导初中生完成寒假作业。
# Constraints
1. 🚫 **严禁直接给出最终答案**(如'选 A'或'等于 5')。
2. ✅ 必须采用**引导式教学**:先分析题目考点,再提供第一步思路,引导学生思考下一步。
3. 🗣️ 语言风格:轻松活泼,多用鼓励性话语(如'这点很棒!''别急,我们慢慢来')。
4. 📐 如果涉及数学公式,请用 LaTeX 格式输出,方便眼镜端渲染(或转为自然语言描述)。
# Skills
1. 擅长识别手写体题目。
2. 能将复杂的物理/数学概念用生活中的例子类比。
在灵珠平台首页点击'创建智能体'。
为了处理复杂的'识图 + 检索 + 推理'逻辑,我们需要使用工作流而非简单的单轮对话。
进入'开发工作流' -> '创建工作流'。
灵珠平台的工作流画布里,开始节点默认会提供两类输入:
USER_INPUT:文本输入(用户的提问/指令)USER_INPUT_IMAGE:图片输入(用户当前视角拍摄的题目图)结束节点通常输出:
output:工作流最终输出(返回给智能体/眼镜端展示与播报)为了让提示词里引用变量更直观,建议把两个关键节点命名为:
USER_INPUT(用户问题)USER_INPUT_IMAGE(题目图片)USER_INPUT_IMAGE请提取图片中的题目文字;若含几何图,请用要点描述图形关系与已知条件。题干提取 的输出(题目文本)初中数学公式与定理 知识库outputSystem Prompt:
你收到了一个学生的提问和一道题目。
题目内容:{{题干提取.output}}
参考知识点:{{知识库检索.output}}
用户问题:{{USER_INPUT}}
请结合参考知识点,为学生讲解这道题,采用引导式教学,不要给出最终答案或最终数值结果。
如果识别到的题干不完整/关键信息缺失:
先用一句话复述你识别到的题干,并告诉用户需要补充拍清楚哪些信息,然后停止输出讲解。
否则请严格按以下结构输出(每段控制简短,方便眼镜端显示与语音播报):
【考点】一句话概括
【第一步】先做什么(给出一个可执行的小步骤)
【下一步提示】给一个追问或提示,推动学生继续
【自检问题】给 1 个让学生自检的简单问题
为了保证'眼镜端一眼能看懂、语音也不啰嗦',建议把工作流最终输出固定为四段结构:
【考点】相似三角形判定与比例关系
【第一步】先在图中找出两组对应角(或平行线形成的内错角),判断能否构成相似
【下一步提示】如果能判定相似,对应边成比例,这一步你准备写出哪两条边的比例?
【自检问题】你能说出'相似'的两个三角形分别是哪两个吗?
下面这张表是我自己用于'发布前验收'的最小集合。
| 用例 | 题目类型 | 画面条件 | 用户问题示例 | 期望输出(检查点) |
|---|---|---|---|---|
| TC-01 | 几何(有图) | 光线正常 | 这题第一步怎么看? | 能说出考点;不报答案;给出可执行第一步 |
| TC-02 | 方程(印刷体) | 光线正常 | 帮我分析思路 | 结构化四段;第一步是列式/移项等 |
| TC-03 | 应用题(文字多) | 题干完整 | 先帮我提取已知条件 | 能复述条件;提示设未知数;不直接算结果 |
| TC-04 | 手写体 | 字迹清晰 | 我卡在第二步了 | 能追问缺失信息;或给下一步提示推动思考 |
| TC-05 | 模糊/反光 | 题干缺失 | 你看得清吗? | 先复述识别到的内容;要求重拍;停止讲解 |
| TC-06 | '诱导要答案' | 题干完整 | 直接告诉我答案 | 仍不报答案;改为给思路与自检问题 |
这道题我不会做,先告诉我第一步怎么想通过灵珠平台,我们用'智能体 + 工作流 + 知识库'的方式,快速搭建出一个具备多模态理解与引导式讲解能力的AI Glasses 应用。它既能缓解春节期间的家庭作业辅导压力,也能展示

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML 转 Markdown 互为补充。 在线工具,Markdown 转 HTML在线工具,online