一、引言:为什么我们需要一个 AI Glasses 作业助手?
春节假期本是阖家团圆的日子,但对于很多家长来说,'辅导寒假作业'往往是打破祥和气氛的导火索。面对孩子'这题怎么做'的灵魂拷问,家长们常常面临两个痛点:
- 知识遗忘:当年的学霸面对现在的奥数题也可能束手无策。
- 情绪失控:反复讲解听不懂,容易血压飙升。
传统的搜题 App 需要掏出手机、拍照、上传,不仅打断孩子思路,还容易让孩子分心玩手机。而 AI Glasses 的第一视角采集与实时语音交互特性,天然适合作为'随身家教'——看着题就能问,边看边讲解。
本文将详细介绍如何利用灵珠 AI 平台的零代码/低代码能力,快速搭建一个具备'识题讲解、知识点回顾、错题整理'的 AI Glasses 应用(形态为:智能体 + 工作流,可在眼镜端使用)。
二、方案设计与架构
2.1 核心功能定义
我们希望打造一个名为'作业救星 (Homework Savior)'的智能体,它具备以下能力:
- 👁️ 视觉识别:通过眼镜摄像头捕捉作业题目(支持手写体/印刷体)。
- 🧠 深度推理:不直接给出答案,而是分析题目考察的知识点,提供分步解题思路。
- 📚 知识挂载:针对特定学科(如初中几何、物理公式),挂载专属知识库以提高准确率。
- 🗣️ 情感交互:以'温柔耐心的学霸哥哥/姐姐'口吻进行语音讲解,安抚孩子情绪。
2.2 端到端架构(AI Glasses)
请求触发 -> 卡片 + 语音 -> Rokid Glasses (语音 + 第一视角) -> 灵珠智能体 -> 工作流 -> 多模态理解 (OCR/题干提取) -> 知识库检索 (公式/定理/例题) -> 推理生成 (引导式讲解)
2.3 业务流程架构
利用 Mermaid 绘制的业务流程图如下:
flowchart TD
User[用户 (Rokid Glasses)] -->|语音指令 + 拍摄图片 | Workflow[灵珠 AI 平台工作流]
Workflow --> OCR[调用视觉模型 OCR + 题目提取]
OCR --> KB[检索相关公式/定理]
KB --> Prompt[Prompt: 结合题目 + 知识点,生成分步讲解思路]
Prompt --> Output[返回结构化的讲解文本]
Output --> Display[输出最终讲解内容:语音播放 + 屏幕显示关键公式]
阶段一:视觉理解与意图识别 阶段二:知识检索与推理
三、开发实战:手把手搭建'作业救星'
3.1 准备工作
- 准备 3 份测试题目(建议各 1 份:几何、方程、应用题),用于验证不同题型表现。
- 准备一份'初中数学公式/定理'材料(PDF/Markdown/网页内容均可),用于构建知识库。
- 确保眼镜与手机已完成基础配对/联网,并能在眼镜端打开灵珠平台相关入口。
3.2 步骤一:创建知识库(资源准备)
- 上传/粘贴内容并切分为适合检索的片段(建议按'定理名 + 公式 + 适用条件 + 例题提示'组织)
- 进行一次检索自测:输入'勾股定理''相似三角形判定'等关键词,确认能命中对应片段。
进入左侧导航的'资源' -> '知识库',创建知识库:初中数学公式与定理。
3.3 步骤二:创建智能体(Agent)
- 基本信息配置:
- 名称:作业救星
- 简介:你的寒假作业辅导老师,只讲思路不给直接答案
人设与回复逻辑(Prompt):在对应区域输入提示词:
# Role 你是一位耐心、幽默且知识渊博的清华学霸家教。你的目标是辅导初中生完成寒假作业。
# Constraints
1. 🚫 **严禁直接给出最终答案**(如'选 A'或'等于 5')。
2. ✅ 必须采用**引导式教学**:先分析题目考点,再提供第一步思路,引导学生思考下一步。
3. 🗣️ 语言风格:轻松活泼,多用鼓励性话语(如'这点很棒!''别急,我们慢慢来')。
4. 📐 如果涉及数学公式,请用 LaTeX 格式输出,方便眼镜端渲染(或转为自然语言描述)。
# Skills
1. 擅长识别手写体题目。
2. 能将复杂的物理/数学概念用生活中的例子类比。


