从零开发 AR 演讲提词器:基于 Rokid CXR-M SDK 的实战指南

从零开发 AR 演讲提词器:基于 Rokid CXR-M SDK 的实战指南

从零开发 AR 演讲提词器:基于 Rokid CXR-M SDK 的实战指南

站在讲台上,数百双眼睛注视着你。你开始演讲,却发现关键时刻想不起下一句要说什么——这种场景,每个演讲者都不陌生。

传统的解决方案是在讲台上放一张稿子,或者用 PPT 做备注。但低头看稿显得不专业,看 PPT 又要扭头,容易打断演讲节奏。如果能有一个只有自己能看到的"隐形提词器",演讲就能更加从容自信。

Rokid AR 眼镜恰好提供了这种可能:将提词内容无线传输到眼镜显示屏,演讲者只需自然平视,文字便清晰呈现,而台下观众毫无察觉。本文将完整记录如何利用 Rokid CXR-M SDK 从零开发这款演讲提词器应用。

一、技术方案设计

1.1 为什么选择 AR 眼镜

在确定技术方案前,我们先对比几种提词方案:

方案

优点

缺点

纸质稿

简单、可靠

低头看稿不专业,翻页有声响

手机/平板

便携

需要低头,屏幕反光

专业提词器

效果好

设备昂贵,需要提前架设

AR 眼镜

隐蔽、便携、平视

需要设备支持

AR 眼镜的核心优势在于隐蔽性——观众完全察觉不到你在看提词,这与专业电视台主播使用的提词器效果类似,但成本和使用门槛大大降低。

1.2 为什么选择 CXR-M SDK

Rokid 提供了多套 SDK,我选择 CXR-M SDK(客户端模式)的原因:

  1. 内置提词器场景:SDK 提供了 WORD_TIPS 场景类型,专门用于文字提示,无需自己实现渲染逻辑
  2. 蓝牙直连:手机与眼镜通过蓝牙通信,无需额外中转设备
  3. 流式传输:支持文本流发送,适合分页内容
  4. 开发门槛低:纯 Android 开发,无需学习 3D 引擎

1.3 系统架构

整个应用采用三层架构:

二、开发环境搭建

2.1 创建项目

使用 Android Studio 创建一个新项目,选择 Empty Views Activity 模板。项目配置如下:

// app/build.gradle.kts plugins { id("com.android.application") id("org.jetbrains.kotlin.android") } android { namespace = "com.rokid.speech" compileSdk = 34 defaultConfig { applicationId = "com.rokid.speechprompter" minSdk = 28 targetSdk = 34 } compileOptions { sourceCompatibility = JavaVersion.VERSION_17 } kotlinOptions { jvmTarget = "17" } }

2.2 添加 SDK 依赖

Rokid 的 SDK 托管在其私有 Maven 仓库,需要在 settings.gradle.kts 中添加仓库地址:

// settings.gradle.kts dependencyResolutionManagement { repositories { google() mavenCentral() maven { url = uri("https://maven.rokid.com/repository/maven-public/") } } }

然后在 app/build.gradle.kts 中添加依赖:

dependencies { // Rokid CXR-M SDK implementation("com.rokid.cxr:client-m:1.0.1-20250812.080117-2") // Android 基础库 implementation("androidx.core:core-ktx:1.12.0") implementation("androidx.appcompat:appcompat:1.6.1") implementation("com.google.android.material:material:1.11.0") implementation("androidx.constraintlayout:constraintlayout:2.1.4") }

2.3 配置蓝牙权限

眼镜通过蓝牙与手机通信,需要声明相关权限:

<!-- AndroidManifest.xml --> <uses-permission android:name="android.permission.BLUETOOTH" /> <uses-permission android:name="android.permission.BLUETOOTH_ADMIN" /> <uses-permission android:name="android.permission.BLUETOOTH_SCAN" android:usesPermissionFlags="neverForLocation" /> <uses-permission android:name="android.permission.BLUETOOTH_CONNECT" />

注意:Android 12+ 需要动态申请 BLUETOOTH_SCANBLUETOOTH_CONNECT 权限。

三、SDK 封装层实现

直接在业务代码中调用 SDK 会导致代码耦合度高、难以测试。我设计了一个 RokidGlassesManager 单例来封装所有眼镜交互逻辑。

3.1 连接管理

首先定义连接状态回调接口:

// RokidGlassesManager.kt object RokidGlassesManager { private val cxrApi: CxrApi by lazy { CxrApi.getInstance() } private var connectionCallback: ConnectionCallback? = null interface ConnectionCallback { fun onConnecting() fun onConnected() fun onDisconnected() fun onFailed(errorMsg: String) } val isConnected: Boolean get() = cxrApi.isBluetoothConnected fun setConnectionCallback(callback: ConnectionCallback?) { this.connectionCallback = callback } }

3.2 查找已配对设备

用户在使用前需要先在系统设置中将眼镜与手机配对。我们的应用从已配对设备列表中查找 Rokid 眼镜:

fun findRokidGlasses(bluetoothAdapter: BluetoothAdapter): BluetoothDevice? { if (ActivityCompat.checkSelfPermission( bluetoothAdapter.javaClass, Manifest.permission.BLUETOOTH_CONNECT ) != PackageManager.PERMISSION_GRANTED ) { return null } return bluetoothAdapter.bondedDevices.find { it.name?.contains("Rokid", ignoreCase = true) == true || it.name?.contains("Glasses", ignoreCase = true) == true } }

3.3 建立连接

调用 SDK 的 initBluetooth 方法建立连接:

fun connectGlasses(context: Context, device: BluetoothDevice) { connectionCallback?.onConnecting() cxrApi.initBluetooth(context, device, object : BluetoothStatusCallback() { override fun onConnectionInfo( socketUuid: String?, macAddress: String?, rokidAccount: String?, glassesType: Int ) { // 连接信息获取成功 } override fun onConnected() { connectionCallback?.onConnected() } override fun onDisconnected() { connectionCallback?.onDisconnected() } override fun onFailed(errorCode: ValueUtil.CxrBluetoothErrorCode?) { connectionCallback?.onFailed(errorCode?.name ?: "连接失败") } }) }

3.4 发送内容到眼镜

这是核心功能——将提词内容发送到眼镜显示:

interface SendCallback { fun onSuccess() fun onFailed(errorMsg: String) } fun sendContent(text: String, callback: SendCallback? = null): Boolean { if (!isConnected) { callback?.onFailed("眼镜未连接") return false } // 1. 启用提词器场景 cxrApi.controlScene(ValueUtil.CxrSceneType.WORD_TIPS, true, null) // 2. 发送文本流 val status = cxrApi.sendStream( type = ValueUtil.CxrStreamType.WORD_TIPS, stream = text.toByteArray(Charsets.UTF_8), fileName = "speech.txt", cb = object : SendStatusCallback() { override fun onSendSucceed() { callback?.onSuccess() } override fun onSendFailed(errorCode: ValueUtil.CxrSendErrorCode?) { callback?.onFailed(errorCode?.name ?: "发送失败") } } ) return status == ValueUtil.CxrStatus.REQUEST_SUCCEED }

代码要点说明

  • controlScene(WORD_TIPS, true, null) 告诉眼镜启用提词器场景
  • sendStream 将文本以 UTF-8 编码发送
  • 回调在子线程执行,更新 UI 时需要切回主线程

四、业务逻辑实现

4.1 数据模型设计

定义演讲稿的数据结构:

// Speech.kt data class Speech( val id: Int, val title: String, val content: String, val createdAt: Long = System.currentTimeMillis() )

为了演示,我创建了一个内存数据源(实际项目中可使用 Room 数据库):

object SpeechData { val speeches = listOf( Speech( id = 1, title = "年度工作汇报","各位领导、各位同事: | |大家好!2025年是我部门快速发展的一年... |""".trimMargin() ), Speech( id = 2, title = "产品发布演示", content = "今天给大家介绍我们的最新产品..." ) ) fun getSpeech(id: Int): Speech? = speeches.find { it.id == id } }

4.2 智能分页算法

这是整个应用的核心算法。演讲稿不能简单地按字符数切割,因为:

  1. 不能在句子中间断开
  2. 要保持段落的语义完整
  3. 每页内容要适中,便于阅读

我设计的分页策略是:按段落优先,单段过长时按句子分割

// MainActivity.kt private fun splitContent(content: String): List<String> { val result = mutableListOf<String>() val lines = content.split("\n") val currentParagraph = StringBuilder() var charCount = 0 for (line in lines) { // 当当前段落超过100字符且新行会超限时,开始新页 if (charCount + line.length > 100 && currentParagraph.isNotEmpty()) { result.add(currentParagraph.toString().trim()) currentParagraph.clear() charCount = 0 } currentParagraph.append(line).append("\n") charCount += line.length } // 添加最后一段 if (currentParagraph.isNotEmpty()) { result.add(currentParagraph.toString().trim()) } return result }

4.3 构建眼镜显示格式

发送到眼镜的内容需要格式化,包含标题、页码、正文和计时:

private fun buildDisplayText(speech: Speech, paragraph: String): String { return buildString { appendLine("📝 ${speech.title}") appendLine() appendLine("────── ${currentParagraph + 1}/${paragraphs.size} ──────") appendLine() appendLine(paragraph) appendLine() appendLine("⏱ ${formatElapsedTime(elapsedTime)}") appendLine() appendLine("◀ 上页 下页 ▶") } } private fun formatElapsedTime(millis: Long): String { val minutes = millis / (1000 * 60) val seconds = (millis / 1000) % 60 return String.format("%02d:%02d", minutes, seconds) }

五、界面开发

5.1 主界面布局

主界面分为三个区域:演讲稿列表、内容显示区、眼镜控制区:

<!-- activity_main.xml --> <LinearLayout android:orientation="vertical" android:padding="16dp"> <!-- 演讲稿列表 --> <TextView text="选择演讲稿" /> <RecyclerView android:id="@+id/rvSpeeches" android:layout_weight="1" /> <!-- 内容显示区(初始隐藏) --> <CardView android:id="@+id/controlPanel" android:visibility="gone"> <TextView android:id="@+id/tvTitle" /> <TextView android:id="@+id/tvPage" /> <TextView android:id="@+id/tvTimer" /> <ScrollView> <TextView android:id="@+id/tvContent" /> </ScrollView> <!-- 翻页按钮 --> <Button android:id="@+id/btnPrev" text="◀ 上一页" /> <Button android:id="@+id/btnNext" text="下一页 ▶" /> </CardView> <!-- 眼镜控制区 --> <CardView> <Button android:id="@+id/btnConnect" text="连接眼镜" /> <Button android:id="@+id/btnSend" text="📤 发送到眼镜" /> </CardView> </LinearLayout> 

5.2 列表适配器

// SpeechAdapter.kt class SpeechAdapter( private val speeches: List<Speech>, private val onItemClickListener: (Speech) -> Unit ) : RecyclerView.Adapter<SpeechAdapter.ViewHolder>() { private var selectedPosition = -1 inner class ViewHolder(view: View) : RecyclerView.ViewHolder(view) { val tvTitle: TextView = view.findViewById(R.id.tvTitle) val tvPreview: TextView = view.findViewById(R.id.tvPreview) init { view.setOnClickListener { val position = bindingAdapterPosition if (position != RecyclerView.NO_POSITION) { selectedPosition = position onItemClickListener(speeches[position]) } } } } override fun onBindViewHolder(holder: ViewHolder, position: Int) { val speech = speeches[position] holder.tvTitle.text = speech.title holder.tvPreview.text = speech.content.take(50) + "..." } override fun getItemCount() = speeches.size }

5.3 主 Activity 逻辑

在 Activity 中串联所有组件:

class MainActivity : AppCompatActivity() { private lateinit var binding: ActivityMainBinding private var currentSpeech: Speech? = null private var currentParagraph = 0 private var paragraphs: List<String> = emptyList() private var isRunning = false private var startTime: Long = 0 // 翻页防抖 private var lastPageChangeTime = 0L override fun onCreate(savedInstanceState: Bundle?) { super.onCreate(savedInstanceState) binding = ActivityMainBinding.inflate(layoutInflater) setContentView(binding.root) setupSpeechList() setupButtons() checkPermissions() observeConnection() } private fun loadSpeech(speech: Speech) { currentSpeech = speech currentParagraph = 0 paragraphs = splitContent(speech.content) updateDisplay() binding.controlPanel.visibility = View.VISIBLE } private fun previousParagraph() { if (currentParagraph > 0) { currentParagraph-- updateDisplay() if (RokidGlassesManager.isConnected) { sendToGlasses() } } } private fun nextParagraph() { if (currentParagraph < paragraphs.size - 1) { currentParagraph++ updateDisplay() if (RokidGlassesManager.isConnected) { sendToGlasses() } } } private fun sendToGlasses() { val speech = currentSpeech ?: return val paragraph = paragraphs.getOrNull(currentParagraph) ?: return val displayText = buildDisplayText(speech, paragraph) RokidGlassesManager.sendContent(displayText, object : RokidGlassesManager.SendCallback { override fun onSuccess() { runOnUiThread { Toast.makeText(this@MainActivity, "已同步到眼镜", Toast.LENGTH_SHORT).show() } } override fun onFailed(errorMsg: String) { runOnUiThread { Toast.makeText(this@MainActivity, "发送失败: $errorMsg", Toast.LENGTH_SHORT).show() } } }) } }

六、开发中的踩坑与解决

6.1 翻页防抖

问题:用户快速点击翻页按钮会导致跳过多页。

解决:添加时间间隔判断:

private var lastPageChangeTime = 0L binding.btnNext.setOnClickListener { if (System.currentTimeMillis() - lastPageChangeTime > 300) { lastPageChangeTime = System.currentTimeMillis() nextParagraph() } }

6.2 演讲时屏幕常亮

问题:演讲过程中手机自动休眠,导致蓝牙断开。

解决:在 Activity 中添加标志:

override fun onCreate(savedInstanceState: Bundle?) { window.addFlags(WindowManager.LayoutParams.FLAG_KEEP_SCREEN_ON) // ... }

6.3 权限动态申请

问题:Android 12+ 需要动态申请蓝牙权限。

解决

private fun checkPermissions() { val permissions = mutableListOf<String>() if (Build.VERSION.SDK_INT >= Build.VERSION_CODES.S) { permissions.add(Manifest.permission.BLUETOOTH_SCAN) permissions.add(Manifest.permission.BLUETOOTH_CONNECT) } val notGranted = permissions.filter { ContextCompat.checkSelfPermission(this, it) != PackageManager.PERMISSION_GRANTED } if (notGranted.isNotEmpty()) { ActivityCompat.requestPermissions(this, notGranted.toTypedArray(), 100) } }

6.4 回调线程问题

问题:SDK 回调在子线程执行,直接更新 UI 会崩溃。

解决:使用 runOnUiThread 切换线程:

override fun onConnected() { runOnUiThread { binding.btnConnect.text = "断开连接" Toast.makeText(this@MainActivity, "眼镜已连接", Toast.LENGTH_SHORT).show() } }

七、效果演示

7.1 使用流程

  1. 打开应用,从列表选择要演讲的稿件
  2. 点击「连接眼镜」,等待配对的 Rokid 眼镜连接成功
  3. 点击「开始演讲」,计时器启动
  4. 演讲过程中点击「上一页」「下一页」控制内容
  5. 内容自动同步到眼镜,平视即可看到提词

7.2 眼镜端显示效果

┌──────────────────────────────┐ │ 📝 年度工作汇报 │ │ │ │ ────── 1/5 ────── │ │ │ │ 各位领导、各位同事: │ │ │ │ 大家好!2025年是我部门 │ │ 快速发展的一年,在全体成员 │ │ 的共同努力下,我们取得了 │ │ 显著的成绩... │ │ │ │ ⏱ 02:35 │ │ │ │ ◀ 上页 下页 ▶ │ └──────────────────────────────┘

八、功能清单

功能

状态

说明

演讲稿管理

列表展示、选择切换

智能分页

保持段落语义完整

翻页控制

上一页/下一页,带防抖

眼镜连接

蓝牙配对、状态监听

内容同步

实时发送到眼镜

计时功能

开始/暂停,显示已用时间

九、后续改进方向

当前版本已实现核心功能,后续可考虑增强:

  1. 语音翻页:集成语音识别,说"下一页"自动翻页,双手彻底解放
  2. 时间预警:设定预计时长,超时震动提醒
  3. 文档导入:支持导入 Word、PDF、TXT 文件
  4. 云端同步:演讲稿云端存储,多设备共享
  5. 演讲分析:记录翻页节奏,分析演讲速度

十、总结

这款演讲提词器利用 Rokid AR 眼镜的 WORD_TIPS 场景,实现了"隐形提词"的效果。整个开发过程让我对 CXR-M SDK 有了深入理解:

  • 场景化设计:SDK 预置的场景类型降低了开发难度,开发者只需关注业务逻辑
  • 流式传输sendStream API 设计简洁,适合分页内容的实时推送
  • 连接管理:蓝牙连接的复杂性被封装在 SDK 内部,回调机制清晰

AR 眼镜在办公场景有着广阔的应用空间。除了演讲提词,还可以用于实时翻译、会议记录、远程协助等场景。希望这篇文章能给其他开发者带来启发,探索更多 AR 应用的可能性。


项目源码SpeechPrompter/

参考资源

Read more

毕业设计源码:Python音乐推荐系统 Django+Echarts+协同过滤算法+前端三剑客 课程设计 毕业设计(建议收藏)✅

毕业设计源码:Python音乐推荐系统 Django+Echarts+协同过滤算法+前端三剑客 课程设计 毕业设计(建议收藏)✅

博主介绍:✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久,选择我们就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅 点击查看作者主页,了解更多项目! 🍅感兴趣的可以先收藏起来,点赞、关注不迷路,大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助同学们顺利毕业 。🍅 1、毕业设计:2026年计算机专业毕业设计选题汇总(建议收藏)✅ 2、大数据毕业设计:2026年选题大全 深度学习 python语言 JAVA语言 hadoop和spark(建议收藏)✅ 1、项目介绍 技术栈 以Python为开发语言,基于Django框架搭建系统整体架构,集成基于用户的协同过滤推荐算法实现核心推荐功能,运用Echarts完成数据可视化展示,前端通过HTML、CSS、JavaScript构建交互页面,采用MySQL或PostgreSQL数据库存储各类业务数据。 功能模块 * 可视化界面 * 首页 * 音乐播放与信息展示 * 音乐详情页 * 音乐推

SpringBoot+Vue 校园网上店铺设计与实现平台完整项目源码+SQL脚本+接口文档【Java Web毕设】

SpringBoot+Vue 校园网上店铺设计与实现平台完整项目源码+SQL脚本+接口文档【Java Web毕设】

系统架构设计### 摘要 随着互联网技术的快速发展,校园内的商业活动逐渐向线上迁移,学生和教职工对便捷的购物体验需求日益增长。传统的线下店铺受限于时间和空间,难以满足校园用户的多样化需求,因此构建一个高效、便捷的校园网上店铺平台成为迫切需求。该平台旨在整合校园内的商品资源,提供在线浏览、下单、支付及配送等功能,优化校园商业生态。通过线上交易模式,减少中间环节,降低运营成本,同时为学生创业提供技术支持。关键词:校园电商、在线交易、商品管理、Java Web、毕设设计。 本平台采用前后端分离架构,后端基于SpringBoot框架实现RESTful API接口,提供高效的数据处理和业务逻辑支持;前端使用Vue.js框架构建用户界面,确保交互流畅性和响应速度。数据库采用MySQL存储商品、订单和用户信息,并通过SQL脚本实现数据表的初始化。系统功能模块包括用户注册登录、商品分类展示、购物车管理、订单支付及后台管理,支持多角色权限控制。技术栈整合了JWT身份认证、Redis缓存优化及Swagger接口文档生成,确保系统安全性和可维护性。关键词:SpringBoot、Vue.js、MySQL、

【芯片解读】TI AFE5816:16通道超声波模拟前端 (AFE) 深度详解

【芯片解读】TI AFE5816:16通道超声波模拟前端 (AFE) 深度详解

【芯片解读】TI AFE5816:16通道超声波模拟前端 (AFE) 深度详解 简介 在医疗超声成像、无若检测(NDT)以及声纳应用中,模拟前端(AFE)的性能直接决定了成像的质量。Texas Instruments (TI) 的 AFE5816 是一款高度集成的 16 通道模拟前端解决方案,专为需要高性能、低功耗和小尺寸的便携式及高端超声波系统设计。 国产类似产品为海思的AC9810-32,该产品与TI的AFE5832功能相似,为32通道AFE,海思后续还有64通道的产品推出。 1. 核心特性概览 (Key Features) AFE5816 是一个多芯片模块(MCM),集成了两个晶圆:VCA(压控放大器)和 ADC_CONV(模数转换)。其主要特性如下: * 高集成度:单芯片集成 16 个通道,每个通道包含衰减器、LNA、LPF、

零成本上线个人项目 ——ngrok 仅穿透前端实现公网访问

开发个人项目时,想让他人访问往往需要购买服务器、配置域名解析,成本高且流程繁琐。 本文介绍一种零成本方案 —— 仅穿透前端即可实现内网个人项目的公网访问。 ngrok 账号注册与工具准备 首先在https://ngrok.com/ 官网注册一个账号,就能获得一个免费的dev结尾的域名。 注册好之后,下载对应的zip压缩包 在官网个人后台 / 仪表盘(Dashboard)可直接复制个人专属的 Authtoken。 分框架适配配置 如果前端是用 Vite + React 的项目,需要在 vite.config.js 文件加上allowedHosts这一行代码: // vite.config.jsexportdefaultdefineConfig({server:{allowedHosts:['xxx.dev']// ngrok 域名}}) 如果前端是基于 Umi Max + Ant Design Pro 的项目,前端默认是跑在 localhost: