
基于 Rokid AR 眼镜的 Android 喝水提醒应用开发
一款基于 Rokid AR 眼镜和 Android 开发的喝水提醒应用。针对程序员久坐少动的问题,利用 AR 眼镜视野可见的优势实现非中断式提醒。技术选型采用 CXR-M SDK,使用 Kotlin 构建数据层、前台服务及 SDK 封装。解决了蓝牙权限动态申请、提词器场景控制、中文编码及 TTS 播放完整性等关键问题。最终实现了定时提醒、数据记录及语音播报功能,为 AR 眼镜在健康管理类应用提供了实践参考。

一款基于 Rokid AR 眼镜和 Android 开发的喝水提醒应用。针对程序员久坐少动的问题,利用 AR 眼镜视野可见的优势实现非中断式提醒。技术选型采用 CXR-M SDK,使用 Kotlin 构建数据层、前台服务及 SDK 封装。解决了蓝牙权限动态申请、提词器场景控制、中文编码及 TTS 播放完整性等关键问题。最终实现了定时提醒、数据记录及语音播报功能,为 AR 眼镜在健康管理类应用提供了实践参考。

解析了微软 Copilot Cowork 从代码补全到智能协作的转变,阐述了 AI Agent 的感知、规划与执行闭环。通过 Kotlin 结合大模型 API,演示了如何构建简易 AI Agent。重点介绍了 Agent 的核心逻辑及代码实现细节,帮助开发者理解并实践 AI 应用开发。

使用 Glide 加载 WebP 动画时因共享 AnimatedImageDrawable 实例导致的播放进度同步、停止联动及重播闪烁问题。通过对比清除全部内存缓存和使用第三方解码库的方案,最终提出自定义 GlideModule 拦截缓存 Key 的策略,实现精准清理特定资源缓存,避免影响其他图片加载并解决状态复用问题。

介绍如何使用 Rokid AR 眼镜及 CXR-M SDK 开发一款'亲戚称呼助手'应用。通过 Android 端管理亲戚数据(姓名、称呼、关系、话术),利用蓝牙连接 AR 眼镜,将信息以提词器形式同步至眼镜端显示。解决了春节期间难以识别亲戚称呼的痛点。核心涉及 SDK 集成、蓝牙权限处理、场景控制及 TTS 语音播报。

基于 Rokid CXR-M SDK 开发 AR 健身应用形随心动的技术实践。涵盖 SDK 配置、权限管理、设备连接、AI 动作识别、AR 界面渲染及数据可视化等核心功能实现。通过分层架构设计解决居家健身指导痛点,并探讨了动作精度优化、性能调优及功耗管理等挑战与解决方案。
一款开源的轻小说机翻机器人,支持网络及本地日语小说的自动翻译。该工具集成了多种翻译引擎,具备自动爬虫、多格式导出及个性化阅读管理功能。技术架构采用前后端分离,后端基于 Kotlin Spring Boot,前端使用 Vue3 TypeScript,并通过 Docker 容器化部署。文章详细阐述了核心模块、部署步骤及进阶优化技巧,旨在帮助开发者快速搭建日语小说阅读平台。
深入解析 Kotlin Symbol Processing (KSP) 的三大核心组件:SymbolProcessor、Resolver 和 CodeGenerator。文章介绍了 KSP 相对于 KAPT 的性能优势及 KSP2 的架构改进。详细阐述了 SymbolProcessor 的多轮处理机制、Resolver 的符号查询与依赖追踪能力,以及 CodeGenerator 的文件创建与依赖管理规则。通过实际代码示例展示了组件协同工…

在 Android Studio 中集成和使用 Gemini AI 的方法。首先需将 IDE 更新至 Koala 或更高版本,登录 Google 账号,若网络受限需配置 HTTP 代理。其次,在 Google AI Studio 获取 API Key,并通过 local.properties 注入及 build.gradle 添加依赖。最后在 Kotlin 代码中实例化 GenerativeModel 即可实现代码生成与智能问答功能。
介绍基于大疆 MSDK 实现无人机视觉引导自适应降落功能。针对 FlyTo 功能不可用及 GPS 精度不足问题,采用虚拟摇杆导航替代,结合视觉识别计算 X/Y 偏移量。核心策略是根据高度动态调整下降速度和位置对齐阈值,高空允许较大误差,低空严格限制。通过关闭下视避障防止误停,最终实现安全精确的自动降落。

介绍如何利用 Rokid CXR-M SDK 在 Android 上开发 AR 演讲提词器应用。通过蓝牙连接眼镜,使用 WORD_TIPS 场景实现隐形提词。核心功能包括演讲稿管理、智能分页算法(按段落语义分割)、实时内容同步及翻页控制。解决了传统提词器不专业、设备昂贵的问题,利用 AR 眼镜提供隐蔽、便携的平视体验。代码采用 Kotlin 编写,封装了 SDK 交互层,并处理了权限、线程切换等常见问题。

一款基于 WebRTC 和 AI 技术的智能远程控制解决方案。该方案采用 Kotlin 开发 Android 应用,利用 WebRTC 实现低延迟的 P2P 视频流与控制指令传输,结合 Android 原生语音识别(STT)、Google ML Kit OCR 及 TTS 技术,实现语音指令到自动执行的闭环。系统包含远程控制和本地助手两种模式,支持企业 IT 支持、无障碍辅助、智能家居等场景。技术亮点包括智能坐标定位、实时语音反馈、低延…

ibbot 智体机灵 V1.0 是基于 dtns.os V5.0 的移动端 AI 智能体平台。它支持在安卓设备上运行,通过自然语言指令调度技能模块完成复杂任务。主要功能包括 AI 编程、租人网、角色扮演及手机自动化控制。相比传统桌面方案,其优势在于零额外硬件成本、高便携性及深度手机整合。提供 Web 体验版及开源代码仓库。

详细记录了基于 Rokid CXR-M SDK 开发 AR 会议纪要助手的完整流程。系统采用 Kotlin 构建,通过手机端控制与眼镜端显示分离的架构实现议程管理。核心模块涵盖蓝牙连接封装、数据模型设计及提词器场景通信。文中重点解决了 SDK 双阶段连接逻辑、后台计时精度、UTF-8 编码及 Android 12+ 动态权限等关键技术问题。该方案展示了 AR 眼镜在会议场景下的无感交互优势,为办公辅助工具开发提供了实践参考。
分享了在 Android 设备上集成 Whisper 模型进行语音识别(ASR)的实战经验。文章分析了移动端 ASR 面临的延迟、资源及功耗挑战,阐述了选择 Whisper 的原因。核心内容涵盖模型量化裁剪、音频预处理流水线优化及 JNI 层性能提升技巧。通过提供 Kotlin 与 C++ 代码示例,展示了从 AudioRecord 采集到推理输出的完整流程,并给出了不同模型版本的性能对比数据及避坑指南,为开发者实现本地高效语音交互提供…
Gitnuro 是一款基于 Kotlin 和 JetBrains Compose 开发的免费开源跨平台 Git 客户端。它提供直观的图形界面管理分支、提交记录和暂存区,降低 Git 使用门槛。支持 Linux(Flatpak)、Windows 和 macOS 安装。核心功能包括分支可视化图谱、文件状态颜色标识、自定义主题配置及团队协作凭证管理。适合新手和专业开发者提升 Git 操作效率。

演示了 Jetpack Compose 中 FloatingActionButton、Slider、LinearProgressIndicator 和 CircularProgressIndicator 组件的基本用法。内容包括浮动按钮的点击事件处理、滑动条的值范围与步长设置、线性进度条的状态控制(确定性与不确定进度)以及圆形进度条的样式定制与模拟加载动画实现。