
基于 Rokid AR 眼镜的 Android 喝水提醒应用开发
!AR 眼镜界面 一、从一次体检说起 二、为什么是 AR 眼镜? 三、技术选型:CXR-M SDK vs 灵珠平台 四、项目架构设计 五、从配置开始:Gradle 和权限 5.1 添加 SDK 依赖 5.2 权限配置 六、数据层实现 6.1 数据模型 6.2 数据仓库 七、SDK 封装层 7.1 发送提醒到眼镜 7.2 TTS 语音播报 八、前台服务:定时提醒 九、主界面实现 十、踩坑记录 10.…

!AR 眼镜界面 一、从一次体检说起 二、为什么是 AR 眼镜? 三、技术选型:CXR-M SDK vs 灵珠平台 四、项目架构设计 五、从配置开始:Gradle 和权限 5.1 添加 SDK 依赖 5.2 权限配置 六、数据层实现 6.1 数据模型 6.2 数据仓库 七、SDK 封装层 7.1 发送提醒到眼镜 7.2 TTS 语音播报 八、前台服务:定时提醒 九、主界面实现 十、踩坑记录 10.…

Android Studio 作为安卓 APP 开发领域长期以来的核心开发工具,其稳定性和功能性已得到广泛认可。而 Gemini 作为 Google 推出的原生 AI 编程辅助系统,则为开发者提供了智能化的协作支持。 在引入 Gemini 后,你不再需要频繁切换浏览器查文档、使用外部 ai 工具复制粘贴代码再回来调试 bug。它可以直接在 IDE 内理解你的项目结构、阅读你的代码上下文,生成函数、…

解析微软 Copilot Cowork 的核心逻辑,包括感知、规划与执行闭环。通过 Kotlin 代码示例,演示如何利用大模型 API 构建简易 AI Agent,涵盖请求配置、Prompt 工程及任务规划流程。

一种基于 WebRTC 实时通信和人工智能技术的智能远程控制解决方案。系统采用双端架构,支持远程控制和本地助手模式。核心技术包括 WebRTC P2P 视频流传输、Android 原生语音识别(STT)、Google ML Kit OCR 文本定位以及任务规划执行引擎。通过语音指令驱动,实现自动化的屏幕操作,如点击、输入、滚动等。方案解决了传统手动远控效率低的问题,适用于企业 IT 支持、无障碍辅助及智能家居场景。技术栈涵盖 Kotli…
Android 语音通话面临延迟、带宽及设备兼容性挑战。对比 WebRTC、Socket.IO 及商业 SDK,推荐 WebRTC 方案。通过信令交互、JNI 层音频处理、Opus 编解码调优及网络自适应逻辑实现低延迟通信。结合 JitterBuffer、FEC 及内存泄漏检测进行性能优化,并针对小米、华为等厂商设备提供适配方案,支持扩展至视频通话。
一款开源的日语轻小说机翻机器人。该工具支持自动抓取日本主流小说平台内容,集成多种翻译引擎,并提供在线阅读、进度记忆及 EPUB/TXT 导出功能。系统采用 Vue3+TypeScript 前端与 Kotlin+Spring Boot 后端架构,数据存储基于 MongoDB 和 ElasticSearch。通过 Docker Compose 可实现快速部署。文章详细阐述了核心功能、应用场景、部署步骤及架构设计,帮助用户搭建个性化的日语小说…
在 Android 平台上使用 WebRTC SDK 构建实时音视频通信应用的完整流程。文章首先分析了移动端实时通信面临的网络环境、设备碎片化、系统限制及实时性等挑战,并对比了 WebRTC 与第三方 SDK 的优劣。核心部分详细阐述了搭建信令服务器、初始化 PeerConnection 以及媒体流处理的实现步骤,提供了基于 Kotlin 的代码示例。此外,还涵盖了自适应码率、硬件编码器选择、抗丢包等性能优化策略,以及权限处理、编解码器…

一款基于 Android 和 AR 眼镜的亲戚称呼助手应用。通过集成特定 SDK,利用蓝牙通信将手机存储的亲戚信息(姓名、称呼、关系、话术)实时同步至 AR 眼镜端显示。文章详细阐述了项目搭建、数据模型设计、蓝牙连接流程、UI 实现及常见坑点(如权限申请、场景控制顺序、编码问题)。该方案解决了春节走亲访友时记不住亲戚称呼的痛点,提供了隐蔽且便捷的交互体验。

一款基于 Rokid AR 眼镜和 Android 开发的喝水提醒应用。针对程序员久坐少动的问题,利用 AR 眼镜视野可见的优势实现非中断式提醒。技术栈采用 Kotlin 和 CXR-M SDK,涉及蓝牙连接、前台服务保活、数据持久化及 TTS 语音播报。文章详细阐述了架构设计、SDK 封装、权限配置及常见坑点(如蓝牙权限动态申请、中文乱码、TTS 播放不完整等),为 AR 眼镜应用开发提供参考。

记录了使用 Rokid CXR-M SDK 开发聚会游戏助手的完整过程。针对春节聚会中组织者需频繁查看手机题目导致体验不佳的问题,利用 AR 眼镜实现题目私密显示与语音播报。项目采用 Kotlin 编写,包含蓝牙连接、SDK 封装、数据模型设计及倒计时同步等功能。通过提词器场景将内容推送到眼镜端,解决了组织者低头看手机的痛点,提升了游戏流畅度与互动性。

如何使用 Rokid CXR-M SDK 在 Android 平台上开发一款 AR 演讲提词器应用。通过蓝牙连接眼镜,利用 WORD_TIPS 场景实现隐形提词。内容包括环境搭建、SDK 封装、智能分页算法及界面交互。解决了翻页防抖、权限申请及线程回调等问题,实现了演讲稿管理、实时同步和计时功能,为演讲者提供隐蔽且便捷的辅助工具。
利用 Claude AI 助手在 Android Studio 中快速搭建 WebView 项目模板的工作流。内容包括环境配置、API 接入方式选择、结构化指令编写技巧以及实战代码生成过程。通过自然语言交互,开发者可高效完成权限声明、Gradle 依赖及网络配置,显著提升 Android 开发效率。

介绍基于 Rokid CXR-M SDK 开发 AR 健身应用'形随心动'的实践。涵盖 SDK 配置、权限管理、分层架构设计。核心功能包括设备蓝牙连接、实时动作识别与纠正、个性化计划生成、AR 数据可视化及社交挑战。解决了动作识别精度、AR 渲染流畅度及功耗问题。验证了 AI+AR 在居家健身场景的技术可行性与扩展性。
在 Android Studio 中集成 GitHub Copilot GPT-4o 的方法与实战技巧。内容涵盖传统 Android 开发的痛点分析、Copilot 的技术优势、具体配置步骤以及 ViewModel、RecyclerView 适配器和单元测试的代码生成示例。同时提供了性能优化建议、常见问题解决方案及最佳实践,旨在帮助开发者利用 AI 提升编码效率并保证代码质量。

记录基于 Rokid AR 眼镜开发会议纪要助手的完整过程。针对会议时间管理痛点,采用手机端控制加眼镜端显示的架构。使用 Kotlin 语言和 Rokid CXR-M SDK,实现蓝牙连接、议程数据同步及实时计时功能。文章涵盖项目配置、数据模型设计、SDK 封装、主界面逻辑及常见踩坑经验(如蓝牙两阶段连接、后台计时误差、中文乱码等),为 AR 办公场景应用开发提供参考。
介绍如何在 Android 手机上部署 LLaMA-7B 大模型。通过 QNN(Qualcomm Neural Network SDK)框架,结合 GGUF 量化格式,实现端侧推理。内容涵盖开发环境搭建(Python 及 NDK)、模型获取与转换、以及性能优化策略。重点解决了内存管理、Vulkan 加速适配及量化精度权衡等工程问题,旨在帮助开发者将离线 AI 助手集成至移动端应用。
local-dream 项目旨在让安卓设备流畅运行 Stable Diffusion 模型,支持高通骁龙 NPU 加速及 CPU/GPU 推理。提供 txt2img、img2img、inpaint 三大核心功能,兼容多种模型如 Anything V5.0。硬件方面覆盖旗舰及非旗舰芯片,分辨率灵活可选。技术采用高通 QNN SDK 配合 W8A16 量化,以及 MNN 框架配合 W8 动态量化,确保在移动端的高效运行与图像生成质量。

解析了微软 Copilot Cowork 从 Chatbot 向 Agent 的转变,介绍了感知、规划、执行的闭环逻辑。通过 Kotlin 结合大模型 API,演示了如何构建具备任务规划能力的简易 AI Agent,帮助开发者理解 AI 开发新范式并动手实践。
介绍基于大疆 MSDK 实现无人机视觉引导自适应降落的方案。针对部分机型不支持 FlyTo 功能的问题,采用虚拟摇杆模拟导航至目标点。通过视觉识别计算 X/Y 偏移量,结合高度动态调整下降速度与位置修正阈值。高空允许较大偏差快速下降,低空严格对齐并关闭下视避障,最终实现安全精确着陆。
一款开源的日语轻小说自动翻译工具。该工具支持网络小说、文库小说及本地文件的抓取与翻译,集成百度、有道、OpenAI 等多种翻译引擎。系统采用前后端分离架构,前端基于 Vue3+TypeScript,后端使用 Kotlin+Spring Boot,数据存储依赖 MongoDB 和 ElasticSearch。通过 Docker Compose 可实现一键部署。功能涵盖自动采集、多引擎切换、阅读管理及术语自定义等,适合日语小说爱好者搭建个人…