
AR 健身教练实践:基于 Rokid CXR-M SDK 的落地实现
基于 Rokid CXR-M SDK 开发 AR 健身教练应用的完整实践。项目旨在解决居家健身缺乏专业指导和沉浸感低的问题,利用 AR 眼镜实现实时动作捕捉、纠正及数据可视化。文章详细阐述了 SDK 的导入配置、权限申请、整体架构设计及核心组件实现,包括设备连接、AI 场景动作识别、自定义 AR 界面渲染、个性化计划生成及社交挑战功能。同时分析了动作识别精度…
博客作者
实时计算工程师
366
已发布文章
13K
博客获赞
822K
博客浏览
第 5 页

基于 Rokid CXR-M SDK 开发 AR 健身教练应用的完整实践。项目旨在解决居家健身缺乏专业指导和沉浸感低的问题,利用 AR 眼镜实现实时动作捕捉、纠正及数据可视化。文章详细阐述了 SDK 的导入配置、权限申请、整体架构设计及核心组件实现,包括设备连接、AI 场景动作识别、自定义 AR 界面渲染、个性化计划生成及社交挑战功能。同时分析了动作识别精度…

2026 年第一季度腾讯控股发布财报,游戏业务总收入 580 亿元,同比增长 22%。AI 技术深度赋能,自研工具提升开发效率,智能 NPC 优化体验。海外扩张加速,东南亚及欧美市场表现强劲。云游戏用户破 5000 万,元宇宙探索初见成效。面临监管、竞争及技术挑战,未来将深化 AI 应用并推进全球化布局。

阐述了人工智能、机器学习与深度学习的层级关系及区别。人工智能是宏观目标,机器学习是其实现途径,深度学习则是利用深层神经网络的具体方法。文章对比了传统规则驱动编程与模型驱动机器学习的差异,指出后者通过数据训练而非显式编码解决问题。同时回顾了 AI 发展的三次浪潮及爆发背后的数据、算法、算力三大基础,并解释了样本、特征、标签等核心术语。理解这些概念有助于把握技术…

DreamZero 是英伟达 GEAR 实验室提出的 140 亿参数世界动作模型,基于视频扩散架构。针对 VLA 模型在物理先验和未见任务泛化上的不足,DreamZero 通过预测未来视频帧来引导动作生成,继承了互联网视频数据的时空物理先验。模型采用自回归扩散 Transformer 结合 Flow Matching 训练目标,并通过异步闭环执行、解耦噪声调…

Virt-A-Mate 是一款由 Meshed VR 开发的虚拟现实交互软件,支持主流 VR 头显设备。其核心特性包括基于物理定律的仿真系统,能实现头发和衣物的真实动态效果,并允许用户自定义角色服装。软件支持 MMD 插件扩展,操作难度较低,侧重于模拟与创作体验。

介绍在 Mac mini M4 上通过 OpenClaw 框架结合 Ollama 运行 Qwen 2.5 模型,利用 WebSocket 接入飞书机器人的私有化部署方案。涵盖环境准备(Node.js、Ollama)、模型选型优化、配置文件修改、飞书事件订阅配置及调试步骤。

一款基于 AI 和 SQL 解析的在线 ER 图生成工具。支持 MySQL 和 SQL Server 语法,可一键将建表语句转换为可视化实体关系图。具备 AI 智能补全字段约束、优化命名及跨数据库适配功能。支持 PNG、PDF、SVG 格式导出及在线编辑,适用于课程设计、毕业设计等学术场景,无需安装软件即可使用。

介绍 Neo4j 5.x 版本 APOC 插件的安装与配置流程。主要步骤包括确认版本、下载匹配 jar 包、放置至 plugins 目录、配置 neo4j.conf 或 apoc.conf 以启用权限。针对 Neo4j 5.x 需独立配置 apoc.conf 的问题提供了解决方案,并通过 apoc.version() 命令验证安装是否成功。
IntelliJ IDEA 中集成的五款主流 AI 辅助工具,包括官方 Jetbrains AI Assistant、GitHub Copilot、通义灵码、Tabnine 和 Sourcery。文章详细分析了各工具的核心亮点、适用人群及安装方式,并提供了针对不同需求(如稳定性、补全能力、中文支持、本地隐私等)的选型建议。同时给出了集成注意事项,帮助用户避免…

介绍 claude-mem 插件,用于解决 Claude Code 上下文遗忘问题。它通过生命周期钩子捕获对话,利用 SQLite 和 ChromaDB 存储记忆,支持自然语言搜索和历史追溯。文章涵盖安装配置、工作原理、Web 管理界面使用及隐私保护机制,帮助开发者实现 AI 编程助手的长期记忆能力。

GitHub Copilot 是 GitHub 推出的 AI 编程助手,支持智能代码补全、自然语言交互及代理模式。介绍其核心能力、主流 IDE(VS Code、IntelliJ、Eclipse)的安装配置、基础使用技巧(快捷键、Chat 对话)、高级功能(自定义指令、模型切换、Smart Actions)、团队管理及常见问题排查。旨在帮助开发者快速上手,提升…
介绍如何在 OpenHarmony 系统中适配 Flutter 的 eip55 三方库,用于实现以太坊地址的 EIP-55 校验和验证。内容涵盖原理分析、安装配置、核心 API 调用及实战示例。重点解决了地址格式校验、大小写混合验证以及在高并发场景下的性能优化(如使用 Isolate),确保数字资产管理中的地址输入安全,防止因手误导致的资产丢失风险。

MIPI 协议是移动产业处理器接口联盟制定的高速串行差分接口协议,广泛应用于 FPGA 图像采集与显示驱动。 MIPI 协议分层架构,重点剖析物理层 D-PHY 的 LP/HS 模式时序规范及 DDR 采样机制,并对比 CSI-2 与 DSI 协议层数据包结构。针对 FPGA 实现,提供了硬核 D-PHY IP 配合软核协议层的首选方案,以及纯软核实现的备选…
为解决智能家居云端数据处理的网络依赖、延迟及隐私问题,介绍基于 KaiwuDB 多模时序数据库与华为 CodeArts 代码智能体的本地化解决方案。通过 VSCode 远程连接与 Docker 部署实现数据库搭建,利用 AI 智能体自动生成设备接入、数据处理、规则引擎及 Web API 模块。系统支持断网运行与本地存储,涵盖传感器数据采集、自动化规则执行及设…
Mochi Diffusion 是专为 macOS 设计的本地 AI 绘画工具,支持在本地运行 Stable Diffusion 模型。利用 Metal 和 Core ML 技术优化性能,兼容 Intel 及 Apple Silicon 芯片。功能包括参数精准控制、多模型切换及批量生成。安装需克隆项目仓库并导入模型文件。主要优势在于数据隐私安全、无网络依赖及…
Ollama v0.17.0 版本发布,核心更新包括 OpenClaw 自动化集成与安装、云模型 Web 搜索插件支持、基于 VRAM 的动态上下文长度分配机制、数据库 Schema 升级至 v14 以及 Tokenizer 性能重构。此外,UI 和 TUI 界面得到优化,支持自动检测环境并配置模型,提升了本地化 AI 部署的易用性与推理效率。
Llama-3.2-3B 基于 Ollama 部署,在显存受限环境下表现优异。文章通过实测对比,展示其在中文摘要、多轮对话及文案生成上接近甚至超越部分 7B 模型的效果。提供一键部署步骤、系统提示词优化、推理参数调优及 API 集成方法,强调小模型在工程落地中的效率与稳定性优势。

使用 Android Studio 和 Kotlin 开发内嵌 WebView 的安卓应用。内容包括项目创建、WebView 集成、本地资源加载以及通过按键事件向 WebView 注入 JavaScript 代码的实现细节。解决了异步初始化导致的空指针问题及网络权限配置问题,实现了在 APP 层捕获按键操作 WebView 内容的功能。
B/S 架构(浏览器/服务器架构)作为现代 Web 应用核心模式的定义与组成。文章阐述了其三层逻辑模型(表示层、业务逻辑层、数据访问层)及工作流程,对比了与传统 C/S 架构在跨平台性、维护成本等方面的优劣。同时分析了 B/S 架构面临的网络依赖、性能瓶颈及安全挑战,并列举了企业信息化、电商、SaaS 等典型应用场景。最后探讨了前后端分离、安全防护、性能优化…
FPGA 加速 Transformer 模型的完整技术方案。首先分析了 Transformer 架构及其在推理过程中面临的计算量大、延迟高、功耗高等挑战,阐述了 FPGA 在低功耗、低延迟和高并行性方面的优势。接着深入探讨了模型压缩与量化策略,包括 INT8 量化、剪枝技术和知识蒸馏,以及硬件友好的全整数算法实现。文章重点讲解了 FPGA 加速器架构设计,涵…