
如何在机器人平台上微调与部署 OpenVLA 模型
在机器人平台上微调与部署 OpenVLA 模型的方法。内容包括在 Jetson AGX Orin 上进行 INT4/FP8/FP16 量化测试,使用 NanoLLM 库进行推理 API 调用,以及利用 MimicGen 仿真环境生成合成数据进行 LoRA 或全量微调。通过领域随机化提升模型鲁棒性,并在 Agent Studio 中验证任务成功率,最终实现约…
博客作者
岁月静好
338
已发布文章
11K
博客获赞
903K
博客浏览
第 7 页

在机器人平台上微调与部署 OpenVLA 模型的方法。内容包括在 Jetson AGX Orin 上进行 INT4/FP8/FP16 量化测试,使用 NanoLLM 库进行推理 API 调用,以及利用 MimicGen 仿真环境生成合成数据进行 LoRA 或全量微调。通过领域随机化提升模型鲁棒性,并在 Agent Studio 中验证任务成功率,最终实现约…
详细解析了 MCU、SOC、DSP、FPGA、NPU、GPU 六大核心芯片的定义、架构差异及性能特点。MCU 侧重低功耗控制,SOC 集成度高适合复杂系统,DSP 专攻实时信号处理,FPGA 支持硬件重构,NPU 加速 AI 推理,GPU 擅长并行计算与图形渲染。文章通过功耗、速度、灵活性对比,明确了各芯片在智能家居、智能汽车、通信基站等场景的应用定位,指出…

Google Gemini AI 的会员每日使用额度要求、API 计费方式(按输入输出 token 计算)以及速率限制规则(RPM、TPM、RPD)。同时提醒用户注意模型版本弃用情况,建议迁移至新版。

介绍 Coze 智能体开发平台的工作流搭建方法。涵盖创建工作流的操作路径、名称配置规范及界面布局。详解开始、结束、大模型、插件及工作流五种基础节点的功能与配置,包括参数设置、提示词编写、异常处理等细节。最后通过新闻标题扩展案例演示插件与大模型节点的联动应用,帮助开发者快速掌握可视化编排逻辑。

基于快手万人研发组织的真实实践,探讨了从 AI 代码生成工具到组织级 AI 研发范式的演进路径。文章指出仅推广 AI 工具无法保证组织效能提升,提出了 L1/L2/L3 分级交付体系与端到端效能度量方案。通过重构人、AI、流程的关系,实现了需求交付周期压缩与人均交付增长,为行业规模化落地 AI 研发提供了参照。
使用 Docker 在 Windows 或 Linux 上安装 Neo4j 图数据库的步骤。包括环境准备、创建挂载目录、拉取镜像、启动容器(含端口映射与认证配置)、访问管理界面以及配置远程访问的方法。同时提供了常见问题的解决方案,如端口占用、数据持久化及防火墙设置等注意事项。
前端监控的重要性及实施方法。通过对比无监控与使用专业工具(如 Sentry)的代码示例,阐述了错误监控、性能优化、用户行为跟踪及网络请求监控的最佳实践。强调前端监控不仅是发现问题,更是预防问题和保障质量的关键手段,帮助开发者基于数据驱动决策,提升用户体验。
企业微信群机器人的配置流程,涵盖准备工作(账号权限、群成员数量、网络环境)、创建步骤及基本信息填写规范。通过 Webhook 接口可实现自动化消息推送,帮助团队提升沟通效率。
一种结合人工势场法(APF)与双向RRT*算法的无人机路径规划方案。针对传统RRT在复杂环境中采样效率低、路径曲折的问题,该混合算法利用APF的方向引导优势优化采样策略,并结合双向搜索加速收敛。文章详细拆解了环境建模、势场力计算及树结构实现等核心模块,提供了改进的引力与斥力函数以解决局部极小值和振荡问题,并附带Python代码示例,旨在提升无人机在密集障碍物…
Mac Mini M4 本地 AI 环境搭建指南,涵盖 macOS 更新、Homebrew 安装、Python 虚拟环境配置及 Ollama 部署。支持运行 Mistral 等大语言模型,适用于无云端 GPU 预算或需离线处理的场景,提供命令行操作指引及基础优化建议。

一个包含 650 对图像的无人机光伏缺陷检测双模态数据集,涵盖红外热成像与可见光图像。数据标注采用 YOLO 格式,包含电池片隐裂、热斑、二极管故障等 10 类缺陷。文中提供了红外 - 可见光图像配准脚本(基于 SIFT+RANSAC)以及双模态 YOLO 融合模型的 PyTorch 实现代码,支持光伏电站智能巡检、缺陷定位及预防性维护等应用场景。

对共置 MIMO 汽车雷达在多径反射下产生的幽灵目标问题,将其建模为复合假设检验。提出基于广义似然比检验(GLRT)的检测器结构,推导了理论性能界限及凸波形优化方法。针对未知参数场景,采用稀疏增强压缩感知与 Levenberg-Marquardt 优化进行角度估计。仿真与实验表明,该方法优于传统网格基估计器,能有效消除幽灵目标并保留真实路径。
Faster-Whisper 语音转文字的高效配置方法。通过启用批处理模式、合理选择模型及调整关键参数,可实现 3 倍以上的处理速度提升。文章包含长音频与多语言场景的实战案例,提供内存优化方案、常见问题排查及批量处理脚本,帮助用户快速掌握性能调优技巧。
介绍基于达摩院开源 GTE 中文向量模型,通过 Docker 镜像快速部署中文语义相似度计算服务。方案集成 Flask 构建前后端一体化应用,提供可视化 WebUI 界面与标准 RESTful API 接口。内容涵盖技术背景、镜像启动流程、API 调用示例、批量处理优化建议以及模型底层机制解析。该服务专为 CPU 环境优化,适用于搜索推荐、RAG 检索增强、…

利用腾讯云 AI 代码助手从零构建垃圾图片识别系统的过程。项目基于香橙派开发板,使用 Python 环境及 MobileNet V2 模型进行图像分类训练。通过 Jupyter Notebook 调试,结合 Flask Web API 与 TDesign 前端框架实现交互。文章涵盖了硬件准备、环境部署、模型训练推理及前后端集成等关键步骤,展示了 AI 辅助编…
对国内用户下载 Stable Diffusion 和 LLaMA 模型速度慢的问题,推荐了清华大学 TUNA、阿里云 ModelScope 等国内镜像站点。文章详细对比了各平台特点,并提供了基于 LoRA 技术的完整微调工作流,包括基础模型下载、数据准备、参数配置、训练启动及部署使用。此外还涵盖了显存优化、效果调优等常见问题解决方案,帮助开发者在消费级显卡上…

如何在已有 OpenClaw 服务基础上,通过新建多个机器人实现分工协作,解决单一机器人会话过多导致的遗忘问题。步骤包括:在飞书开发者后台创建新应用并获取凭证;修改 OpenClaw 配置文件以绑定新应用;重启网关验证配置;在飞书后台开启长连接并订阅消息事件;授予必要权限并发布版本;最后进行配对测试与功能验证。最终实现多机器人团队高效协同工作。

AI 大模型应用于专利翻译领域,解决跨语言检索与理解难题。该系统支持全球百种语言自动识别,覆盖主要受理局,重点优化中、英、日、韩互译。核心功能包括原文译文对照编辑、批量导出及历史管理。特色服务涵盖跨语言检索与在线翻译,通过语义对齐技术提升情报获取效率,形成'检索 - 翻译 - 分析'一体化流程,有效降低专业术语偏差,辅助科研人员与代理机构高效处理跨境专利信息…

自然语言转 SQL 技术通过 AI 工具实现开发者与数据库的高效交互。文章分析了传统 SQL 编写痛点,如复杂查询、性能优化及老项目溯源困难。介绍了一种智能数据库搭档方案,支持对话式交互、上下文理解及深度集成。实战演示了添加库表集、数据库设计评审、DDL 生成、Java 实体逆向生成建表语句及变更脚本生成等场景。该方案降低数据查询门槛,提升开发效率,适用于后…

利用 DevUI 与 MateChat 组合方案,实现企业级 AI 助手开发。涵盖架构设计、组件集成、模型对接及性能优化。提供环境搭建、对话界面构建、知识库 RAG 集成等实战步骤,支持 Docker 部署与安全加固。旨在提升开发效率与用户体验,助力云原生时代智能化转型。