
近半年无人机与大模型结合的 8 项前沿研究盘点
无人机与大模型结合成为近期热点。盘点了近半年八项代表性研究,涵盖机载视觉语言动作框架 VLA-AN、语义导航 AirHunt、开放环境扫描 FlyCo、低空场景评测 MM-UAVBENCH 及 UAVBench、人机交互 Chat with UAV、提示词适配 AdaptFly 以及端边云协同 CoDrone。这些工作解决了算力受限、推理频率不匹配、开放世界…
博客作者
系统监控工程师
351
已发布文章
14K
博客获赞
515K
博客浏览
第 3 页

无人机与大模型结合成为近期热点。盘点了近半年八项代表性研究,涵盖机载视觉语言动作框架 VLA-AN、语义导航 AirHunt、开放环境扫描 FlyCo、低空场景评测 MM-UAVBENCH 及 UAVBench、人机交互 Chat with UAV、提示词适配 AdaptFly 以及端边云协同 CoDrone。这些工作解决了算力受限、推理频率不匹配、开放世界…

Trae IDE 提供丰富的内置模型与自定义接入能力,涵盖国内免费与国际分级收费模式。文章详解模型切换、性能对比及适用场景,支持 Java、Python、前端等多语言开发,并介绍智能体 Agent 功能与竞品差异,帮助开发者根据成本与需求优化 AI 编程工作流。

OpenClaw 接入飞书机器人涉及应用创建、凭证获取、权限配置及渠道绑定。本文详述了从企业自建应用到事件订阅的完整流程,并提供了命令行工具的配置步骤与测试方法,帮助开发者快速实现飞书渠道的消息收发功能。

基于高阶控制障碍函数(HOCBF)的端到端无人机高速避障框架。训练阶段采用 PPO 强化学习结合 Dijkstra 全局引导奖励与安全惩罚,解决局部最优问题;部署阶段引入 HOCBF 实时滤波器对神经网络动作进行硬性约束,确保碰撞避免数学保证。实验表明该方法在仿真及实机测试中均优于传统规划器 Ego-Planner 和纯学习方案 DiffPhys,在复杂丛林…

如何在 Linux Ubuntu 环境下通过 Docker 部署 Web-Check 网站检测工具,并利用 cpolar 内网穿透实现公网远程访问。内容涵盖 Docker 安装、Compose 配置、本地测试及两种公网访问方案(随机域名与固定子域名)。该方案无需公网 IP 即可安全暴露内网服务,便于团队异地协作与持续监控。

记录了基于立创 EDA 进行 6 层高速 PCB 设计的完整流程。涵盖电源树分析、模块布局、叠层设置、阻抗控制及 DDR3/HDMI 等高速信号布线规范。重点讲解了 FPGA 与 ARM 异构架构下的电源完整性处理、差分对等长调节策略以及 DRC 检查优化技巧,为硬件开发者提供实用的参考方案。
Vibe Coding 的「势」:从自动补全到 Copilot 的技术与职业全景 > 面向对象:小白:能看懂行业趋势、基础概念、如何上手技术大牛:能看到技术演进脉络、架构与能力边界、对个人能力模型的冲击 * * 一、课程核心:什么是「势」,为什么在 AI Coding 时代特别重要? 1\. 「势」的定义 文档给出的核心定义可以概括为: > **势 = 事物…
一、WebMCP是什么 1\. 基本定义 WebMCP(Web Model Context Protocol)是**Google与Microsoft在W3C框架下联合推动的浏览器原生Web API**,Chrome 146已推出早期预览版本,核心目标是让网页主动将自身能力封装为结构化工具,供AI Agent直接调用,解决当前Agent操作网页的稳定性与效率问…

解决方法: 卸载VSCode自带的Github Copilot插件,在已安装的插件列表中选择卸载。 打开Setting,搜索github,勾选"Chat:Disable AI Features"选项。 !在这里插入图片描述
摘要 2026 年,AIGC 从'玩具'走向'工具'。企业主面临着一个新的'不可能三角':**高质量(Quality)、低成本(Cost)、高速度(Speed)**。将拆解 **大香蕉 (Banana Pro)** 模型如何凭借谷歌 Gemini 3 的底层能力与 **xingjiabiapi.org** 的架构优化,在电商、内容矩阵、品牌设计三大场景中实现…

**摘要**: 大数据时代,数据之间的**关系**往往比数据本身更有价值。传统的 SQL 数据库在处理复杂关系(如社交网络、推荐系统、风控分析)时显得力不从心,而 **知识图谱** 和 **图数据库 Neo4j** 正是为此而生。将带你从 0 基础出发,理解知识图谱核心概念,安装 Neo4j 环境,并手把手教你用 Python 代码构建一个生动的人物关系图谱…

摘要 作为一名长期关注 AI 技术发展的开发者,我见证了从 GAN 到 DALL-E,再到 Stable Diffusion 的图像生成技术演进历程。而今天,当我深入体验字节跳动最新发布的豆包 Seedream 4.0 时,我被这项技术的突破性表现深深震撼了。这不仅仅是一次简单的版本迭代,而是 AI 绘画领域的一次革命性跃进。 通过我使用中华田园犬和三花猫素…
接下来看一下前端的代码输出。 前端结构 前端生成的位置经过指令指示,要求放到已有的工具模块下,生成的位置是准确的,如下:  API 前后端交互的 API,AI 并没有参照项目现有情…
**随着 AI 辅助编程工具的兴起,开发体验正被彻底改变,Claude 作为一款强大的大语言模型,不仅能够理解上下文,还能给出贴合需求的代码和优化建议。** 把 Claude 无缝接入到 VSCode 这样主流的编辑器中,就等于为开发过程装上了'智能外挂'。本篇文章将带你快速完成 VSCode 与 Claude Code 的配置,让你的开发效率实现质的飞跃。…

一、技术基石:Java 大数据赋能智能家居的'三位一体'架构 要实现'设备联动 + 场景节能',必须先解决三个核心问题:设备数据怎么稳定收?联动规则怎么快速算?节能策略怎么精准优?基于 Java 生态构建的'采集 - 计算 - 决策'三位一体架构,经多项目压测验证,可支撑百万级设备并发接入,实时计算延迟≤500ms。 1.1 架构全景图 !架构图 1.2 核…
AI 辅助架构设计:多链钱包开发方案与安全提示 开发一个支持多链的去中心化钱包应用确实是个复杂工程,尤其是像 imToken 这样的成熟产品,需要考虑的细节非常多。利用 AI 辅助工具梳理这类项目的架构设计,能提供不少实用建议,下面分享下实践心得。 项目目录结构设计 合理的目录结构是项目可维护性的基础。通过 AI 辅助分析,得到了一个清晰的多链钱包项目结构建…

介绍如何使用 OpenClaw 本地 AI 智能体配合 cpolar 内网穿透工具,实现远程访问家庭 AI 服务、NAS 资源及 Windows 远程桌面。通过配置通用 MaaS 平台接口,用户可在无公网 IP 环境下,利用命令行快速搭建本地 AI 环境,并通过自然语言指令控制网络服务,满足移动办公与娱乐需求。
如何在 OpenHarmony 系统中集成 Flutter 第三方库 anthropic_sdk_dart,以调用 Anthropic 公司的 Claude 3.x 大模型。内容涵盖 SDK 原理、安装配置、核心 API 使用(包括流式响应)、视觉助手及 Tool Use 场景,并针对网络延迟、Proxy 策略及多模态数据传输提出了适配建议。通过实战代码示例…

在 2026 年巴塞罗那世界移动通信大会上,荣耀展示了 Robot Phone 概念机及首款人形机器人 ROBOT。Robot Phone 配备机械臂摄像头,支持环境感知与手势识别。ROBOT 具备人机交互与运动控制能力。荣耀通过构建 AHI 理念,旨在从单一终端向跨设备 AI 生态系统转型,实现数据与服务在手机和机器人间的无缝共享。这标志着荣耀正式进军具身…
whisperX 是基于 OpenAI Whisper 的语音识别工具,提供单词级时间戳和说话人区分功能。介绍环境搭建(Python 3.10, PyTorch, CUDA)、命令行使用及 Python API 集成方法。支持批处理推理、VAD 预处理及多语言识别。常见问题包括 GPU 内存不足、Speaker 区分效果不佳及时间戳不准确,可通过调整模型大小…