跳到主要内容2025 无人机四大顶会精选 16 篇前沿论文:IROS ICRA RSS CoRL | 极客日志编程语言AI算法
2025 无人机四大顶会精选 16 篇前沿论文:IROS ICRA RSS CoRL
综述由AI生成2025 年无人机领域从能飞向具身智能演进,本文梳理了 IROS、ICRA、RSS、CoRL 四大顶会的 16 篇代表性论文。核心趋势包括利用扩散模型生成复杂轨迹、基于强化学习的点云避障、视觉语言模型 VLM 零样本导航以及多机协同的去中心化控制。这些工作展示了无人机在感知、规划与决策层面的技术突破,为实际场景中的自主飞行提供了新范式。
协议工匠6 浏览 
过去几年里,无人机研究的重心在悄悄变化,从'能飞'走向'会飞',再走向'敢飞'。更有意思的是,今年大多工作已经不满足于把一个模块做得更准一点,而是在追问更系统的问题:能不能用世界模型把驾驶级别的预测能力引入无人机?能不能用 VLM 直接在图像里点出航路点,从而绕开繁琐训练?能不能用去中心化强化学习让多机协作不依赖通信也能稳定工作?
无人机不再仅仅是在飞,而是在看、在理解、在博弈。本文精选了四大顶会(IROS、ICRA、RSS 和 CoRL)的 16 篇代表性工作,带你一窥无人机如何从自动化机器进化为真正的具身智能体。
01 IROS(4 篇)
Automatic Generation of Aerobatic Flight in Complex Environments via Diffusion Models

机构/团队:浙江大学——高飞团队
这篇论文想解决的是无人机花式飞行在真实复杂环境里落地时的一个老大难:轨迹太长、动作太复杂,靠人工提前设计关键动作既费时又容易翻车。作者提出用扩散模型来自动生成长时域的花式飞行轨迹,但不是直接一口气生成整段轨迹,而是把复杂动作拆成花式动作原语。你可以把它理解成短小的动作片段积木,每块积木里包含一个关键的花式动作模式。模型从历史飞行轨迹里学习这些原语,把过去轨迹当作动态先验,用来保证前后动作衔接自然、不突兀。同时系统还支持加入条件输入,比如给定目标航点,或者给一些可选的动作约束,让生成结果可以被用户编辑和控制,避免完全黑箱。
在推理阶段,为了让生成轨迹能绕开障碍,作者结合了 classifier guidance 引导生成朝更安全更合规的方向走和批量采样,从多条候选里挑出更好的,同时提升避障成功率。最后他们还会做一次时空轨迹优化的后处理,把生成轨迹进一步捏到动力学可执行的范围内,确保真机能飞得出来。
链接:https://arxiv.org/pdf/2504.15138
Flying on Point Clouds with Reinforcement Learning

机构/团队:浙江大学湖州研究院;浙江大学控制科学与工程学院;华北电力大学自动化系
本文提出了一种基于机载激光雷达和强化学习的四旋翼无人机高速自主避障方法。针对室外杂乱环境,作者采用激光雷达直接获取精确几何信息,并利用强化学习实现从感知到底层控制的端到端策略,以 50Hz 频率直接输出控制指令,避免了传统模块化架构的延迟问题。
研究核心在于设计了一种轻量化的点云替代表示,将原始稠密点云压缩为适合强化学习训练的结构,同时保留关键几何特征如狭窄通道与细杆障碍,使策略既能高效学习,又不丢失对细微障碍的感知能力。
实验表明,该方法在仿真中实现了高成功率和复杂穿越能力,并成功通过 sim-to-real 迁移部署至真机,验证了激光雷达加强化学习加低延迟控制在实际场景中的可行性。
链接:https://arxiv.org/pdf/2503.00496
Perception-aware Planning for Quadrotor Flight in Unknown and Feature-limited Environments

机构/团队:哈尔滨工业大学;南方科技大学;微分智飞
本文研究无人机在视觉特征稀疏的退化环境如无纹理走廊、昏暗空间中的自主导航问题。针对此类环境下定位易失效导致规划不可靠的挑战,作者提出了一种新型的感知 - 规划协同框架,其核心是引导无人机在行进中主动维持自身可定位性。
该方法通过构建视点转换图,使无人机能自适应地选择中间视点作为引导,确保始终飞行于特征可见区域,避免陷入定位盲区。同时,规划器不仅生成位置轨迹,还联合优化偏航角朝向,动态权衡探索未知区域与保持特征观测的需求,并利用特征共视性构建可定位走廊,从而在保证状态估计鲁棒性的前提下实现实时计算。
仿真与实物实验表明,该方法能在未知、特征匮乏的复杂环境中有效降低定位误差,可靠导航至目标点。
PI-WAN: A Physics-Informed Wind-Adaptive Network for Quadrotor Dynamics Prediction in Unknown Environments
本文针对四旋翼无人机在真实复杂环境中轨迹跟踪精度不足的问题,指出其根本原因在于动力学模型在未知扰动如风扰、负载变化下不准确。传统模型依赖精确物理参数,而纯数据驱动模型在分布外场景下泛化能力弱。
为此,作者提出了 PI-WAN 模型,其核心是结合物理知识与数据驱动的学习框架。该方法使用时序卷积网络 TCN 学习动力学,并通过在损失函数中注入物理约束,使网络输出符合物理规律,从而提升在未见过风况等扰动下的泛化与适应能力。
该研究的突出价值在于实现了从模型学习到控制提升的闭环:将在线学习的、更准确的动力学模型实时嵌入模型预测控制器 MPC 中,使控制器能依据当前环境动态调整。仿真与真机实验表明,该方法显著提升了轨迹跟踪精度和对未知扰动的鲁棒性,验证了学习更准的模型以实现更稳的控制这一技术路线的有效性。
02 ICRA(4 篇)
A Cooperative Bearing-Rate Approach for Observability-Enhanced Target Motion Estimation
机构/团队:浙江大学;西湖大学 WINDY Lab
本文针对无人机在空中视觉追踪高速机动目标时,因系统可观测性不足导致的估计滞后与目标丢失问题,提出了一种提升估计性能的新方法。
传统方法主要依赖目标方位角 bearing 信息,而本文的核心创新在于系统性地利用了长期被忽视的方位角变化率 bearing rate。该信息能直接反映目标的运动趋势变化,从而有效弥补在目标急剧加速或转向时的可观测性缺失。
基于此,作者设计了面向多机协同场景的 STT-R 估计器,它融合空间三角测量与时间动态信息,并通过分布式递归最小二乘实现各节点在线实时更新与信息共享。这种设计无需复杂感知模型,通过挖掘几何动态信息本身提升了系统的响应能力。
仿真与真机实验表明,该方法能显著减小速度估计的滞后,使追踪系统能够更准确、更敏捷地跟上剧烈机动的目标。其价值在于通过信息融合与算法优化,以较低计算开销实现了对高速动态目标鲁棒追踪能力的提升。
Whole-Body Control Through Narrow Gaps From Pixels To Action
本文研究无人机穿越极端狭窄缝隙宽度接近机体尺寸的高难度控制问题。此类动作要求无人机执行剧烈的姿态调整如大角度横滚,同时精确控制轨迹,对欠驱动系统的全身协调控制能力构成严峻挑战。
作者采用纯数据驱动的思路,旨在训练一个端到端神经网络,实现从像素画面加本体状态到底层控制指令的直接映射。其核心创新在于设计了一套高效的训练流水线:首先在仿真环境中,以易于学习的虚拟点云作为观测,利用强化学习训练出一个掌握穿缝技巧的策略;随后通过在线观测空间蒸馏,将该策略的能力迁移至高维像素输入,使最终策略仅凭相机图像即可决策。
针对训练中探索困难、可行解空间狭窄的问题,方法引入基于模型的轨迹优化器来生成参考轨迹,并在训练过程中将智能体重置至这些轨迹状态,从而大幅提升学习效率与稳定性。该工作通过组合强化学习、知识蒸馏与轨迹优化,系统化地解决了高难度敏捷控制策略的学习难题,为后续仿真到现实的迁移奠定了坚实基础。
A Hierarchical Graph-Based Terrain-Aware Autonomous Navigation Approach for Complementary Multimodal Ground-Aerial Exploration
本文研究地面与空中机器人在未知复杂环境中的自主协同探索问题,重点解决地面机器人因地形阻断如塌方、高差无法前进时,如何高效调度无人机接替探索的决策与协同机制。
作者提出基于分层环境图的表示方法,在多尺度上统一编码几何可达性、语义信息及探索前沿。核心决策依据是一个综合考虑信息增益、地形可通过性与碰撞风险的通行信心指标。当地面平台对前方区域的通行信心低于阈值,而该区域结构上适合无人机飞行时,系统自动触发无人机部署,实现探索任务的接力。
协同过程中,地面机器人通过分层图有选择地向无人机传递经信心评估的关键前沿目标,而非全部地图数据,从而提升决策与信息共享效率。真实地下环境实验表明,该框架能自主实现地空平台的优势互补,显著提升了复杂障碍环境下的整体探索覆盖能力。
Dynamic Perception-Enhanced Motion Planning and Control for UAVs Flights in Challenging Dynamic Environments
本文研究无人机在未知、拥挤且含动态障碍物的复杂环境中的安全导航问题,旨在解决传统静态规划方法在动态场景中易失效,而纯反应式避障又效率低下的根本挑战。
作者提出一套集成的感知 - 规划 - 控制系统,其核心是对静态与动态障碍物进行分离处理与分层响应。首先,系统利用深度图实时分割并跟踪动态障碍物,同时构建 3D 动态 ESDF 地图来表征静态环境。在此基础上,采用两段式策略:先基于静态地图通过 B 样条轨迹优化生成全局参考路径;再通过结合动态控制屏障函数的模型预测控制器实时跟踪该路径,并主动规避移动障碍物。
仿真与真机实验表明,该方案通过静态规划定方向、动态控制保安全的协同机制,在密集动态环境中实现了更可靠、更高效的自主飞行。其价值在于提供了一套完整的系统级解决方案,显著提升了无人机在复杂现实场景中的导航鲁棒性。
How to Coordinate UAVs and UGVs for Efficient Mission Planning? Optimizing Energy-Constrained Cooperative Routing with a DRL Framework
机构/团队:伊利诺伊大学芝加哥分校;美国陆军研究实验室
本文研究无人机与地面车辆在协同执行多任务点巡检时的智能调度问题,旨在解决无人机续航短与地面车辆速度慢的互补平台在大规模任务场景下协同效率低下、传统规划方法可扩展性不足的核心挑战。
作者提出一个基于深度强化学习的可扩展协同框架。其核心创新是引入按飞行架次决策的机制,将复杂的连续时空决策分解为对离散架次的调度,大幅降低了多智能体协同的决策复杂度。该方法采用编码器 - 解码器 Transformer 架构:编码器统一处理任务点、平台状态等信息;解码器则动态选择当前执行任务的主体无人机或地面车,并依据其实时状态如位置、剩余能量输出下一步动作前往任务点或前往会合点充电。
实验表明,该框架在不同任务规模与场景下,其求解质量和计算效率均优于传统启发式方法与强化学习基线,并展现出对任务动态变化的良好适应能力。这为大规模异构机器人团队的高效协同提供了可扩展的新思路。
Flying Hand: End-Effector-Centric Framework for Versatile Aerial Manipulation Teleoperation and Policy Learning
本文针对空中机械臂系统长期存在的定制化程度高、任务与平台绑定严重、缺乏通用控制框架的核心问题,旨在推动空中操作向标准化、可复用的方向发展。
作者提出了 Flying Hand 框架,其核心是采用以末端执行器为中心的统一抽象,将高层任务决策与底层全身控制彻底解耦。具体而言,上层策略如遥操作或学习策略只需输出末端执行器的目标位姿;底层则通过一个末端中心的全身模型预测控制器,驱动全向六旋翼平台与机械臂协同运动,精确实现末端控制目标。
该设计带来了两大优势:一是使遥操作更直观高效,操作者无需关心平台具体姿态;二是为学习策略提供了标准化接口,便于利用演示数据训练可跨任务迁移的策略。真实实验展示了该框架在写字、精细装配插销对孔、抓取放置等多种任务上的通用能力与高精度跟踪性能,验证了其为空中操作构建通用手的系统价值。
Demonstrating ViSafe: Vision-enabled Safety for High-speed Detect and Avoid
本文研究无人机在共享空域内高速飞行时的自主避撞问题,旨在不依赖外部基础设施的前提下,实现可靠、快速的发现与避让。其核心挑战在于,仅凭机载视觉系统需在高速接近的极端条件下,完成从检测、跟踪到避障控制的完整链路。
作者提出了 ViSafe,一套完整的纯视觉端到端避撞系统。该系统集成基于学习的多相机目标检测与跟踪算法,实时感知邻近飞行器;同时,将安全间隔直接建模为严格的实时控制约束,确保即使在高速逼近场景下也能稳定触发避让机动,维持物理安全。
仿真与极端条件下的真实飞行实验如相对速度达 144km/h 表明,该系统能在复杂光照与天气下稳定工作。其价值在于将高速空中避撞从一个算法概念,推进为接近工程可用的全栈解决方案,并为纯视觉感知在安全苛求场景中的应用提供了系统化验证。
RAPID: Robust and Agile Planner Using Inverse Reinforcement Learning for Vision-Based Drone Navigation
本文研究无人机仅依赖机载视觉实现高速、鲁棒的野外穿越导航问题,旨在解决端到端方法中行为克隆易累积误差、而强化学习又奖励设计难与训练效率低的核心矛盾。
作者提出 RAPID 方法,其核心创新是采用逆强化学习框架。该方法并非直接设计奖励函数,而是从高质量专家轨迹中反向推导出隐式的奖励函数,再以此训练策略,从而在保证策略鲁棒性的同时提升训练效率。为获得丰富的专家数据,研究利用特权信息如全局地图和基于运动基元的规划器,在仿真中生成覆盖各种复杂障碍形态的最优轨迹。
该方法的关键工程优势在于其一次训练、直接迁移的能力:策略完全在仿真中训练,无需在真实环境中进行任何调参或再训练。真实森林等环境中的实验表明,该方案能实现平均 7 m/s、最高 8.8 m/s 的激进飞行速度,验证了所提框架在高速视觉导航任务中的有效性与泛化能力,这也是逆强化学习在此类任务中的首次成功应用。
04 CoRL(4 篇)
AT-Drone: Benchmarking Adaptive Teaming in Multi-Drone Pursuit
机构/团队:曼彻斯特大学;上海交通大学;中山大学;南京大学
本文针对多无人机协同追捕中队友不固定、需临时组队的现实需求,指出该领域长期缺乏系统性训练与评测基准的核心问题。现有方法多在固定团队设定下测试,无法有效评估与陌生、异构队友快速形成配合的自适应组队能力。
为此,作者提出了 AT-Drone 基准平台。该平台构建了一个完整的研究闭环,包含四大核心组件:可配置的仿真环境生成器、支持仿真到真机无缝部署的流程、集成的多智能体算法库与训练框架,以及强调在未见过的队友组合上进行泛化测试的标准化评估协议。
该基准通过系统性的仿真与真机实验验证,将临时自适应协同从一个概念转化为可复现、可对比、可落地的标准化研究对象,为发展鲁棒的多智能体协同系统提供了关键的基础设施与评估依据。
Decentralized Aerial Manipulation of a Cable-Suspended Load using Multi-Agent Reinforcement Learning
本文研究多无人机通过绳索协同吊运并精准操控载荷的 6 自由度控制问题,旨在解决传统集中式控制方案因强耦合与不确定性导致的通信依赖强、可扩展性差的核心挑战。
作者提出一种完全去中心化的多智能体强化学习方案。其核心在于,每架无人机仅依赖对载荷位姿的本地观测进行决策,无需与其他无人机通信或获取全局状态,实现了通过载荷动态进行间接协调。为提升从仿真到现实的迁移稳定性,策略输出高层级的线加速度与机体角速度指令,并由一个基于增量非线性动态反演设计的鲁棒底层控制器跟踪执行,以有效补偿模型误差与外界扰动。
真实物理实验表明,该方法在载荷模型不确定、智能体策略异构甚至有机体失效的情况下,均能保持稳定的协同控制性能,其精度可媲美集中式方法。该工作的价值在于,为强耦合、高不确定性的物理协同任务提供了一个通信要求低、可扩展性强且便于实际部署的去中心化解决方案。
See, Point, Fly: A Learning-Free VLM Framework for Universal Unmanned Aerial Navigation
本文提出一种无需任务特定训练、基于现成视觉语言模型的无人机导航框架 SPF,旨在解决传统方法需大量数据训练、且将导航指令转化为文本描述不自然不稳定的核心问题。
该工作的核心创新在于将导航决策重新定义为视觉空间指向问题:系统利用 VLM 直接分析当前图像与语言指令,在图像坐标系中预测出下一步应前往的 2D 路标点,而非生成文本动作指令。随后,结合预测的行进距离,将此 2D 点转换为无人机可执行的 3D 位移指令,并根据场景复杂度自适应调整每一步的飞行距离,实现高效推进。
该纯零样本方法以闭环方式运行,使无人机能实时响应自由形式的语言指令,不仅能抵达固定目标,也能在动态环境中追踪移动目标。其价值在于,首次证明了不依赖任何导航数据训练、仅利用通用 VLM 的空间理解能力,即可实现鲁棒的无人机视觉语言导航,为新一代交互式自主系统提供了新范式。
Mastering Multi-Drone Volleyball through Hierarchical Co-Self-Play Reinforcement Learnin
本文研究多无人机在对抗性体育任务 3v3 排球中的协同控制问题,旨在解决此类任务因长时序决策、强耦合交互与无人机欠驱动特性所带来的核心挑战。
作者提出 HCSP 方法,其核心在于采用分层协同自博弈学习框架,将高层团队策略与低层飞行动作技能进行解耦。高层策略在关键事件节点如击球、过网进行集中式战术决策;低层则为每架无人机配备高频率执行的技能控制器,实现敏捷精确的机动。为使策略与技能从零开始协同进化,方法设计了一个三阶段训练流程:首先生成多样化的底层动作技能库;随后固定技能,通过自博弈学习高层战术调度;最后对两层进行联合微调,实现策略与技能的相互适应。
实验表明,该方法在胜率上显著优于非分层基线及规则式分层方法,并能在对抗中自然涌现出角色分工、阵型协同等智能团队行为,验证了分层协同学习在复杂多智能体控制任务中的有效性与先进性。
05 总结
无人机领域正在形成一种很清晰的上升路线:底层控制与安全边界越来越工程化,中层规划越来越实时并能处理动态不确定性,高层决策越来越像理解任务再行动。
同时,多机系统也在从预先约定好队形和分工走向临时组队也能协作,从靠集中式大脑统一指挥走向每个体都能独立决策但仍能形成整体配合。这意味着未来真实应用里,系统的鲁棒性、扩展性和部署成本会比单次 demo 更重要。
能飞得漂亮当然值得鼓掌,但能长期稳定运行、能迁移到不同平台、能在不可控环境里保持安全,才是无人机具身智能真正要爬的那座山。
相关免费在线工具
- 加密/解密文本
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
- RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
- Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
- 随机西班牙地址生成器
随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online
- Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online
- Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online