无人机系统面临着复杂多变的环境挑战,如动态障碍物、风扰、系统故障等,传统的基于精确模型的控制方法往往难以适应这些不确定性。为此,学习与控制相结合的智能方法成为研究热点。
在刚刚结束的 IROS 2025 上,涌现了大量关于单体无人机与多智能体协同学习与控制的研究,展现了系统在自主性与适应性方面的最新进展。
单体无人机
一、基于学习的动态模型
PI-WAN: A Physics-Informed Wind-Adaptive Network for Quadrotor Dynamics Prediction in Unknown Environments (IROS 2025)
国防科技大学牛轶峰团队针对四旋翼在未知风扰环境中建模不准、数据驱动方法泛化差的问题,提出物理信息风自适应网络。该方法将物理约束嵌入训练过程,结合 TCN 捕获时序特征,提升模型在未见条件下的泛化与鲁棒性。仿真和现实实验表明,该网络集成至 MPC 控制器后,显著提高了轨迹跟踪精度。

在风扇产生未知外部风场干扰的环境中,采用所提方法控制的四旋翼无人机成功实现了对圆形轨迹的追踪。

真实环境实验系统由四旋翼机架、CUAV Nora+ 飞行控制器及 Xavier NX 机载计算机组成。
二、基于学习的运动规划
Automatic Generation of Aerobatic Flight in Complex Environments via Diffusion Models (IROS 2025)
浙江大学高飞团队提出基于扩散模型的特技飞行自动化生成框架。该方法将特技分解为可组合基元,结合历史轨迹先验与条件引导确保连续性,并通过分类器引导避障与分层优化保证动态可行性。仿真与真实实验结果表明,该方法在工厂、车间等复杂环境中实现了超过 99% 的避障成功率,生成了多样且物理可行的长轨迹,并成功部署于真实无人机。

我们的方法实现了连续长时域特技飞行动作的自动生成,使无人机能够以动态可行的运动穿越复杂工业厂房。

一架四旋翼无人机在真实世界中执行特技飞行轨迹的快照,所展示的五个不同飞行动作均由所提方法实时生成。
三、基于学习的控制器
1. 基于安全强化学习的策略优化
A Safety-Adjusted Policy Optimization Algorithm and Application for Obstacle Avoidance in the Quadcopter (IROS 2025)
四川大学杨鑫松老师与北京航空航天大学董希旺老师团队提出安全调整策略优化(SAPO),采用双策略框架,通过成本策略动态调整奖励策略,结合 KL 散度与高斯核提升性能。在四旋翼避障任务中,SAPO 在满足零成本约束的同时取得高回报,性能优于基线方法,并通过仿真与实物实验验证。



