电力线场景下无人机返航的尺度不变逼近检测器

综述由AI生成针对无人机在电力线场景下返航避障难的问题，提出一种尺度不变逼近检测器（SILD）。该模型受视叶巨运动检测器（LGMD）启发，结合加法注意力模块与位置校正机制，增强对纤细电力线的灵敏度并抑制背景噪声。实验表明，SILD 能同时检测不同尺度的逼近目标（如电线与障碍物），在嵌入式平台（NVIDIA Orin NX）上实现了精度与实时性的平衡，为复杂环境下的无人机安全返航提供了计算高效的解决方案。

极光发布于 2026/4/5更新于 2026/5/2732 浏览

概述

无人机为电网维护提供了高效解决方案，但返航过程中的避障问题面临跨越电力线的挑战，尤其对于计算资源有限的小型无人机而言更为突出。传统视觉系统难以检测纤细、复杂的电力线，常出现漏检或误判。尽管深度学习方法提升了图像中静态电力线的检测效果，但在动态场景下仍难以实时识别碰撞风险。

背景

智能电网的发展对先进检测技术提出了需求，包括攀爬机器人、直升机及无人机（UAV）等。其中，无人机凭借低成本、高效率及精准检测能力，成为应用最广泛的平台。然而，当前无人机通常依赖预设航线，在应急或自定义指令返航任务中，仍缺乏动态避障的自适应能力，尤其在应对交叉电力线时问题突出。

电网企业报告显示，检测无人机在返航过程中频繁发生撞线事故。该问题源于电力线纤细、纹理特征不明显，难以实时感知其碰撞风险。现有的无人机碰撞检测方法，如能耗较高的激光扫描、依赖目标可检测纹理的传统方法，或基于深度学习的电力线检测模型，仍存在显著局限。这些局限因网络架构复杂、对大规模数据集依赖度高，以及电源管理与载荷能力相关的硬件约束而进一步加剧，无法直接应用于电力线场景下高速运动的快速碰撞预警。

在逼近目标检测中，视叶巨运动检测器（LGMD）对目标尺寸并不敏感，但其对逼近目标轮廓的检测依赖于一个假设：逼近目标的轮廓具有高度聚集性。该假设基于以下理念：规则目标的边缘轮廓在运动视觉中，因接近时运动速度更高而呈现连贯且粗壮的特征，而背景运动通常产生稀疏、非相干的视觉刺激。在前期研究中，我们通过引入线性高速轮廓增强技术改进了模型，即逼近电力线检测（LPD）。该方法可从稀疏轮廓中选择性提取线性目标产生的特征。然而，该注意力机制也无意中过滤了非线性目标，限制了其同时检测多尺度障碍物的能力，难以满足实际应用需求。在返航任务中，无人机可能面临交叉电力线、树木、建筑物，甚至其他线路上的作业人员。

因此，需关注所有这些常规与非常规尺寸障碍物的碰撞风险。对于图像处理模型而言，获取跨尺度注意力能力难度较大。若将该复杂任务的要素抽象化，可得到类比场景。在此场景中，LPD 可检测逼近电力线，但对中心具有威胁的立方体不敏感；而引入分布式突触前连接机制的 LGMD（D-LGMD）仅能响应两个常规尺寸的立方体，且对右侧无威胁立方体的响应强于中心威胁立方体。

此外，相机自身运动、位置导致的灵敏度变化等负面因素尚未得到解决。现有文献中，大量研究致力于改进仿生逼近目标检测算法，尤其是在抑制自身运动引发的噪声方面。一种常用方法是通过优化技术估计并补偿相机运动，但这通常需要大量计算资源。Zhao 提出的 D-LGMD 通过角速度判别，解决了无人机敏捷飞行过程中的自身运动噪声问题。

为解决这些局限，本文提出一种带反馈注意力的尺度不变逼近检测器（SILD），扩展了 D-LGMD 的尺寸敏感范围，使其对不同尺寸的逼近目标均能产生一致响应。

如图 2 所示，加法注意力模块在保持对常规尺寸目标响应能力的同时，增强了对小目标（如电力线）的灵敏度；此外，反馈机制提升了刺激响应的精度，尤其针对电力线目标。

新框架解析

本节详细阐述所提模型的架构，其大致可分为三个模块：预处理模块、注意力模块和基于 LGMD 的模块。如图 2 所示，预处理模块对输入图像进行捕获与平滑处理；注意力模块则利用基于 LGMD 的逼近目标检测器生成的注意力图，增强线特征所在潜在区域的权重。注意力图由专用线特征核生成，并反馈至注意力模块。该注意力机制以加法形式实现，使增强后的图像在保留常规尺寸目标细节的同时，强化潜在电力线特征。随后，增强图像被输入基于 LGMD 的模块，该模块对图像速度进行判别，从背景噪声中提取逼近的电力线与障碍物。

值得注意的是，本节通过卷积方程和更复杂的减法公式解释所提模型的数学框架，以更好地模拟神经生物学信号整合过程。该方法将仿生建模与实际实现约束相结合。鉴于我们的目标是构建兼具计算功能与生物合理性的模型，信号过程宜以连续积分形式表示，因为神经递质的作用范围、时延等因素不会像输入图像那样被离散化。在以下小节中，我们首先在 2.1 节分析并解释由位置引起的灵敏度不均问题，然后在 2.2 节描述整体神经网络结构，并在 2.3、2.4 和 2.5 节详细介绍其各组成部分。

为便于复现本研究工作，所提框架的分步实现流程如下：首先执行数据预处理，即从视频帧中读取图像数据，并采用高斯模糊技术降低噪声；随后计算连续帧间的帧差以表示运动信息，再通过矩阵处理对这些帧差进行位置校正。在注意力机制处理阶段，通过卷积提取水平与垂直线特征，施加侧向抑制，并利用最终的注意力掩码增强原始图像中的运动区域。计算 DPC 层以模拟神经层的生物兴奋与抑制机制，生成用于运动检测的视觉信号。分组层通过各向异性核、对兴奋响应进行阈值处理，并积分计算膜电位（MP），从而增强逼近目标信息、抑制噪声并检测逼近威胁。

位置引起的灵敏度不均分析与校正

本节分析并解释由位置导致的图像运动偏差，该偏差会使逼近目标检测器的响应偏离真正的逼近威胁，而偏向擦过性目标。为解决该问题，同时最小化无人机机载系统的计算负载，本文提出一种相对简便的方案：引入基于高斯模型的校正函数。

从图 3 相机（蝗虫）视角可见，当逼近目标向相机靠近时，会穿过相机视场；视场内的角速度由目标速度、距离及角位置共同决定。换言之，这些因素间存在如下关系：

所提视觉系统的架构

图 4 展示了所提视觉系统中的神经通路，该系统始于视网膜的图像采集，随后通过感光器层（photoreceptor layer）、DPC 层和 G 层进行连续处理。

小眼（ommatidia）首先对视野（FOV）内的视觉信息进行平滑处理。接着，注意力被引导至感兴趣区域，以增强图像中的线条特征信号。注意力处理后输出的优化图像包含了电线和常规尺寸物体的信息。

随后，该图像被输入感光器层，视觉运动信息在此被记录，并进一步交由包含兴奋通路与抑制通路的 DPC 层处理。

最后，在滤除衰减的兴奋信号后，LGMD 细胞群会对处理后的图像进行分析，以检测电线、常规尺寸物体等具有威胁性的障碍物。

电力线场景下无人机返航的尺度不变逼近检测器

概述