概述
无人机为电网维护提供了高效解决方案,但返航过程中的避障问题面临跨越电力线的挑战,尤其对于计算资源有限的小型无人机而言更为突出。传统视觉系统难以检测纤细、复杂的电力线,常出现漏检或误判。尽管深度学习方法提升了图像中静态电力线的检测效果,但在动态场景下仍难以实时识别碰撞风险。
背景
智能电网的发展对先进检测技术提出了需求,包括攀爬机器人、直升机及无人机(UAV)等。其中,无人机凭借低成本、高效率及精准检测能力,成为应用最广泛的平台。然而,当前无人机通常依赖预设航线,在应急或自定义指令返航任务中,仍缺乏动态避障的自适应能力,尤其在应对交叉电力线时问题突出。
电网企业报告显示,检测无人机在返航过程中频繁发生撞线事故。该问题源于电力线纤细、纹理特征不明显,难以实时感知其碰撞风险。现有的无人机碰撞检测方法,如能耗较高的激光扫描、依赖目标可检测纹理的传统方法,或基于深度学习的电力线检测模型,仍存在显著局限。这些局限因网络架构复杂、对大规模数据集依赖度高,以及电源管理与载荷能力相关的硬件约束而进一步加剧,无法直接应用于电力线场景下高速运动的快速碰撞预警。
在逼近目标检测中,视叶巨运动检测器(LGMD)对目标尺寸并不敏感,但其对逼近目标轮廓的检测依赖于一个假设:逼近目标的轮廓具有高度聚集性。该假设基于以下理念:规则目标的边缘轮廓在运动视觉中,因接近时运动速度更高而呈现连贯且粗壮的特征,而背景运动通常产生稀疏、非相干的视觉刺激。在前期研究中,我们通过引入线性高速轮廓增强技术改进了模型,即逼近电力线检测(LPD)。该方法可从稀疏轮廓中选择性提取线性目标产生的特征。然而,该注意力机制也无意中过滤了非线性目标,限制了其同时检测多尺度障碍物的能力,难以满足实际应用需求。在返航任务中,无人机可能面临交叉电力线、树木、建筑物,甚至其他线路上的作业人员。
因此,需关注所有这些常规与非常规尺寸障碍物的碰撞风险。对于图像处理模型而言,获取跨尺度注意力能力难度较大。若将该复杂任务的要素抽象化,可得到类比场景。在此场景中,LPD 可检测逼近电力线,但对中心具有威胁的立方体不敏感;而引入分布式突触前连接机制的 LGMD(D-LGMD)仅能响应两个常规尺寸的立方体,且对右侧无威胁立方体的响应强于中心威胁立方体。
此外,相机自身运动、位置导致的灵敏度变化等负面因素尚未得到解决。现有文献中,大量研究致力于改进仿生逼近目标检测算法,尤其是在抑制自身运动引发的噪声方面。一种常用方法是通过优化技术估计并补偿相机运动,但这通常需要大量计算资源。Zhao 提出的 D-LGMD 通过角速度判别,解决了无人机敏捷飞行过程中的自身运动噪声问题。
为解决这些局限,本文提出一种带反馈注意力的尺度不变逼近检测器(SILD),扩展了 D-LGMD 的尺寸敏感范围,使其对不同尺寸的逼近目标均能产生一致响应。
如图 2 所示,加法注意力模块在保持对常规尺寸目标响应能力的同时,增强了对小目标(如电力线)的灵敏度;此外,反馈机制提升了刺激响应的精度,尤其针对电力线目标。
新框架解析
本节详细阐述所提模型的架构,其大致可分为三个模块:预处理模块、注意力模块和基于 LGMD 的模块。如图 2 所示,预处理模块对输入图像进行捕获与平滑处理;注意力模块则利用基于 LGMD 的逼近目标检测器生成的注意力图,增强线特征所在潜在区域的权重。注意力图由专用线特征核生成,并反馈至注意力模块。该注意力机制以加法形式实现,使增强后的图像在保留常规尺寸目标细节的同时,强化潜在电力线特征。随后,增强图像被输入基于 LGMD 的模块,该模块对图像速度进行判别,从背景噪声中提取逼近的电力线与障碍物。
值得注意的是,本节通过卷积方程和更复杂的减法公式解释所提模型的数学框架,以更好地模拟神经生物学信号整合过程。该方法将仿生建模与实际实现约束相结合。鉴于我们的目标是构建兼具计算功能与生物合理性的模型,信号过程宜以连续积分形式表示,因为神经递质的作用范围、时延等因素不会像输入图像那样被离散化。在以下小节中,我们首先在 2.1 节分析并解释由位置引起的灵敏度不均问题,然后在 2.2 节描述整体神经网络结构,并在 2.3、2.4 和 2.5 节详细介绍其各组成部分。
为便于复现本研究工作,所提框架的分步实现流程如下:首先执行数据预处理,即从视频帧中读取图像数据,并采用高斯模糊技术降低噪声;随后计算连续帧间的帧差以表示运动信息,再通过矩阵处理对这些帧差进行位置校正。在注意力机制处理阶段,通过卷积提取水平与垂直线特征,施加侧向抑制,并利用最终的注意力掩码增强原始图像中的运动区域。计算 DPC 层以模拟神经层的生物兴奋与抑制机制,生成用于运动检测的视觉信号。分组层通过各向异性核、对兴奋响应进行阈值处理,并积分计算膜电位(MP),从而增强逼近目标信息、抑制噪声并检测逼近威胁。
位置引起的灵敏度不均分析与校正
本节分析并解释由位置导致的图像运动偏差,该偏差会使逼近目标检测器的响应偏离真正的逼近威胁,而偏向擦过性目标。为解决该问题,同时最小化无人机机载系统的计算负载,本文提出一种相对简便的方案:引入基于高斯模型的校正函数。
从图 3 相机(蝗虫)视角可见,当逼近目标向相机靠近时,会穿过相机视场;视场内的角速度由目标速度、距离及角位置共同决定。换言之,这些因素间存在如下关系:
所提视觉系统的架构
图 4 展示了所提视觉系统中的神经通路,该系统始于视网膜的图像采集,随后通过感光器层(photoreceptor layer)、DPC 层和 G 层进行连续处理。
小眼(ommatidia)首先对视野(FOV)内的视觉信息进行平滑处理。接着,注意力被引导至感兴趣区域,以增强图像中的线条特征信号。注意力处理后输出的优化图像包含了电线和常规尺寸物体的信息。
随后,该图像被输入感光器层,视觉运动信息在此被记录,并进一步交由包含兴奋通路与抑制通路的 DPC 层处理。
最后,在滤除衰减的兴奋信号后,LGMD 细胞群会对处理后的图像进行分析,以检测电线、常规尺寸物体等具有威胁性的障碍物。

