低空无人机车辆目标跟踪技术研究

低空无人机车辆目标跟踪技术旨在解决复杂环境下的小目标漏检、遮挡丢失及资源受限问题。文章综述了目标检测从传统手工特征到深度学习（两阶段 R-CNN、一阶段 YOLO/SSD/DETR）的演进，以及跟踪算法在单目标（相关滤波、孪生网络）和多目标（TBD、JDT、Transformer）领域的现状。研究提出采用 TBD 范式构建端到端网络，融合时序上下文信息，以提升低空场景下车辆检测与轨迹追踪的鲁棒性与实时性，服务于军事侦察与公共安全领域。

HadoopMan发布于 2026/3/22更新于 2026/7/2134 浏览

1.1 选题依据

在科技创新不断突破的背景下，低空无人机作为新兴军事装备，凭借其在战场上的成功运用，正推动战争形态向以智能化远程攻击武器为主导的'非接触战争'演进。传统监视与侦察任务长期依赖人工，存在成本高、效率低、安全风险大等局限。而低空无人机凭借独特的空中视角与灵活机动能力，显著提升了任务效率与安全性。进一步将其与目标跟踪技术相结合，依托广阔视野和先进视觉算法，无人机不仅在军事领域作用突出，也在交通管理等民用领域中展现出广阔潜力，应用场景如图 1-1 所示。

图 1-1 无人机应用场景

低空无人机车辆目标跟踪技术的主要思想是：通过无人机搭载的摄像设备获取视频或图像数据，并借助目标检测、目标跟踪和图像处理等技术，实现对地面车辆目标的实时或准实时识别、定位与持续跟踪。尽管现有目标跟踪技术已相对成熟，但在实际应用环境中，尤其是无人机在低空飞行、复杂背景以及跟踪特定目标情形下，仍面临严峻的技术挑战。

（1）大场景中弱小目标容易漏检

相比于高空平台（如卫星或高空侦察机），低空无人机能提供更优的图像分辨率与更丰富的细节信息，这对精确识别地面车辆至关重要。然而，为保持无人机自身安全性和侦察隐蔽性，飞行高度在 100 至 1000 米之间的低空无人机（根据不同地区特点和实际需要可延伸至 3000 米以内），其所跟踪地面目标在图像中占据极小的像素区域，其特征不明显、细节匮乏，使得传统的跟踪模型表现受限，因此发展高效的小目标跟踪技术尤为迫切。图 1-2 展示了无人机车辆目标跟踪中若干典型的小目标跟踪困难场景。

图 1-2 若干典型小目标场景

（2）地物环境遮挡致目标容易丢失

在复杂环境中，诸如高楼、桥梁、林地等复杂地形地物易对目标车辆造成部分或完全遮挡，导致跟踪过程中断或轨迹漂移。尤其在无人机航拍视角下，目标常被树木、建筑物等频繁遮蔽，使得现有跟踪算法面临严峻考验：其在长时间、重度遮挡后的目标重新识别能力普遍不足，往往导致目标重现时被误判为新目标，引发 ID 切换，难以快速、准确地恢复对原目标的持续跟踪。如图 1-3 所示目标受树木遮挡。

图 1-3 目标受树木遮挡

（3）计算资源受限精度与效率难以平衡

在算法层面，传统计算机视觉方法虽然计算量较轻，但在复杂场景下难以兼顾精度与效率。而新一代深度学习模型虽能实现高精度的检测与跟踪，却因其复杂的网络结构与庞大参数量，对无人机有限的机载计算资源形成了巨大压力。这种精度与效率的矛盾，使得算法在嵌入式边缘设备上难以同时满足高精度与高帧率实时处理的要求。因此，如何在维持模型性能的前提下进行有效的模型轻量化，已成为推动无人机智能感知实际落地的关键瓶颈。

1.2 研究意义

低空无人机车辆目标跟踪技术的研究意义远超单一技术领域范畴，在技术层面它推动着人工智能、边缘计算、图像识别的交叉创新；在应用层面，既能对高价值目标（指挥车、导弹发射车）实现持续监视又能为后方火力平台提供精准目标指示，成为军事变革的关键赋能器。

（1）深化低空无人机场景的计算机视觉理论

传统理论多基于静态或平稳相机，而无人机带来了剧烈运动、视角多变等新问题，研究这些问题必须突破现有框架。低空无人机车辆目标跟踪技术研究，对计算机视觉理论发展而言，是推动其从理论、静态的实验室环境走向复杂、动态真实世界的关键驱动力。该课题在复杂的时空动态场景中针对小目标、频繁遮挡、尺度变化等核心难题，采取基于深度学习的目标检测算法、解决遮挡问题的重识别技术等展开研究，意在推动鲁棒的目标跟踪相关理论发展。这将促使研究超越在规范数据集上表现良好的现有模型，进而探索更具鲁棒性与适应性的特征表达、运动建模及相似性度量方法，从而丰富计算机视觉在复杂真实场景下的理论体系。

（2）探索资源约束下的边缘智能新范式

无人机平台是研究边缘计算的理想载体，然而在'精度 - 速度 - 能耗'这一约束三角难以取得较好的平衡。精度决定跟踪的可靠性，速度决定系统的实时性，能耗则直接制约无人机的续航与部署可行性，三者相互制约。因此，对这一约束三角的深入研究，绝非简单的性能权衡，而是旨在探索资源严格受限条件下智能感知的极限，其突破将催生新一代轻量化、高鲁棒的目标跟踪算法，革新边缘智能计算架构，并建立'可用性'导向的系统评估新范式。这不仅能为无人机平台带来更持久、更智能的'眼睛'，直接促进其在交通管理、应急响应与安防巡逻等关键场景中的实用化落地，同时有望在模型轻量化、神经网络架构搜索及硬件感知设计等方面催生理论创新，为更广泛的边缘 AI 应用提供新的方法论。

（3）赋能军事战略，构建立体监测网络

选择低空无人机车辆目标跟踪研究主要基于无人机平台固有的生态优势：一是立体的监控视角，低空航拍可提供多方位视角，能有效避免地面监控的遮挡问题；二是单架无人机可覆盖数平方公里区域，并且能够跟随目标快速调整位置、高度和视角，适应目标车辆的动态移动；三是相比于卫星等高空侦测设备，低空无人机可快速部署与回收，非常适合临时性、应急性监控任务。作为新兴力量，低空无人机能有效填补卫星遥感（宏观）与地面监控（微观）之间的中观尺度空白，形成'天 - 空 - 地'一体化立体监测网络。

1.3 预期研究成果的学术价值或应用价值

预期成果：本课题通过采用基于检测的跟踪 (Tracking By Detection，TBD) 范式研究低空无人机车辆目标跟踪特性，利用跟踪信息来引导和优化检测过程，形成一个全局优化的、紧密耦合的闭环系统。

在学术层面，本研究致力于设计一种端到端的网络模型，该模型能够显式地建模并利用时序上下文信息。通过在时间维度上融合多帧视觉信息，模型旨在实现对图像中微弱小目标的精准定位，并有效应对短暂遮挡后的目标重现问题。这一研究将系统性地将 TBD 等前沿思想引入低空无人机视觉感知领域，为动态平台下的稳健视觉跟踪提供一种新的方法论与研究范式。

在应用层面，本研究通过深入研究 TBD 框架，提出一种解决低空无人机在复杂高风险环境下从低分辨率图像中提取车辆鲁棒特征的新方法，有助于提升针对地面车辆及编队的跟踪稳定性与可靠性。通过提供持续、稳定的态势数据，该技术能为精确制导武器提供实时高精度目标指示，大幅提升军事打击行动（如'斩首行动'）的成功率。更进一步，该方法通过融合车辆结构、交互关系与运动模式分析，实现对编队整体与个体车辆的协同感知。这不仅能全面赋能战场侦察与情报生成，也可为公共安全领域的车辆追踪与处置提供深度支持，从而推动相关决策领域实现从'看见'到'理解'、再到'精准行动'的能力跨越。

序号	文献信息
1	苑玉彬，吴一全，赵朗月等．基于深度学习的无人机航拍视频多目标检测与跟踪研究进展 [J]．航空学报，2023，44（18）：028334．
2	李永松。交通场景下多目标车辆跟踪方法研究 [D].安徽大学，2024.
3	闫超，涂良辉，王聿豪等。无人机在我国民用领域应用综述 [J].飞行力学。2022,40(3):1-6.
4	芦艳春，周开园，张建杰。无人机的发展现状及其在航空应急救援领域的应用综述 [J].医疗卫生装备.2023,44(10):109-113.
5	Erhan D, Szegedy C,Toshev A,et a1．Scalable object detection using deep neural networks[C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2014:2147-2154.
6	Dalal N, Triggs B. Histograms of oriented gradients for human detection[C]//2005 IEEE computer society conference on computer vision and pattern recognition (CVPR'05). IEEE, 2005, 1: 886-893.
7	何松华，章阳。基于快速检测和 AdaBoost 的车辆检测 [J]. 计算机工程与设计，2020,41(1): 203-207.
8	Song K, Zhu F,Song L. Moving target detection algorithm based on SIFT feature matching[C]//2022 International Conference on Frontiers of Artificial Intelligence and Machine Learning (FAIML), 2022: 196-199.
9	Bay H, Tuytelaars T, Gool L J V. SURF: speeded up robust features[J]. Computer Vision & Image Understanding,2006,110 (2):404-417.
10	Xu J, Stirenko S. Mixup Feature: a pretext task self-supervised learning method for enhanced visual feature learning[J]. IEEE Access, 2023, 11: 82400-82409.
11	Deng H, Wang H, Ji Y, et al. Research on uav detection and classification based on time frequency analysis and support sector machine[C]//2023 8th International Conference on Computer and Communication Systems (ICCCS), 2023: 539-543.
12	Wang W, Sun D. The improved adaboost algorithms for imbalanced data classification[J]. Information Sciences, 2021, 563: 358-374.
13	Zhang S. Cost-sensitive KNN classification[J]. Neurocomputing, 2020, 391: 234-242.
14	Viola P, Jones M J. Robust real-time face detection[J]. International journal of computer vision, 2004, 57: 137-154.
15	Felzenszwalb P F, Girshick R B, McAllester D, et al. Object detection with discriminatively trained part-based models[J]. IEEE transactions on pattern analysis and machine intelligence, 2009, 32(9): 1627-1645.
16	Elgammal A, Duraiswami R, et al. Background and foreground modeling using nonparametric kernel density estimation for visual surveillance[J]. Computer Science, 2002, 90(7）:1151-1163.
17	Fukushima K. Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J]. Biological cybernetics, 1980, 36(4): 193-202.
18	Krizhevsky, A, Sutskever, et al. ImageNet classification with deep convolutional neural networks[J]. Communications of the ACM,2017,Vol.60(6): 84-90.
19	Girshick R, Donahue J, Darrell T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]. Proceedings of the IEEE conference on computer vision and pattern recognition, Columbus, 2014: 580-587.
20	He K, Zhang X, Ren S, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[J]. IEEE transactions on pattern analysis and machine intelligence, 2015, 37(9): 1904-1916.
21	Girshick R. Fast R-CNN[C]. Proceedings of the IEEE international conference on computer vision, Santiago, Chile, 2015: 1440-1448.
22	Ren, SQ (Ren, Shaoqing), et al. Faster R-CNN: Towards real-time object detection with region proposal Networks[J]. IEEE transactions on pattern analysis and machine intelligence, 2017,Vol.39(6): 1137-1149.
23	Chaoxu Guo, Bin Fan, Qian Zhang, et al. AugFPN: Improving multi-scale feature learning for object detection[J]. 2019.
24	Ma, HaoyangCAa,Yang,et al. Automatic extraction of discolored tree crowns based on an improved Faster-RCNN algorithm[J]. Forests,2025,Vol.16(3): 382.
25	Christian Szegedy, Sergey loffe, Vincent Vanhoucke, et al. Inception-v4, Inception-ResNet and the impact of residual connections on learning[J]. 2016.
26	Pierre Sermanet, David Eigen, Xiang Zhang, et al. OverFeat: Integrated recognition, localization and detection using convolutional networks[J]. 2014.
27	Redmon J, Divvala S, Girshick R, Farhadi A. You only look once: unified, real-time object detection. IEEE Conference on Computer Vision & Pattern Recognition. IEEE, 2016:779-788.
28	Rahima Khanam, Muhammad Hussain. YOLOv11: An overview of the key architectural enhancements[J].arXiv preprint arXiv:2410.17725v1 [cs.CV], Oct. 2024.
29	Yunjie Tian, Qixiang Ye, David Doermann. YOLOv12: Attention-centric real-time object detectors[J].arXiv preprint arXiv:2502.12524v1 [cs.CV], Feb. 2025.
30	Hongyu Zhang, Lixia Deng, Shoujun Lin, et al. LES-YOLO: efficient object detection algorithm used on UAV for traffic monitoring[J]. Measurement Science and Technology,2025,Vol.36(1): 016008.
31	白宇，周艳媛，安胜彪。改进 YOLOv5 的无人机小目标检测方法研究［J］. 计算机工程与应用，2024，60（10）：276-284.
32	Yunzuo Zhang, Cunyu Wu, Wei Guo, et al. CFANet：Efficient Detection of UAV Image Based on Cross-layer Feature Aggregation[J]. IEEE Transactions on Geoscience and Remote Sensing,2023,Vol.61: 1.
33	王宁，智敏。深度学习下的单阶段通用目标检测算法研究综述 [J]. 计算机科学与探索，2025,19(5): 1115-1140.
34	Liu W,Anguelov D, Erhan D, et al. SSD: single shot multibox detector[C]//European Conference on Computer Vision.2016:21-37.
35	胡焱，原子昊，涂晓光，等。基于对比学习的改进 SSD 目标检测算法 [J]. 红外技术，2024,46(5): 548-555.
36	付玉彤。低空环境下的无人机动态目标跟踪算法研究 [D]. 中国民航大学，2024.
37	Carion N, Massa F, Synnaeve G, et al. End-to-end object detection with transformers[C]//Proceedings of the 16th European Conference on Computer Vision. Cham: Springer, 2020: 213-229.
38	Li F, Zeng A L, Liu S L, et al. Lite DETR: an interleaved multi- scale encoder for efficient DETR[C]//Proceedings of the 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2023: 18558-18567.
39	Zhang M Y, Song G L, Liu Y, et al. Decoupled DETR: spatially disentangling localization and classification for improved end-to- end object detection[C]//Proceedings of the 2023 IEEE/CVF International Conference on Computer Vision. Piscataway: IEEE, 2023: 6578-6587.
40	Ouyang, Haodong. DEYO: Detr with yolo for end-to-end object Detection[J]. arXiv,2024.
41	Bolme D S, Beveridge J R, Draper B A, et al. Visual object tracking using adaptive correlation filters[C]//2010 IEEE computer society conference on computer vision and pattern recognition. IEEE, 2010: 2544-2550.
42	张雷，王延杰，孙宏海，姚志军，吴培。采用核相关滤波器的自适应尺度目标跟踪 [J].光学精密工程，2016,24(02):448-459.
43	胡云层，路红，杨晨，花湘，彭俊。融合 DSST 和 KCF 的尺度自适应跟踪算法 [J].计算机工程与设计，2019,40(12):3563-3568.
44	Li Y, Zhu J. A scale adaptive kernel correlation filter tracker with feature integration[C]. ECCV workshops,2014: 254-265.
45	Danelljan M, Häger G, Khan F S, et al. Discriminative scale space tracking [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(8): 1561-75.
46	Danelljan M, Robinson A, Shahbaz Khan F, et al. Beyond correlation filters: Learning continuous convolution operators for visual tracking[c]//Computer Vision-Eccv 2016:14th European Coference, Amsterdam, The Netherlands, October 11-14, 2016, Proceedings,Part V14. Springer International Publishing, 2016: 472-488.
47	Bing He, Fasheng Wang, Xing Wang, et al. Temporal context and environment-aware correlation filter for uav object tracking[J]. IEEE Transactions on Geoscience and Remote Sensing,2024,Vol.62: 1-15.
48	Chen, Lin, Liu, et al. A robust spatial-temporal correlation filter tracker for efficient UAV visual tracking.[J]. Applied Intelligence,2023,Vol.53(4): 4415-4430.
49	Xiao, Zhuo, Yang, et al. Foreground aware correlation filter with adaptive feature response fusion for real-time uav tracking[C]//2024 27th International Conference on Information Fusion (FUSION). 2024.
50	邵延华，陈慧玲，付贵，等。融合图像增强的正则化相关滤波无人机目标跟踪 [J]. 中国图象图形学报，2025,(10): 3302-3318.
51	贺冰，王法胜，王星，等。显著性感知三重正则化相关滤波无人机目标跟踪算法 [J]. 北京航空航天大学学报，2025,51(7): 2423-2436.
52	Bertinetto L, Valmadre J, Henriques J F, et al. Fully-convolutional siamese networks for object tracking[C]//14th European Conference on Computer Vision Amsterdam Netherland,Spinger,2016:850-865
53	Li B, Yan J, Wu W, et al. High performance visual tracking with siamese region proposal network[C]// Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 8971-8980.
54	Weiming Hu, Qiang Wang, Li Zhang, et al. SiamMask: A framework for fast online object tracking and segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2023,Vol.45(3): 3072-3089.
55	Xu Y, Wang Z, Li Z, et al. Siamfc++: Towards robust and accurate visual tracking with target estimation guidelines[C]. Proceedings of the AAAI conference on artificial intelligence. 2020, 34(07): 12549-12556.
56	Zhu, Mu, Zhang, et al. Multi-level prediction siamese network for real-time uav visual tracking.[J]. Image & Vision Computing,2020,Vol.103: 104002.
57	Lifan Sun, Jinjin Zhang, Zhe Yang, et al. A motion-aware siamese framework for unmanned aerial vehicle tracking[J]. Drones,2023,Vol.7(153): 153.
58	Wu, Wanying, Zhong,et al. Fisher pruning for real-time uav tracking[C]//2022 International Joint Conference on Neural Networks (IJCNN). 2022.
59	罗小兰。无人机对地多移动目标的视觉识别跟踪技术研究 [D].电子科技大学，2022.
60	Bewley A, Ge Z, Ott L, et al. Simple online and realtime tracking[C]//2016 IEEE international conference on image processing (ICIP). IEEE, 2016: 3464-3468.
61	Wojke N, Bewley A, Paulus D. Simple online and realtime tracking with a deep association metric[C]//2017 IEEE international conference on image processing (ICIP). IEEE, 2017: 3645-3649.
62	Zhang Y, Sun P, Jiang Y, et al. Bytetrack: Multi-object tracking by associating every detection box[C]//European Conference on Computer Vision. Cham: Springer Nature Switzerland, 2022: 1-21.
63	Hamidreza Hashempoor, Rosemary Koikara, Yu Dong Hwang. FeatureSORT: Essential features for effective tracking[J]. 2024.arXiv:2407.04249 [cs.CV], Sept. 2025.
64	Aharon, Nir, Orfaig, et al. BoT-SORT: Robust associations multi-pedestrian tracking[J]. arXiv,2022.
65	Liu, Shuai, Li, et al. Multi-object tracking meets moving uav[C]//2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2022.
66	Wang Z, Zheng L, Liu Y, et al. Towards real-time multi-object tracking[C]//European Conference on Computer Vision. Cham: Springer International Publishing, 2020: 107-122.
67	Zhou X, Koltun V, Krähenbühl P. Tracking objects as points [C]. Proceedings of the European Conference on Computer Vision.2020: 474-490.
68	Zhang Y, Wang C, Wang X, et al. FairMOT: On the fairness of detection and re-identification in multiple object tracking[J]. International Journal of Computer Vision, 2021, 129: 3069-3087.
69	Peize Sun, Jinkun Cao, Yi Jiang, et al. TransTrack: Multiple object tracking with transformer[J]. 2021.arXiv preprint, arXiv:2012.15460v2 [cs.CV], May. 2021.
70	Xufeng Hu, Younghoon Jeon, Jeonghwan Gwak. FFTransMOT: Feature-fused transformer for enhanced multi-object tracking[J]. IEEE Access,2023,11: 130060-130071.

低空无人机车辆目标跟踪技术研究

1.1 选题依据

1.2 研究意义

1.3 预期研究成果的学术价值或应用价值

更多推荐文章

相关免费在线工具

2.1 无人机目标检测研究现状分析

2.1.1 基于传统手工设计特征的方法

2.1.2 基于深度学习的目标检测算法

2.2 无人机目标跟踪研究现状分析

2.2.1 单目标跟踪研究现状

2.2.2 多目标跟踪研究现状

引用文献

更多推荐文章

相关免费在线工具

低空无人机车辆目标跟踪技术研究

1.1 选题依据

1.2 研究意义

1.3 预期研究成果的学术价值或应用价值

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.1 无人机目标检测研究现状分析

2.1.1 基于传统手工设计特征的方法

2.1.2 基于深度学习的目标检测算法

2.2 无人机目标跟踪研究现状分析

2.2.1 单目标跟踪研究现状

2.2.2 多目标跟踪研究现状

引用文献

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具