跳到主要内容

极客日志面向AI+效率的开发者社区

首页博客 GitHub 精选镜像 AI 生图工具 UI配色美学隐私政策关于联系

搜索内容 / 工具 / 仓库 / 镜像...⌘K 搜索

无人机视觉目标检测数据集 VisDrone 介绍与数据格式转换 | 极客日志

PythonAI算法

无人机视觉目标检测数据集 VisDrone 介绍与数据格式转换

天津大学推出的 VisDrone 无人机视觉数据集，涵盖航拍、监控等场景。数据集包含训练、验证及测试集，共约 8600 余张图像。针对小目标密集和复杂背景挑战，提供了 10 类目标标注（排除忽略区域），并说明了白色方块遮挡处理。数据格式支持 YOLO 训练，官方提供原始数据下载链接，适合计算机视觉目标检测研究。

城市逃兵发布于 2026/4/6更新于 2026/7/2045 浏览

无人机视觉目标检测数据集 VisDrone 介绍与数据格式转换

随着无人机技术的飞速发展，无人机在航拍、监控、农业、物流等领域的应用日益广泛。与此同时，无人机视角下的视觉任务，如目标检测、目标跟踪和场景理解，也成为了计算机视觉研究的热点。然而，相比传统的地面视角数据集，无人机视角下的图像具有高度变化、小目标密集、复杂背景等独特挑战，这对现有算法提出了更高的要求。

为了应对这些挑战并推动无人机视觉技术的发展，天津大学机器学习与数据挖掘实验室推出了 VisDrone 数据集。作为一个大规模、标注精细的无人机视觉数据集，VisDrone 不仅涵盖了丰富的场景和多样化的目标类别，还为研究人员提供了一个极具挑战性的测试平台。无论是小目标检测的精度提升，还是密集场景下的鲁棒性优化，VisDrone 都成为了学术界和工业界不可或缺的资源。该数据集采集自中国 14 个不同城市，覆盖复杂城市场景、交通枢纽、密集人群等多种环境。

文章配图

VisDrone 官方 Github 下载渠道：

https://github.com/VisDrone/VisDrone-Dataset?tab=readme-ov-file

下载的数据集包含 VisDrone2019-DET-train、VisDrone2019-DET-val、VisDrone2019-DET-test-dev（均含有标注）以及 VisDrone2019-DET-test-challenge（不含标注）。

训练集：6,471 张图像
验证集：548 张图像
测试集：1610 张图像

原始数据集为 JPG+TXT 文件，这里的 TXT 不是 YOLO 训练直接可用的格式，需要对数据处理后才能使用。处理后的数据通常包含原图和覆盖白色方块的图两个文件夹，用户可自行选择使用。

官方共有 12 个分类，其中 ignored regions 为忽略的区域。有些区域包含了密集的很小的目标，无法进行标注，因此需要将这部分内容从图片中覆盖白色方块进行遮挡。效果如下图。

文章配图

带有白色方块及标注框的效果如下图。

文章配图

others 类被忽略掉，因此转换后的类别共有 10 类，分别为：

["pedestrian", "people", "bicycle", "car", "van", "truck", "tricycle", "awning-tricycle", "bus", "motor"]

即获取的 YOLO 格式的类别顺序为上述顺序。

下图为训练过程中部分图像。

文章配图

下图为验证过程中部分图像。

文章配图

训练使用原图进行训练，整体精度在 0.4 左右。覆盖了白色方块的图片精度需自行测试。如需原始数据集，可访问官网获取。

免费图片AI生成工具免费生成了解详情

Magick API 一键接入全球大模型注册送1000万token查看
免费图片视频在线生成30秒，将你的创意变成现实开始设计
X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
100+免费在线小游戏爽一把

极客日志微信公众号二维码

微信扫一扫，关注极客日志

微信公众号「极客日志V2」，在微信中扫描左侧二维码关注。展示文案：极客日志V2 zeeklog

更多推荐文章

数据结构核心：顺序表的原理与实现
Python 实现 MCP 客户端调用高德地图天气查询示例
GPEN 断点续传功能设计与实现思路
C++ 入门：引用、内联函数与 C++11 新特性详解
实测 ToClaw 信息检索与分析能力：AI 实现先找再写
动态规划专题：回文串问题与区间 DP 实战
Meta Llama 系列深度解析：开源大模型事实标准与架构演进
C++位图与布隆过滤器实现及应用
llama.cpp 量化大模型内网部署与运行实战
Flutter 三方库 langchain_google 的鸿蒙化适配指南
5 款实用的 Nano Banana 提示词资源网站及生成技巧
C++ 二叉搜索树：概念、性能分析与核心实现
Selenium webdriver_manager 浏览器驱动管理指南
Bodymovin 开源动画转换工具跨平台集成方案
2025 无人机四大顶会 16 篇精选论文解读
机器人开源项目精选：覆盖科研、教育、工业与医疗的66个仓库
2024 年人工智能大模型发展回顾与展望
Flink 实时计算心智模型：流、窗口、水位线、状态与 Checkpoint 协作
Selenium 动态数据抓取与 JS 逆向解密实战
OpenClaw 接入飞书机器人并部署 Ollama 本地大模型实战

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online