跳到主要内容

极客日志面向AI+效率的开发者社区

首页博客 GitHub 精选镜像工具 UI配色美学隐私政策关于联系

搜索内容 / 工具 / 仓库 / 镜像...⌘K 搜索

无人机视觉目标检测数据集 VisDrone 介绍与数据格式转换 | 极客日志

PythonAI算法

无人机视觉目标检测数据集 VisDrone 介绍与数据格式转换

VisDrone 数据集由天津大学推出，涵盖 14 个城市场景，包含行人、车辆等 12 类目标。针对密集小目标和忽略区域，数据集采用白色方块遮挡处理。原始数据为 JPG 加 TXT 标注，需转换为 YOLO 格式方可用于训练。官方提供训练集、验证集及测试集，去除忽略区域后有效类别为 10 类。该数据集适用于无人机视角下的目标检测与跟踪任务研究。

性能调优发布于 2026/4/7更新于 2026/5/2330 浏览

无人机视觉目标检测数据集 VisDrone 介绍与数据格式转换

随着无人机技术的飞速发展，无人机在航拍、监控、农业、物流等领域的应用日益广泛。与此同时，无人机视角下的视觉任务，如目标检测、目标跟踪和场景理解，也成为了计算机视觉研究的热点。然而，相比传统的地面视角数据集，无人机视角下的图像具有高度变化、小目标密集、复杂背景等独特挑战，这对现有算法提出了更高的要求。

数据集概述

为了应对这些挑战并推动无人机视觉技术的发展，天津大学机器学习与数据挖掘实验室推出了 VisDrone 数据集。作为一个大规模、标注精细的无人机视觉数据集，VisDrone 不仅涵盖了丰富的场景和多样化的目标类别，还为研究人员提供了一个极具挑战性的测试平台。该数据集采集自中国 14 个不同城市，覆盖复杂城市场景、交通枢纽、密集人群等多种环境。

文章配图

VisDrone 官方 Github 下载渠道可点击访问：

https://github.com/VisDrone/VisDrone-Dataset?tab=readme-ov-file

下载的数据集包含 VisDrone2019-DET-train、VisDrone2019-DET-val、VisDrone2019-DET-test-dev（均含有标注），以及 VisDrone2019-DET-test-challenge（不含标注）。

训练集：6,471 张图像
验证集：548 张图像
测试集：1610 张图像

数据格式说明

下载下来的原始数据集为 jpg+txt 文件，这里的 txt 不是 YOLO 训练可用的 txt 文件，需要对数据处理后才能使用。

官方共有 12 个分类，其中 ignored regions 为忽略的区域，有些区域包含了密集的很小的目标，无法进行标注，所以我们要把这个区域忽视掉。因此对于这部分内容我们将这个区域从图片中覆盖白色方块进行遮挡。效果如下图。

文章配图

带有白色方块及标注框的效果如下图。

文章配图

同样提供了覆盖白色方块的图片和未覆盖白色方块的图片，用户可根据需求选择使用。

类别定义

others 忽略掉，因此转换后的类别共有 10 类，分别为：

["pedestrian", "people", "bicycle", "car", "van", "truck", "tricycle", "awning-tricycle", "bus", "motor"]

即获取的 YOLO 格式的类别顺序为上述顺序。

下图为训练过程中部分图像。

文章配图

下图为验证过程中部分图像。

文章配图

训练使用原图进行训练，整体精度在 0.4 左右。覆盖了白色方块的精度可自行测试精度。

目录

数据集概述
数据格式说明
类别定义

💰 8折买阿里云服务器限时8折了解详情

Magick API 一键接入全球大模型注册送1000万token查看
🤖 一键搭建Deepseek满血版了解详情
一键打造专属AI 智能体了解详情

极客日志微信公众号二维码

微信扫一扫，关注极客日志

微信公众号「极客日志V2」，在微信中扫描左侧二维码关注。展示文案：极客日志V2 zeeklog

更多推荐文章

JavaScript Fetch API：如何正确克隆 Request 对象
拒绝 AI 味：用 Anthropic Skill 提升前端设计审美
ChatGPT-4 与 GPT-3.5 Prompt 差异分析与设计策略
AI 图像生成指南：从原理到实战
JavaScript 前端基础入门教程
注意力机制与 Transformer 模型实战详解
OpenClaw 对接飞书群机器人配置踩坑：消息不回与 Gateway 断开排查
AI 时代产品经理的能力边界：AI 能做什么与不能做什么
Vue3 自定义 v-model 高级用法：从基础到实战
OpenClaw 飞书接入指南：无需服务器通过长连接运行机器人
智能家居界面美化指南：Home Assistant 主题配置与布局优化
VS Code 前端开发 AI 工具对比：Copilot、通义灵码、iFlyCode 与 Trae
InChIKey 分子指纹：从哈希原理到全球监管合规实战
Stable Diffusion 模型技术深度解析
AI 大模型全解析：定义、架构与核心应用
Java 时间类（上）：JDK7 及以前 Date、SimpleDateFormat、Calendar 详解
LeetCode 927：三等分二进制数组（C 语言版）
2024 年中国 AI 大模型场景应用趋势与行业分析报告
2023 护网行动网络安全技术面试题目汇总
SQL Copilot 搭建实战：利用 AI 助手提升 SQL 编写效率

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online