跳到主要内容

极客日志面向AI+效率的开发者社区

首页博客 GitHub 精选镜像 AI 生图工具 UI配色美学隐私政策关于联系

搜索内容 / 工具 / 仓库 / 镜像...⌘K 搜索

无人机视觉目标检测数据集 VisDrone 详解 | 极客日志

编程语言AI算法

无人机视觉目标检测数据集 VisDrone 详解

VisDrone 是天津大学推出的大规模无人机视觉数据集，涵盖航拍、监控等场景，源自中国 14 个城市。数据集分为训练集、验证集和测试集，共约 8600 张图像。原始标注包含 12 类，其中 ignored regions 因难以标注被遮挡处理，实际可用类别为 10 类，包括行人、车辆等。该数据集适用于小目标检测及密集场景下的鲁棒性优化研究，支持转换为 YOLO 格式进行训练。

性能调优发布于 2026/4/6更新于 2026/7/2366 浏览

无人机视觉目标检测数据集 VisDrone 详解

无人机视觉目标检测数据集 VisDrone 详解

随着无人机技术的飞速发展，无人机在航拍、监控、农业、物流等领域的应用日益广泛。与此同时，无人机视角下的视觉任务，如目标检测、目标跟踪和场景理解，也成为了计算机视觉研究的热点。然而，相比传统的地面视角数据集，无人机视角下的图像具有高度变化、小目标密集、复杂背景等独特挑战，这对现有算法提出了更高的要求。

为了应对这些挑战并推动无人机视觉技术的发展，天津大学机器学习与数据挖掘实验室推出了 VisDrone 数据集。作为一个大规模、标注精细的无人机视觉数据集，VisDrone 不仅涵盖了丰富的场景和多样化的目标类别，还为研究人员提供了一个极具挑战性的测试平台。无论是小目标检测的精度提升，还是密集场景下的鲁棒性优化，VisDrone 都成为了学术界和工业界不可或缺的资源。该数据集采集自中国 14 个不同城市，覆盖复杂城市场景、交通枢纽、密集人群等多种环境。

文章配图

官方下载渠道

VisDrone 官方 Github 下载渠道：

https://github.com/VisDrone/VisDrone-Dataset?tab=readme-ov-file

下载的数据集包含 VisDrone2019-DET-train、VisDrone2019-DET-val、VisDrone2019-DET-test-dev（均含有标注），以及 VisDrone2019-DET-test-challenge（不含标注）。

训练集：6,471 张图像
验证集：548 张图像
测试集：1610 张图像

数据格式与处理

下载下来的原始数据集为 jpg+txt 文件，这里的 txt 不是 YOLO 训练可用的 txt 文件，需要对数据处理后才能使用。图片通常包含原图和覆盖白色方块的图，用户可根据需求选择使用。

官方共有 12 个分类，其中 ignored regions 为忽略的区域，有些区域包含了密集的很小的目标，无法进行标注，所以我们要把这个区域忽视掉。因此对于这部分内容我们将这个区域从图片中覆盖白色方块进行遮挡。

文章配图

带有白色方块及标注框的效果如下图：

文章配图

others 忽略掉，因此转换后的类别共有 10 类，分别为：

["pedestrian", "people", "bicycle", "car", "van", "truck", "tricycle", "awning-tricycle", "bus", "motor"]

即获取的 YOLO 格式的类别顺序为上述顺序。

下图为训练过程中部分图像：

文章配图

下图为验证过程中部分图像：

文章配图

训练使用原图进行训练，整体精度在 0.4 左右。覆盖了白色方块的精度可自行测试精度。

目录

无人机视觉目标检测数据集 VisDrone 详解
官方下载渠道
数据格式与处理

免费图片AI生成工具免费生成了解详情

Magick API 一键接入全球大模型注册送1000万token查看
免费图片视频在线生成30秒，将你的创意变成现实开始设计
X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
100+免费在线小游戏爽一把

极客日志微信公众号二维码

微信扫一扫，关注极客日志

微信公众号「极客日志V2」，在微信中扫描左侧二维码关注。展示文案：极客日志V2 zeeklog

更多推荐文章

2025 WAIC 合合信息展台：AI 鉴伪技术洞察伪造痕迹
Linux 部署本地 AI 大模型与知识库集成指南
Ollama 本地大模型 WebAPI 调用实战指南
Flutter 与 Web 混合开发实践
为 GitHub Copilot 构建智能体记忆系统
Python 协同过滤算法 Django 餐厅推荐系统
C++ STL unordered_set/unordered_map 使用介绍
基于 ms-swift 的多模态 AI 绘画理解微调实践
Midjourney 官方网址查询与中文访问方案
JDK 8 至 JDK 25 JVM 核心优化与演进前瞻
Python 新手 LeetCode 快速刷题指南
VS Code 环境 GitHub Copilot 无法使用？关键排查与解决步骤
DeepSeek 结合通义万相制作 AI 视频实战指南
国内无人机车辆行人检测数据集：智慧交通与应急救援应用
Whisper-Large-V3-Turbo 模型高效部署指南
Spring Cloud + AI：微服务智能路由、故障自愈与日志分析
Kiro AI 助手完整使用指南
Android 开发新趋势：车载 Framework 与智能座舱技术解析
潜在扩散模型（LDMs）深度解析：高分辨率图像生成范式
前端面试核心八股文汇总：JavaScript、React、Vue 等考点整理

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online