目标检测数据集——无人机视觉VisDrone数据集

目标检测数据集——无人机视觉VisDrone数据集

随着无人机技术的飞速发展,无人机在航拍、监控、农业、物流等领域的应用日益广泛。与此同时,无人机视角下的视觉任务,如目标检测、目标跟踪和场景理解,也成为了计算机视觉研究的热点。然而,相比传统的地面视角数据集,无人机视角下的图像具有高度变化、小目标密集、复杂背景等独特挑战,这对现有算法提出了更高的要求。

为了应对这些挑战并推动无人机视觉技术的发展,天津大学机器学习与数据挖掘实验室推出了 VisDrone数据集。作为一个大规模、标注精细的无人机视觉数据集,VisDrone 不仅涵盖了丰富的场景和多样化的目标类别,还为研究人员提供了一个极具挑战性的测试平台。无论是小目标检测的精度提升,还是密集场景下的鲁棒性优化,VisDrone 都成为了学术界和工业界不可或缺的资源。该数据集采集自中国14个不同城市,覆盖复杂城市场景、交通枢纽、密集人群等多种环境。

VisDrone官方Github下载渠道可点击访问:

https://github.com/VisDrone/VisDrone-Dataset?tab=readme-ov-file

下载的数据集为VisDrone2019-DET-train,VisDrone2019-DET-val,VisDrone2019-DET-test-dev均含有标注,VisDrone2019-DET-test-challenge不含标注因此不在本文处理好的数据集中。

  • 训练集:6,471张图像
  • 验证集:548张图像
  • 测试集:1610张图像

下载下来的原始数据集为jpg+txt文件,这里的txt不是yolo训练可用的txt文件,需要对数据处理后才能使用。 这里我提供一个处理好的可直接用于目标检测训练的jpg+xml+txt文件。图片有两个文件夹,分别为原图和覆盖白色方块的图,可自行选择使用。

官方共有12个分类,分别为:

其中ignored regions为忽略的区域,有些区域包含了密集的很小的目标,无法进行标注的,所以我们要把这个区域忽视掉。因此对于这部分内容我们将这个区域从图片中覆盖白色方块进行遮挡。效果如下图。

带有白色方块及标注框的效果如下图

同样我提供了覆盖白色方块的图片和未覆盖白色方块的图片,需要用哪个可自行选择使用。

others忽略掉,因此转换后的类别共有10类,分别为:

["pedestrian", "people", "bicycle", "car", "van", "truck", "tricycle", "awning-tricycle", "bus", "motor"]

即获取的YOLO格式的类别顺序为上述顺序。

下图为训练过程中部分图像

下图为验证过程中部分图像

训练使用原图进行训练,整体精度在0.4左右。覆盖了白色方块的精度可自行测试精度。

下载数据集可以访问官网获取原始数据集:Github

需要处理后的数据集可通过 V🔍:笑脸惹桃花 获取。

Read more

多模态检索新突破!Qwen3-VL-Embedding/Reranker AI 真正“看懂“你在搜什么,从图片到视频全拿下!

多模态检索新突破!Qwen3-VL-Embedding/Reranker AI 真正“看懂“你在搜什么,从图片到视频全拿下!

Qwen3-VL-Embedding 和 Qwen3-VL-Reranker:统一多模态表征与排序 摘要 2025年6月,Qwen 团队开源了面向文本的 Qwen3-Embedding 和 Qwen3-ReRanker 模型系列,在多语言文本检索、聚类和分类等多项下游任务中取得了业界领先的性能。 2026年1月,该团队推出了 Qwen 家族的最新成员:Qwen3-VL-Embedding 和 Qwen3-VL-Reranker 模型系列。这些模型基于开源的 Qwen3-VL 模型构建,专为多模态信息检索和跨模态理解场景设计,能够将文本、图像、文档图像和视频等多种模态映射到统一的表示空间中。 Qwen3-VL-Embedding 模型采用多阶段训练范式,从大规模对比预训练逐步发展到重排序模型蒸馏,以生成语义丰富的高维向量。该模型支持 Matryoshka 表示学习(MRL),可灵活选择嵌入维度,并能处理最多 32K tokens 的输入。作为补充,Qwen3-VL-Reranker 采用交叉编码器架构和交叉注意力机制,对查询-文档对进行细粒度的相关性评估。 两个模型系列继承了

AI助力9·1免费版安装:智能解决常见问题

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 输入框内输入如下内容: 开发一个AI辅助安装工具,能够自动检测用户系统环境,识别9·1免费版的安装需求,并提供一键解决方案。工具应包含以下功能:1. 自动扫描系统配置,判断兼容性;2. 智能修复常见的安装错误;3. 提供详细的安装日志和问题报告;4. 支持多种操作系统。使用Python编写,界面简洁友好。 1. 点击'项目生成'按钮,等待项目生成完整后预览效果 AI助力9·1免费版安装:智能解决常见问题 最近在帮朋友安装9·1免费版软件时,遇到了各种系统兼容性问题,从依赖缺失到权限错误,折腾了大半天。这让我思考:能不能用AI技术让安装过程变得更智能?于是尝试开发了一个AI辅助安装工具,效果出乎意料的好用。 系统兼容性自动检测 传统安装方式最头疼的就是手动检查系统环境。

HarmonyOS 5.0行业解决方案:基于端侧AI的智能工业质检APP开发实战

HarmonyOS 5.0行业解决方案:基于端侧AI的智能工业质检APP开发实战

文章目录 * 每日一句正能量 * 前言 * 一、工业质检数字化背景与技术趋势 * 1.1 行业痛点分析 * 1.2 鸿蒙工业质检技术栈优势 * 二、系统架构设计 * 2.1 整体架构图 * 2.2 核心模块划分 * 三、核心代码实现 * 3.1 多路工业相机接入 * 3.2 端侧AI推理引擎 * 3.3 缺陷检测业务逻辑 * 3.4 分布式质量看板 * 四、工控系统对接 * 4.1 Modbus TCP通信 * 五、OTA模型更新机制 * 六、总结与行业价值 每日一句正能量 低头走路的人只看到大地的厚重,却忽略了高空的高远;抬头走路的人,只看到高空的广阔,却忽略了脚下的艰辛与险峻,我们既需要在一天里憧憬一年,

TRAE 接入方舟 Coding Plan教程(AI IDE 字节系)

TRAE 接入方舟 Coding Plan教程(AI IDE 字节系)

1 下载&安装TRAE 1.1 什么是 TRAE ? 字节跳动发布的AI原生编程工具,可帮助开发者从0到1开发完整项目。 TRAE(/treɪ/)深度融合 AI 能力,是一名能够理解需求、调用工具并独立完成各类开发任务的“AI 开发工程师”,帮助你高效推进每一个项目。 支持以下功能: 实时续写代码调试运行智能排查Bug版本控制自动构建项目一键预览效果解答技术难题 1.2 下载 国内版下载地址(推荐):https://www.trae.cn/ide/download 国际版下载地址(适合已订阅国外大模型的用户): https://www.trae.ai/download 目前支持的系统(注意:Linux版本需要预约候补): * Windows * macOS * Linux 1.3 安装  点击打开已下载的安装包,