目标检测数据集——无人机视觉VisDrone数据集

目标检测数据集——无人机视觉VisDrone数据集

随着无人机技术的飞速发展,无人机在航拍、监控、农业、物流等领域的应用日益广泛。与此同时,无人机视角下的视觉任务,如目标检测、目标跟踪和场景理解,也成为了计算机视觉研究的热点。然而,相比传统的地面视角数据集,无人机视角下的图像具有高度变化、小目标密集、复杂背景等独特挑战,这对现有算法提出了更高的要求。

为了应对这些挑战并推动无人机视觉技术的发展,天津大学机器学习与数据挖掘实验室推出了 VisDrone数据集。作为一个大规模、标注精细的无人机视觉数据集,VisDrone 不仅涵盖了丰富的场景和多样化的目标类别,还为研究人员提供了一个极具挑战性的测试平台。无论是小目标检测的精度提升,还是密集场景下的鲁棒性优化,VisDrone 都成为了学术界和工业界不可或缺的资源。该数据集采集自中国14个不同城市,覆盖复杂城市场景、交通枢纽、密集人群等多种环境。

VisDrone官方Github下载渠道可点击访问:

https://github.com/VisDrone/VisDrone-Dataset?tab=readme-ov-file

下载的数据集为VisDrone2019-DET-train,VisDrone2019-DET-val,VisDrone2019-DET-test-dev均含有标注,VisDrone2019-DET-test-challenge不含标注因此不在本文处理好的数据集中。

  • 训练集:6,471张图像
  • 验证集:548张图像
  • 测试集:1610张图像

下载下来的原始数据集为jpg+txt文件,这里的txt不是yolo训练可用的txt文件,需要对数据处理后才能使用。 这里我提供一个处理好的可直接用于目标检测训练的jpg+xml+txt文件。图片有两个文件夹,分别为原图和覆盖白色方块的图,可自行选择使用。

官方共有12个分类,分别为:

其中ignored regions为忽略的区域,有些区域包含了密集的很小的目标,无法进行标注的,所以我们要把这个区域忽视掉。因此对于这部分内容我们将这个区域从图片中覆盖白色方块进行遮挡。效果如下图。

带有白色方块及标注框的效果如下图

同样我提供了覆盖白色方块的图片和未覆盖白色方块的图片,需要用哪个可自行选择使用。

others忽略掉,因此转换后的类别共有10类,分别为:

["pedestrian", "people", "bicycle", "car", "van", "truck", "tricycle", "awning-tricycle", "bus", "motor"]

即获取的YOLO格式的类别顺序为上述顺序。

下图为训练过程中部分图像

下图为验证过程中部分图像

训练使用原图进行训练,整体精度在0.4左右。覆盖了白色方块的精度可自行测试精度。

下载数据集可以访问官网获取原始数据集:Github

需要处理后的数据集可通过 V🔍:笑脸惹桃花 获取。

Read more

区块链是什么:Web3 底层核心的分布式信任技术

区块链是什么:Web3 底层核心的分布式信任技术

区块链是什么:Web3 底层核心的分布式信任技术 区块链是基于密码学、以区块串联形式存储数据的分布式账本技术,核心是通过全网多节点的共同记录与验证,实现数据的去中心化存储、不可篡改与透明可追溯,无需依赖任何中心化机构做信任背书,就能让陌生主体之间达成可信的价值传递与数据交互。它是支撑 Web3、智能合约、NFT、DAO 等生态的底层技术基石,也是解决传统互联网 “信任成本高、数据垄断、价值流转受平台限制” 的核心方案。 简单来说,区块链可以类比成一本全网公开、多人共同记录、无法篡改的共享账本:传统账本由一个中心(如银行、平台)单独记录,记录者可随意修改;而区块链的账本由网络中所有节点(参与者)同步记录,每一笔新数据都会生成一个新 “区块”,并加密链接到上一个区块,任何人想修改其中一条记录,都需要同时篡改全网所有节点的账本,技术成本极高且几乎不可能实现,这也是其 “可信” 的核心来源。 一、区块链的五大核心特征(区别于传统技术的关键) 这五大特征是区块链实现 “去中心化信任” 的核心,也是其能成为价值互联网底层的关键属性: 1.

玩转Neo4j:从入门到实战的完整指南(含K8s集群部署)

在数据关系日益复杂的当下,传统关系型数据库在处理海量关联数据时,往往会因多表联查出现性能瓶颈。而Neo4j作为一款高性能的原生图数据库,凭借其对数据关系的天然亲和性,成为了社交网络分析、知识图谱构建、推荐系统开发等场景的理想选择。本文将从Neo4j的核心特性入手,带大家完成从安装部署(重点补充K8s集群方案)到实际使用的全流程实操。 一、Neo4j 核心特性与应用场景 Neo4j是一款基于原生图存储的数据库系统,其核心优势在于以“节点-关系”的形式直接存储数据关联,而非通过外键间接关联,这让它在处理关系型查询时具备无可比拟的效率。 1. 核心特性 * 原生图存储:数据以节点(Node)、关系(Relationship)和属性(Property)的形式存储,关系是一等公民,查询时无需复杂的多表连接。 * Cypher查询语言:Neo4j自研的声明式查询语言,语法简洁直观,支持复杂的图遍历和关系分析,能快速实现路径查询、关联挖掘等操作。 * 多部署形态:支持本地自托管、云托管(AuraDB)、Docker容器化、Kubernetes集群化等多种部署方式,适配不同规模的业务

宇树科技机器人核心技术

宇树科技机器人核心技术

前言 宇树科技作为全球足式/人形机器人领域的标杆企业,其技术体系覆盖消费级(Go2)、工业级(B2)、人形(G1/H1)全产品线,以“硬件自研+软件全栈+AI赋能”构建核心壁垒。本文不仅拆解宇树机器人的关键技术(单硬件、单软件、软硬件协同、AI+),还配套就业技能图谱、学习路线与工具推荐,适合机械、电子、计算机、AI领域开发者/求职者参考。 一、宇树科技机器人核心技术全景(附插图建议) 宇树的技术体系可概括为“四层金字塔结构”,从下到上实现“能运动→会运动→智能运动”的进阶: 技术层级核心定位代表技术应用价值底层硬件机器人“躯体骨架”自研伺服电机、分层计算平台、4D激光雷达保障运动性能与环境适配性全栈软件机器人“智慧大脑”MPC/WBC控制算法、SLAM感知融合、ROS2中间件实现精准控制与灵活交互软硬件协同机器人“神经中枢”实时控制闭环、

【CANN】Pi0机器人大模型 × 昇腾A2 测评

【CANN】Pi0机器人大模型 × 昇腾A2 测评

【CANN】Pi0机器人大模型 × 昇腾A2 测评 * 写在最前面 🌈你好呀!我是 是Yu欸🚀 感谢你的陪伴与支持~ 欢迎添加文末好友🌌 在所有感兴趣的领域扩展知识,不定期掉落福利资讯(*^▽^*) 写在最前面 版权声明:本文为原创,遵循 CC 4.0 BY-SA 协议。转载请注明出处。 Pi0机器人VLA大模型测评 哈喽大家好呀!我是 是Yu欸。 最近人形机器人和具身智能真的太火了,大家都在聊 Pi0、聊 VLA 大模型。但是,兄弟们,不管是搞科研还是做落地,咱们始终绕不开一个问题——算力。 今天,我们一起把当下最火的 Pi0 机器人视觉-语言-动作大模型,完完整整地部署在国产算力平台上,也就是华为的昇腾 Atlas 800I A2 服务器上。 在跑通仓库模型的基础上,我们做一次性能测评。 我们要测三个最核心的指标: