
无人机视觉目标检测数据集 VisDrone 介绍与数据格式转换
VisDrone 数据集由天津大学推出,涵盖 14 个城市场景,包含行人、车辆等 12 类目标。针对密集小目标和忽略区域,数据集采用白色方块遮挡处理。原始数据为 JPG 加 TXT 标注,需转换为 YOLO 格式方可用于训练。官方提供训练集、验证集及测试集,去除忽略区域后有效类别为 10 类。该数据集适用于无人机视角下的目标检测与跟踪任务研究。
博客作者
系统性能优化师
332
已发布文章
11K
博客获赞
895K
博客浏览
第 3 页

VisDrone 数据集由天津大学推出,涵盖 14 个城市场景,包含行人、车辆等 12 类目标。针对密集小目标和忽略区域,数据集采用白色方块遮挡处理。原始数据为 JPG 加 TXT 标注,需转换为 YOLO 格式方可用于训练。官方提供训练集、验证集及测试集,去除忽略区域后有效类别为 10 类。该数据集适用于无人机视角下的目标检测与跟踪任务研究。
Seedance 2.0 采用双分支扩散变换器架构,解耦时空建模路径。空间分支负责帧内语义重建,时间分支处理跨帧动态,通过协同门控机制融合特征。训练采用渐进式解冻策略与相对时间嵌入,结合 SDE-Flow 残差更新优化采样稳定性。工程上实现了梯度重加权与轻量化剪枝边界评估,并配套多模态提示词模板以增强可控生成能力。

DevUI 2025 年度运营报告显示项目矩阵扩容至 7 个仓库,覆盖 Vue、Angular、React 框架。核心项目 MateChat 正式开源,聚焦 GenAI 体验系统语言。全年接收 PR 超 300 次,Star 数达 3.02k。社区参与高校共建及行业活动,推动开源协作。2026 年计划迭代组件能力,深化平台协同,拓展企业级落地场景,完善贡献者…
超好用的一站式AI助手——AionUi 探索 AionUi:免费、本地、开源的 AI 协作平台 AionUi 是什么? AionUi 的核心功能 1\. 多代理模式 2\. 远程访问 3\. 定时任务 4\. 智能文件管理 5\. 预览面板 6\. AI 图像生成与编辑 7\. 多模型支持 8\. AI 助手与技能 9\. 个性化界面与本地安全 系统要求与安…

openclaw使用llama.cpp 本地大模型部署教程 > 本教程基于实际操作整理,适用于 Windows WSL2 环境 * * 全程使用 openclaw 帮我搭建大模型 !在这里插入图片描述 一、环境准备 1\. 硬件要求 | 显卡 | 推荐模型 | 显存占用 | | --- | --- | --- | | GTX 1050 Ti (4GB) |…

**目录** 一、Neo4j图数据库 1、neo4j 安装 - mac brew版 2、neo4j 快速入门 3、neo4j 基本操作 (1)增操作 (2)查操作 (3)改操作 (4)删操作 4、安装py2neo 二、数据预处理 1、数据清洗 2、知识建模 (1)识别实体 (2)识别实体属性 (3)识别关系 三、搭建知识图谱 * * > 博主的数据集是用的自…

LLaMA Factory是一个**大模型高效微调平台**,在github有60k多收藏了,很适合入门的朋友 提供了' 一站式'的操作界面,通过可视化操作,就可以完成对LLMs 或 VLMs的微调了 开源地址:https://github.com/hiyouga/LLaMA-Factory 下面是微调的页面**,简洁、清晰、功能多**: 
作为IT互联网产品技术从业者,笔者长期关注各行业数智化转型落地场景,发现一个极具反差感的现象:一边是国家政策持续加码智慧农业,2025年中央一号文件明确支持拓展人工智能、数据等技术在农业领域的应用场景,资本也在不断涌入农业数智化赛道;另一边是绝大多数农业主体(尤其是中小农户、乡镇合作社)仍被困在'不会用、用不起、用不好'的死循环里,所谓的'数智化解决方案',…
一、Web 服务介绍 1.1.1 Apache prefork 模型(预派生模式) **核心机制**:主控制进程派生多个独立子进程,使用select模型,最大并发 1024;每个子进程单线程响应用户请求 **资源特性**:占用内存较多,但稳定性极高 **配置特点**:可设置进程数的最大值和最小值 **适用场景**:访问量中等的场景 优缺点 ✅ 优点:极致稳定…

大疆无人机开发实战指南:MSDK/PSDK/上云 API 集成 摘要 作为无人机领域的核心生态,大疆行业开发体系自 2014 年开放 SDK 以来,已吸引超 10 万开发者构建 3000+ 行业解决方案。基于官方最新《行业生态入门指南》,深度解析 MSDK 移动端开发、PSDK 负载硬件开发、上云 API 云端集成三大核心能力,附全流程资源清单与生态认证攻略…
目的 基于 Vivado 平台,通过对 MT25QL256 SPI Flash 进行在线烧写,实现 Xilinx 7K325t FPGA 程序在线更新升级。 MT25QL256 SPI Flash 描述 2.1. 功能特性 SPI 兼容串行总线接口 单速和双速传输 (STR/DTR) 时钟频率 STR 模式下所有协议最高 133 MHz DTR 模式下所有协…

前言 在提取无人机数据时,可能会遇到因无人机自身无存储介质而无法镜像解析的情况。讲解如何通过无人机自带功能界面导出日志并解析。 日志导出流程 安装软件 无人机官方通常提供配套查看工具。以大疆无人机为例,首先在计算机上安装大疆官方发布的 DJI Assistant2 For Mavic 工具。 连接设备 将无人机设备通过 USB 线连接至电脑。 !连接设备 打…

LLaMA 衍生模型指的是**基于 Meta 发布的 LLaMA 基础模型,通过微调、优化或扩展而产生的各类变体模型**。就像 LLaMA 是一个强大的'通用大脑',而衍生模型则是针对不同语言、不同任务、不同应用场景进行'专业培训'后的'专家'。根据衍生方式的不同,可以分为两大类:LLaMA 衍生模型、官方演进版本 激增的挑战,尤其是 AIGC 工具普及后,用户一天能生产出海量的帖子、评论、脚本,人工审核根本看不过来。更麻烦的是,里面可能夹杂着一些不合规的内容,轻则影响社区氛围,重则可能引发风险。 传统的审核规则库更新慢,面对层出不穷的新梗、黑话常常失灵…
UITabBarButtonItem 液态玻璃效果 兼容处理: 第一种方式 (不推荐):把所有的 UITabBarButtonItem 关闭液态玻璃效果: 第二种方式:所有导航栏按钮全部采用 UITabBarButtonItem,支持液态玻璃效果。 第三种方式:降低 Xcode 版本到 Xcode 25 及以下版本,然后再打包。 第四种方式:使用兼容模式显示…

前言:何为 AI Agent 在 AI 应用爆发的今天,市面上充斥着各种 Agent 工具。但作为技术人,我们不仅要会'用',更要懂'如何集成到业务'。基于实战,拆解一个具备'大脑(LLM)、手脚 (Tool Use / Function Calling)、记忆 (Memory)、规划(Planning / ReAct)、系统提示词(System Promp…
一种基于 AI 技术的 9·1 免费版软件安装辅助工具。针对传统安装中遇到的系统兼容性问题、依赖缺失及权限错误等痛点,该工具利用 AI 模型实现系统环境的自动扫描与诊断。主要功能包括识别操作系统类型与硬件指标、智能匹配最低要求、自动修复常见安装错误(如权限不足、运行库缺失)、提供详细安装日志及跨平台打包支持(Windows/macOS/Linux)。开发过程…
对国内用户下载 Stable Diffusion 和 LLaMA 模型速度慢的问题,推荐了清华大学 TUNA 镜像站、阿里云 ModelScope 和华为云昇思 Hub 等国内可用资源。文章详细说明了如何替换 Hugging Face 原始链接,并结合 LoRA 微调技术,提供了从基础模型下载、数据准备、参数配置到训练部署的完整工作流。同时列举了显存不足、效…
具身智能(Embodied AI)的概念,定义为物理身体与环境的实时互动。通过 EIBench 和 GM-100 等基准测试量化其指标,涵盖双臂协同、力觉控制等表现。同时梳理了工信部人形机器人与具身智能标准化技术委员会的标准建设方向,包括基础定义、智能化、适配及安全伦理标准,旨在推动产业从专用工具向通用智能体跨越。

通过对比实验探讨了如何优化 AI 生成的前端 UI 界面。针对 AI 默认生成的 UI 存在设计感不足、配色单一的问题,提出了三步优化方案:安装 Frontend Design Skills 插件、提供专业配色方案、明确指定设计风格方向。实验结果表明,结合插件与风格控制能显著提升 UI 的专业度和美观度,无需手写 CSS 即可实现高级感。