NWPU VHR-10数据集无人机遥感目标检测数据集飞机储罐棒球场网球场篮球场港口车辆桥梁检测遥感图像中的地理空间目标检测

优质文章学习记录

07 Apr 2026 — 5 min read

NWPU VHR-10数据集遥感数据集

NWPU VHR-10数据集是 10个类别地理空间目标检测的挑战性数据集，共650张图片。

YOLO和COCO格式

数据集按默认划分比例：390张训练集、130张验证集、130张测试集。

手动标注了757架飞机、302艘船只、655个储罐、390个棒球场、524个网球场、159个篮球场、163个田径场、224个港口、124座桥梁和598辆车辆。

📊 一、数据集总体信息

项目	描述
数据集名称	NWPU VHR-10（Northwestern Polytechnical University Very High Resolution 10-class Dataset）
任务类型	遥感图像中的地理空间目标检测（Object Detection in Remote Sensing Images）
图像总数	650 张（均为高分辨率遥感图像，源自 Google Earth 等平台）
图像分辨率	约 600×600 至 1000×1000 像素，空间分辨率高
标注格式	✅ YOLO TXT 格式 ✅ COCO JSON 格式（开箱即用，无需转换）
数据划分	- 训练集：390 张 - 验证集：130 张 - 测试集：130 张（比例 ≈ 6:2:2）
应用场景	军事侦察、城市规划、灾害评估、智能遥感解译等

🏷️ 二、类别定义与实例数量统计

类别 ID	类别名称（英文）	类别名称（中文）	标注实例数量
0	Airplane	飞机	757
1	Ship	船只	302
2	Storage Tank	储罐	655
3	Baseball Diamond	棒球场	390
4	Tennis Court	网球场	524
5	Basketball Court	篮球场	159
6	Ground Track Field	田径场	163
7	Harbor	港口	224
8	Bridge	桥梁	124
9	Vehicle	车辆	598

🔢 总标注目标数：3,896 个
📌 所有目标均以 水平边界框（Axis-Aligned Bounding Box） 标注。

📁 三、推荐使用方式

用途	建议
模型训练	直接使用提供的 YOLO 或 COCO 格式，适配 YOLOv5/v8、MMDetection、Detectron2 等主流框架
评估指标	通常采用 [email protected]（IoU=0.5）作为主指标
挑战点	• 小目标（如车辆、飞机） • 类间尺度差异大（港口 vs 车辆） • 背景复杂（城市、水域、农田混合）
扩展建议	可结合 DIOR、DOTA 等遥感数据集进行跨域泛化研究

📁 一、项目结构建议

nwpu_vhr10_yolo/ ├── dataset.yaml # 数据集配置文件 ├── train.py # 主训练脚本 ├── predict_demo.py # 推理演示 ├── export_model.py # 模型导出脚本 └── data/ ├── images/ │ ├── train/ # 390 张训练图像 │ ├── val/ # 130 张验证图像 │ └── test/ # 130 张测试图像 └── labels/ ├── train/ # 对应 .txt 标注（YOLO格式） ├── val/ └── test/

✅ 假设你已将官方提供的 YOLO 格式数据按上述结构组织。

📄 二、数据集配置文件 `dataset.yaml`

# dataset.yamlpath: ./data train: images/train val: images/val test: images/test nc:10names:['airplane','ship','storage_tank','baseball_diamond','tennis_court','basketball_court','ground_track_field','harbor','bridge','vehicle']

🚀 三、详细训练代码 `train.py`

# train.pyfrom ultralytics import YOLO import torch defmain(): device ='cuda'if torch.cuda.is_available()else'cpu'print(f"🚀 使用设备: {device}")# 选择模型（遥感小目标多，推荐 yolov8m 或 yolov8l） model_name ="yolov8m.pt"# 可选: yolov8s / yolov8l / yolov8x project_name ="nwpu_vhr10_detection"# 加载预训练模型 model = YOLO(model_name)# 开始训练 results = model.train( data='dataset.yaml', epochs=150,# 遥感数据复杂，建议充分训练 imgsz=640,# NWPU 图像较小，640 足够；若需更高精度可用 1024 batch=16,# 640 分辨率下 batch=16（32G 显存可设 32） name=project_name, device=device, patience=30,# 早停机制（验证集 mAP 不升则停） save=True, plots=True,# 自动生成 PR 曲线、混淆矩阵、样本可视化 exist_ok=False, workers=8, optimizer='AdamW', lr0=0.01, lrf=0.01,# 数据增强（关键！提升小目标和尺度变化鲁棒性） augment=True, hsv_h=0.015, hsv_s=0.7, hsv_v=0.4, degrees=15.0,# ±15° 旋转（遥感视角多样） translate=0.1, scale=0.5, flipud=0.0,# 不上下翻转（地理目标方向敏感） fliplr=0.5,# 左右翻转安全 mosaic=1.0,# Mosaic 增强（对小目标如 vehicle/airplane 极有效） mixup=0.1)# 在测试集上评估最终性能 metrics = model.val(data='dataset.yaml', split='test')print("\n✅ NWPU VHR-10 测试集结果:")print(f" [email protected] (all): {metrics.box.map50:.5f}")print(f" [email protected]:0.95: {metrics.box.map:.5f}")print(f" Precision: {metrics.box.mp:.5f}")print(f" Recall: {metrics.box.mr:.5f}")if __name__ =='__main__': main()

运行命令：

python train.py

🔍 四、推理演示 `predict_demo.py`

# predict_demo.pyfrom ultralytics import YOLO model = YOLO('runs/detect/nwpu_vhr10_detection/weights/best.pt') results = model.predict( source='test_image.jpg', conf=0.25,# 遥感小目标建议降低阈值 iou=0.45, save=True, show=True, line_width=2, font_size=12)# 打印检测结果 class_names =['Airplane','Ship','Storage Tank','Baseball Diamond','Tennis Court','Basketball Court','Ground Track Field','Harbor','Bridge','Vehicle']for result in results: boxes = result.boxes print(f"检测到 {len(boxes)} 个目标")for box in boxes: cls_id =int(box.cls.item()) conf =float(box.conf.item())print(f" → {class_names[cls_id]} (置信度: {conf:.3f})")

📤 五、模型导出（用于部署）

# export_model.pyfrom ultralytics import YOLO model = YOLO('runs/detect/nwpu_vhr10_detection/weights/best.pt')# 导出为 ONNX（通用） model.export(format='onnx', imgsz=640, simplify=True)# 导出为 TensorRT（NVIDIA GPU / Jetson） model.export(format='engine', imgsz=640, half=True, device=0)# 导出为 OpenVINO（Intel CPU） model.export(format='openvino', imgsz=640)

⚙️ 六、训练优化建议

挑战	解决方案
小目标漏检（如车辆、飞机）	启用 `mosaic=1.0`，使用 `imgsz=1024`（若显存允许）
类别不平衡（如桥梁仅124个）	YOLOv8 内置 Focal Loss 变体，通常无需额外处理；也可对稀有类过采样
背景复杂干扰	增加 `hsv_v` 和 `degrees` 增强，提升光照与角度鲁棒性
实时遥感分析	若部署于边缘设备（如无人机），可改用 `yolov8s` + TensorRT

揭秘！AI应用架构师眼中的智能Web3应用开发框架精髓

揭秘！AI应用架构师眼中的智能Web3应用开发框架精髓关键词：智能Web3应用, AI与区块链融合, 去中心化AI架构, 智能合约开发, Web3开发框架, AI模型链上集成, 去中心化应用(DApp)设计摘要：当人工智能(AI)的"智慧大脑"遇上Web3的"去中心化灵魂"，会碰撞出怎样的创新火花？本文将以AI应用架构师的第一视角，深入剖析智能Web3应用开发框架的核心精髓。我们将从"传统互联网到Web3的进化史"讲起，用生活类比揭开Web3与AI融合的神秘面纱，系统讲解智能Web3应用的"五脏六腑"架构设计、AI模型与区块链交互的"对话语言"、以及实战开发中的"避坑指南"。无论你是Web3开发者、AI工程师，还是对下一代互联网好奇的技术爱好者，这篇文章都将带你透过架构师的眼睛，看到智能Web3应用开发的全景蓝图—

【机器人】ROS2 功能包创建与 CMake 编译链路探秘

🔥大奇个人主页：https://blog.ZEEKLOG.net/m0_75192474?type=blog ⚡本文所属专栏：https://blog.ZEEKLOG.net/m0_75192474/category_13131150.html ros2 pkg create 是 ROS2（Robot Operating System 2）中用于快速初始化功能包的官方核心命令行工具。其核心作用是自动生成功能包所需的完整目录结构、配置文件及可选示例节点，避免手动创建文件和配置的繁琐操作，大幅提升开发效率。该命令支持两种主流构建类型（C++/Python），可直接指定依赖包、维护者信息、开源协议等关键配置，生成的功能包完全符合 ROS2 官方规范，可直接用于编译、运行及后续开发扩展 ⏰ 创建工作空间首先需要再主目录中新建一个文件夹，带src目录 mkdir-p test_ws/

Clawdbot整合Qwen3:32B的低代码工作流：拖拽式Agent编排与条件分支

Clawdbot整合Qwen3:32B的低代码工作流：拖拽式Agent编排与条件分支 1. 为什么需要这个工作流：从“写代码”到“搭积木” 你有没有遇到过这样的情况：想让大模型帮自己自动处理一批客户咨询，但每次都要改Python脚本、调API参数、写if-else逻辑，改完还要测试、部署、查日志？或者想让AI根据用户提问类型自动走不同流程——比如问价格走报价分支，问售后走工单分支，问教程走知识库分支——可一想到要写状态机、维护路由表、处理异常跳转，就直接放弃了？ Clawdbot + Qwen3:32B 的这套低代码工作流，就是为解决这类问题而生的。它不让你写一行后端逻辑，也不要求你懂FastAPI或LangChain内部机制。你只需要在界面上拖拽几个模块，连几条线，设几个判断条件，就能把一个320亿参数的大模型变成真正能干活的智能体（Agent）。这不是概念演示，而是已经跑在生产环境里的真实配置：Qwen3:32B 模型私有部署在本地服务器，通过 Ollama 统一提供 API；Clawdbot 作为前端编排层，不碰模型推理，只负责“

一、FPGA到底是什么？？？（一篇文章让你明明白白）

一句话概括 FPGA（现场可编程门阵列）是一块可以通过编程来“变成”特定功能数字电路的芯片。它不像CPU或GPU那样有固定的硬件结构，而是可以根据你的需求，被配置成处理器、通信接口、控制器，甚至是整个片上系统。一个生动的比喻：乐高积木 vs. 成品玩具 * CPU（中央处理器）：就像一个工厂里生产好的玩具机器人。它的功能是固定的，你只能通过软件（比如按不同的按钮）来指挥它做预设好的动作（走路、跳舞），但你无法改变它的机械结构。 * ASIC（专用集成电路）：就像一个为某个特定任务（比如只会翻跟头）而专门设计和铸造的金属模型。性能极好，成本低（量产时），但一旦制造出来，功能就永远无法改变。 * FPGA：就像一盒万能乐高积木。它提供了大量基本的逻辑单元（逻辑门、触发器）、连线和接口模块。你可以通过“编程”（相当于按照图纸搭建乐高）将这些基本模块连接起来，构建出你想要的任何数字系统——可以今天搭成一个CPU，明天拆了重新搭成一个音乐播放器。 “现场可编程”