基于 YOLOv8 的无人机红外可见光光伏缺陷检测数据集与训练指南 | 极客日志

PythonAI算法

基于 YOLOv8 的无人机红外可见光光伏缺陷检测数据集与训练指南

光伏无人机巡检常面临复杂环境下的缺陷识别难题。本数据集提供 650 对红外与可见光图像，涵盖脱膜积热、热斑等 10 类典型故障，标注格式为 PASCAL VOC XML。文章详细解析了数据预处理流程，包括如何将 XML 转换为 YOLO 格式，并给出了 dataset.yaml 配置示例及训练建议。通过双模态融合策略，可有效提升小目标缺陷的检测精度，适用于电站智能运维场景。

嘘发布于 2026/4/9更新于 2026/7/2031 浏览

基于 YOLOv8 的无人机红外可见光光伏缺陷检测数据集与训练指南

在光伏电站的智能运维中，利用无人机搭载红外相机进行自动巡检已成为主流趋势。然而，面对复杂的光照、阴影以及细微的组件缺陷，单一模态往往难以达到理想的识别精度。为此，我们整理了一套包含 650 张图像的双模态数据集，旨在辅助开发者构建高精度的缺陷检测模型。

一、数据集概览

本数据集的核心优势在于红外热成像与可见光图像的严格对应。每张有效样本都包含一对图像（红外 + 可见光），并配有 PASCAL VOC XML 格式的标注文件。

项目	详情
总图像数量	650 对（每对含红外与可见光各一张）
标注格式	PASCAL VOC (.xml)
图像分辨率	工业级拍摄，通常为 1024×1024 或更高
应用场景	光伏板故障诊断、AI 辅助运维

💡 提示：虽然原始数据未明确划分比例，建议在实际使用前按 7:2:1 的比例自行划分为训练集、验证集和测试集。

二、数据结构设计

为了便于后续加载与训练，建议按照以下目录结构组织文件：

photovoltaic_defect_dataset/
├── images/
│   ├── infrared/      # 存放红外图像 (如 0001_ir.jpg)
│   └── visible/       # 存放可见光图像 (如 0001_vis.jpg)
├── annotations/       # 存放对应的 XML 标注文件
│   ├── 0001.xml
│   └── ...
└── labels.txt         # 类别名称映射表

命名规范上，请确保同一场景下的红外图、可见光图和 XML 文件名保持一致（例如 0001），仅后缀不同，这样在编写数据加载器时会更加高效。

三、缺陷类别定义

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

ID	标签	中文名称	英文名称	说明
0	dmjrb	脱膜积热	Delamination with hot spot	绝缘层脱落导致局部过热
1	ns	热斑	Hot spot	单元异常发热，常见于老化或遮挡
2	dyrb	断栅	Broken grid line	电极断裂，影响导电性
3	ejgl	裂纹	Crack	硅片或玻璃表面裂痕
4	zw	阻焊	Soldering blockage	焊接不良，阻断电流路径
5	yyzd	电池异质	Cell heterogeneity	电池片内部材料不均
6	ygfs	隐裂	Hidden crack	不可见但可由红外发现的微裂纹
7	ycdw	电容焊点	Capacitive solder point	焊点异常，可能短路
8	dmjrb_ycdw	脱膜积热 + 电容焊点	Delamination + Capacitive solder	复合缺陷
9	dyrb_ycdw	断栅 + 电容焊点	Broken grid + Capacitive solder	复合缺陷

import xml.etree.ElementTree as ET
import os

def convert_xml_to_yolo(xml_path, img_path, output_dir):
    """
    将 PASCAL VOC XML 标注转换为 YOLO 格式
    """
    tree = ET.parse(xml_path)
    root = tree.getroot()
    
    # 获取图片尺寸用于归一化
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    
    # 准备输出文件名
    out_name = os.path.basename(img_path).replace('.jpg', '.txt')
    out_path = os.path.join(output_dir, out_name)
    
    with open(out_path, 'w') as f:
        for obj in root.findall('object'):
            cls_name = obj.find('name').text
            bbox = obj.find('bndbox')
            
            # 提取坐标
            x_min = float(bbox.find('xmin').text)
            y_min = float(bbox.find('ymin').text)
            x_max = float(bbox.find('xmax').text)
            y_max = float(bbox.find('ymax').text)
            
            # 计算中心点和宽高（归一化）
            x_center = (x_min + x_max) / 2.0 / w
            y_center = (y_min + y_max) / 2.0 / h
            width = (x_max - x_min) / w
            height = (y_max - y_min) / h
            
            # 写入一行：class_id x_center y_center width height
            # 实际使用时需建立 cls_name 到 id 的映射字典
            cls_id = class_map.get(cls_name, 0)
            f.write(f"{cls_id} {x_center:.6f} {y_center:.6f} {width:.6f} {height:.6f}\n")

train: ../data/images/train
val: ../data/images/val
test: ../data/images/test
nc: 10
names: ['dmjrb', 'ns', 'dyrb', 'ejgl', 'zw', 'yyzd', 'ygfs', 'ycdw', 'dmjrb_ycdw', 'dyrb_ycdw']

基于 YOLOv8 的无人机红外可见光光伏缺陷检测数据集与训练指南

基于 YOLOv8 的无人机红外可见光光伏缺陷检测数据集与训练指南

一、数据集概览

二、数据结构设计

三、缺陷类别定义

更多推荐文章

相关免费在线工具

四、数据预处理实战

1. XML 转 YOLO 格式

2. 配置 dataset.yaml

五、应用与展望

更多推荐文章

相关免费在线工具

基于 YOLOv8 的无人机红外可见光光伏缺陷检测数据集与训练指南

基于 YOLOv8 的无人机红外可见光光伏缺陷检测数据集与训练指南

一、数据集概览

二、数据结构设计

三、缺陷类别定义

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

四、数据预处理实战

1. XML 转 YOLO 格式

2. 配置 dataset.yaml

五、应用与展望

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具