【超音速专利 CN118134841A】一种光伏产品缺陷检测AI深度学习算法

优质文章学习记录

10 Apr 2026 — 7 min read


申请号	CN202410053849.9
公开号（公开）	CN118134841A
申请日	2024.01.12
申请人（公开）	超音速人工智能科技股份有限公司(833753)
发明人（公开）	张俊峰（总); 叶长春(总); 廖绍伟

原文摘要

本发明公开一种光伏产品缺陷检测AI深度学习算法，涉及AI算法领域。该光伏产品缺陷检测AI深度学习算法，采用深度卷积神经网络作为预训练模型，使用特征金字塔网络结构FPN对预训练模型得到的不同尺度的特征图进行融合，采用区域提议网络RPN在特征图上生成候选框，该光伏产品缺陷检测AI深度学习算法通过使用预训练模型提取图像特征，使用FPN融合多尺度特征，使用RPN提取候选框，使用ROIAlign抽取局部特征，使用分类、回归、FCN进行缺陷分类、位置回归以及掩膜信息提取，对缺陷的分类以及输出缺陷效果的准确性好，对缺陷的定位精度高，对缺陷的描述准确且全面，从而提高了在光伏产品加工中，对产品的缺陷检测效果。

术语

FCN指的是全卷积网络，是深度学习中用于图像处理任务的一种重要架构，相比于传统的卷积神经网络CNN，FCN不仅能够识别图像中的对象，还能在像素级别对图像进行预测，如图像分割、图像生成等。
全卷积网络是一种由卷积层组成的神经网络架构，没有全连接层。相比于传统的CNN，全卷积网络的主要特点在于它的输出层是一个像素级别的密集特征图，每个像素点都对应输入图像中的一个局部感受野，这使得FCN能够对输入图像进行像素级别的预测和分析，比如图像分割，将图像中的每个像素进行分类，标记其所属的语义类别。
全卷积网络的出现在计算机视觉领域不仅在图像分割任务上取得了显著的成果，而且为其他图像处理任务，如图像生成、图像修复等，提供了重要的基础。全卷积网络在计算机视觉领域具有广泛的适用性。

步骤

1.一种光伏产品缺陷检测AI深度学习算法：所述深度学习算法包括如下步骤：
第一步：采用深度卷积神经网络作为预训练模型，对输入的光伏产品图像进行特征提取，获取图像的高层语义信息，得到不同尺度的特征图；
第二步：使用特征金字塔网络结构FPN对预训练模型得到的不同尺度的特征图进行融合，增强模型对不同尺寸产品缺陷的检测能力；
第三步：采用区域提议网络RPN在特征图上生成候选框，这些候选框涵盖了存在缺陷的区域和信息，以实现后续产品的缺陷快速检测；
第四步：使用ROIAlign技术从候选框中抽取出局部特征，以供后续的分类和回归任务使用；
第五步：利用全卷积网络FCN对局部特征进行分类，并同时进行回归操作以精确定位缺陷的位置；
第六步：除了分类和位置回归外，还利用FCN从局部特征中提取掩膜信息，以得到缺陷的精确形状和大小。
2：在第一步中，首先选择适用于光伏产品缺陷检测任务的预训练模型，然后，将预训练模型导入到算法中，并将待检测的光伏产品缺陷图像输入到模型中。
3.在第二步中，利用特征金字塔网络融合来自不同尺度的特征图，同时利用低层特征图的空间信息和高层特征图的语义信息，将这些特征图进行融合。
4.在第三步中，使用区域生成网络来提取候选框，RPN网络得到所有anchors的分类、回归信息，RPN基于特征图。
5.在第四步中，使用ROIAlign操作来抽取候选框内的局部特征，根据RPN网络输出的分类、回归信息，经过NMS得到最终的ROIs。
6.第五步中，对筛选出来的ROIs进行分类、回归、mask分割操作，使用分类器对候选框进行缺陷分类。
7.第六步中：分类器是传统的机器学习方法。
8.第七步中：分类器是深度学习方法。
9.在第六步，通过位置回归，根据分类结果和候选框的位置信息，对缺陷的位置进行进一步的调整和修正，同时，根据FCN得到的掩膜信息，进一步提取缺陷信息。

总结

该光伏产品缺陷检测AI深度学习算法，通过使用预训练模型提取图像特征，使用FPN融合多尺度特征，使用RPN提取候选框，使用ROIAlign抽取局部特征，使用分类、回归、FCN进行缺陷分类、位置回归以及掩膜信息提取，对缺陷的分类以及输出缺陷效果的准确性好，对缺陷的定位精度高，对缺陷的描述准确且全面，从而提高了在光伏产品加工中，对产品的缺陷检测效果。

硬件需求

工控机+显卡

扩展阅读

我想对大家说的话
工作中遇到的问题，可以按类别查阅鄙人的算法文章，请点击《算法与数据汇总》。
学习算法：按章节学习《喜缺全书算法册》，大量的题目和测试用例，打包下载。重视操作
有效学习：明确的目标及时的反馈拉伸区（难度合适）专注
员工说：技术至上，老板不信；投资人的代表说：技术至上，老板会信。
闻缺陷则喜(喜缺)是一个美好的愿望，早发现问题，早修改问题，给老板节约钱。
子墨子言之：事无终始，无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙，那算法就是他的是睛
失败+反思=成功成功+反思=成功

视频课程

先学简单的课程，请移步ZEEKLOG学院，听白银讲师（也就是鄙人）的讲解。
https://edu.ZEEKLOG.net/course/detail/38771
如何你想快速形成战斗了，为老板分忧，请学习C#入职培训、C++入职培训等课程
https://edu.ZEEKLOG.net/lecturer/6176

测试环境

操作系统：win7 开发环境： VS2019 C++17
或者操作系统：win10 开发环境： VS2022 C++17
如无特殊说明，本算法用**C++**实现。

（10-1）大模型时代的人形机器人感知：视觉-语言模型在机器人中的应用

本章内容聚焦大模型时代人形机器人的感知体系升级，系统介绍了视觉—语言模型、多模态Transformer与3D大模型在机器人中的核心作用，详细讲解了文本、视觉、点云与语音等信息的语义对齐与融合机制，介绍了从语言指令到视觉目标的Grounding、任务分解与意图理解方法，并通过闭环感知与决策联动，展示了大模型支撑机器人在复杂真实场景中的理解、规划与实时行动的用法。 10.1 视觉-语言模型在机器人中的应用视觉—语言模型（Vision-Language Model，VLM）通过统一建模视觉与自然语言，使机器人具备“看懂并理解语言”的能力，是大模型时代机器人感知与认知融合的核心技术。VLM不仅能够完成图像识别、目标检测等传统感知任务，还可以直接理解语言指令、进行语义推理，并将高层语义映射为可执行的感知与行动目标，在人形机器人中广泛应用于交互理解、场景认知和任务执行等环节。 10.1.1 CLIP/BLIP/Flamingo等模型简介随着大规模多模态数据与Transformer架构的发展，视觉—语言模型逐渐从“跨模态对齐”演进为“多模态理解与推理”。CLIP、BLIP与Flam

免费部署openClaw龙虾机器人（经典）

前几天出了个免费玩龙虾的详细教程，很多小伙伴觉得不错，但是还有一些新手留言反馈内容不够详细，这次我将重新梳理一遍，做一期更细致的攻略，同时扩展补充配置好之后的推荐（我认为是必要）操作，争取一篇文章让大家可以收藏起来，随时全套参照复用。先看效果测试部署完成基础运行效果测试，你可以直接问clawdbot当前的模型： 1.Token平台准备首先，还是准备好我们可以免费撸的API平台这里我找到了两个可以免费使用的API，测试之后执行效率还可以，下面将分别进行细致流程拆解。 1.1 硅基流动获取ApiKey （相对免费方案推荐）硅基流动地址：https://cloud.siliconflow.cn/i/6T57VxS2 如果有账号的直接登录，没有的注册一个账号，这个认证就送16元，可以直接玩收费模型，真香。认证完成后在API秘钥地方新建秘钥。硅基流动里面很多模型原来是免费的，有了16元注册礼，很多收费的模型也相当于免费用了，我体验一下了原来配置免费模型还能用，也是值得推荐的。建议使用截图的第一个模型体验一下，我一直用它。 1.2 推理时代

深入剖析云原生Service Mesh数据平面Envoy核心架构：基于xDS协议与WebAssembly实现动态流量管理与安全策略的微服务治理实战指南

深入剖析云原生Service Mesh数据平面Envoy核心架构：基于xDS协议与WebAssembly实现动态流量管理与安全策略的微服务治理实战指南在云原生微服务架构的演进中，Service Mesh（服务网格）已成为处理服务间通信的标准基础设施。而在这一架构中，Envoy 凭借其高性能的 C++ 实现、可扩展的架构以及作为 Istio 默认数据平面的地位，成为了事实上的“Sidecar之王”。本文将深入剖析 Envoy 的核心架构，重点解析其如何通过 xDS 协议实现动态配置，以及如何利用 WebAssembly (Wasm) 技术突破传统的扩展瓶颈，实现微服务的流量管理与安全策略治理。 1. Envoy 核心架构全景：高性能的“四层”模型 Envoy 本质上是一个高性能的边缘/服务代理，其设计核心在于将网络处理逻辑分解为清晰的层级。这种设计不仅保证了极高的吞吐量，也使得配置极其灵活。 1.1 逻辑架构分层 Envoy 的逻辑架构自上而下分为四个核心层次： Level 1: 线程模型与I/

【前端的坑】vxe-grid表格tooltip提示框不显示bug

官方API：注意：如果是false的话表格宽度会按照内容多少来决定；而如果是true的话默认是 tooltip 效果。当showOverflow值为 tooltip时： gridOptions: { showOverflow: 'tooltip', ...... }, 效果：当showOverflow值为 ellipsis时： gridOptions: { showOverflow: 'ellipsis', ...... }, 效果： showOverflow字段设置了tooltip却不生效的可能有这两种： 1. 在插槽中使用了div而不是span标签（参考博客：vxe-table 解决show-overflow只显示弹窗不显示省略号或默认样式有省略号，弹窗不出现问题） 2. z-index 太低了，请添加如下样式 .vxe-table--tooltip-wrapper { z-index: 99 !important; }