YOLO+OpenClaw+SAM微调实战:工业缺陷自动标注的低代码落地

YOLO+OpenClaw+SAM微调实战:工业缺陷自动标注的低代码落地

YOLO+OpenClaw+SAM微调实战:工业缺陷自动标注的低代码落地

不能实时,不代表不能用。微调SAM+云端部署,让工业标注从“人工描边”变“一键验收”。

大家好,我是AI小怪兽。上周有位做PCB质检的读者发来一段视频:标注员正对着一块电路板缺陷图,用鼠标一点点勾勒划痕的边界,一张图花了8分钟。他说:“YOLO能框,但框不准;SAM能分割,但通用模型到我们产线就水土不服。有没有办法让标注员少点鼠标?”

当然有。今天我就结合工业缺陷检测场景,展示一套低代码落地路径:YOLO粗定位 + 微调SAM精分割 + OpenClaw自动调度,让标注员从“动手画”变成“动口验收”。

一、工业自动标注的三道坎

坎1:OpenClaw无法实时推理
OpenClaw从接收指令到调用模型返回结果,5秒以上是常态。产线上的产品不可能等5秒,但标注任务可以——把数千张图丢给AI,让它半夜慢慢跑,员工早上来验收结果,不香吗?

坎2:边缘端算力要求大,且存在安全风险
OpenClaw调用大模型需要至少8GB显存,普通办公电脑扛不住。更关键的是,OpenClaw能读写文件、执行命令,放在个人电脑上相当于请了个“有权限的陌生人”。我的建议:云端隔离部署,算力交给腾讯云,安全也交给腾讯云。

坎3:通用SAM“水土不服”
SAM擅长分割自然图像,但面对工业缺陷(划痕、凹坑、毛刺)时,边界常常跑偏。我实验后得出的结论:微调SAM能让分割精度提升约30%,且只需微调2%的参数。

二、微调SAM:工业缺陷精分割的低代码方案

2.1 为什么用LoRA微调?

全量微调SAM需要8张V100跑几天,普通用户根本搞不定。而LoRA微调只更新约2%的参数,训练速度提升3倍,效果接近全量微调。简单说:用更少的资源,达到近似全量微调的效果。

2.2 核心代码(复制即用)

python

from peft import LoraConfig, get_peft_model from segment_anything import sam_model_registry # 加载通用SAM sam = sam_model_registry["vit_h"](checkpoint="sam_vit_h.pth") # 配置LoRA(只调整注意力层) lora_config = LoraConfig( r=16, # 秩维度 lora_alpha=32, target_modules=["qkv"], # 只改查询/键/值层 lora_dropout=0.1 ) # 应用LoRA model = get_peft_model(sam, lora_config) # 可训练参数占比仅2.5%,显存需求从24GB降到8GB

2.3 工业专用损失函数

工业缺陷有两个特点:一是样本少(划痕只占图像的极小部分),二是边界重要。我设计了混合损失函数来应对:

python

def industrial_loss(pred, target): """ Dice + Focal组合 - Dice:让分割边界更贴合 - Focal:让模型更关注难分的缺陷区域 """ pred_sigmoid = torch.sigmoid(pred) # Dice Loss(边界贴合) intersection = (pred_sigmoid * target).sum() dice = 1 - (2 * intersection) / (pred_sigmoid.sum() + target.sum() + 1e-6) # Focal Loss(关注难例) ce = torch.nn.functional.binary_cross_entropy_with_logits(pred, target, reduction='none') pt = torch.exp(-ce) focal = 0.25 * (1-pt)**2 * ce return 0.6 * dice + 0.4 * focal.mean()

实际效果:某PCB厂商用此方案后,<0.1mm的微小划痕召回率从58%提升到87%,标注员修正时间从每张图5分钟缩短到40秒。

三、低代码落地:YOLO检测 + SAM微调 + OpenClaw调度

3.1 自动标注器核心代码

python

import cv2, json, numpy as np from ultralytics import YOLO from segment_anything import SamPredictor from peft import PeftModel class IndustrialAnnotator: def __init__(self, yolo_path, sam_path, lora_path): self.yolo = YOLO(yolo_path) # YOLO检测 sam = sam_model_registry["vit_h"](checkpoint=sam_path) peft_model = PeftModel.from_pretrained(sam, lora_path) # 加载微调权重 self.predictor = SamPredictor(peft_model) def annotate(self, img_path, out_dir): img = cv2.imread(img_path) self.predictor.set_image(img) # 1. YOLO粗定位 results = self.yolo(img)[0] annotations = [] for box in results.boxes: x1,y1,x2,y2 = map(int, box.xyxy[0]) # 2. SAM微调精分割 masks,_,_ = self.predictor.predict(box=np.array([x1,y1,x2,y2])) mask = masks[0] annotations.append({ "type": self.yolo.names[int(box.cls[0])], "bbox": [x1,y1,x2,y2], "mask": mask.tolist() }) # 3. 输出JSON标注文件 with open(f"{out_dir}/{Path(img_path).stem}.json", 'w') as f: json.dump(annotations, f)

3.2 OpenClaw低代码配置

代码部署后,只需在OpenClaw里说一句话,就能建立自动化流程:

text

用户:每天凌晨2点,用 industrial-annotator 技能处理 /data/defect_raw/ 目录下的图片, 先用YOLO检测缺陷,再用微调后的SAM生成精细掩码,输出标注文件到 /data/defect_annotated/ OpenClaw:已创建定时任务,每天2:00执行批量标注

员工早上上班,直接打开文件夹验收,修正率从80%降到20%。

四、腾讯云Lighthouse一键部署

既然本地跑不动、有风险,那就上云。腾讯云Lighthouse是我实测过最省心的方案。

4.1 为什么选它?

  • 模板一键部署:选“应用模板”→“AI智能体”→“OpenClaw”,30秒创建环境
  • 价格白菜:2核2GB实例新用户仅99元/年
  • 安全隔离:云端运行,不会误删本地文件
  • 低代码配置:所有操作都在网页完成,不用敲命令行

4.2 部署步骤(全程鼠标点)

第一步:购买服务器
访问腾讯云轻量应用服务器购买页 → 选择“应用模板” → “AI智能体” → “OpenClaw(Clawdbot)” → 配置2核2GB(99元/年)→ 下单

第二步:配置模型
进入服务器“应用管理”页面 → 在模型配置区选择“通义千问”或“腾讯混元” → 粘贴API Key → 点击“添加并应用”

第三步:上传微调权重
用WinSCP将训练好的LoRA权重上传到服务器

第四步:安装技能
在OpenClaw控制台 → Skills配置页 → 输入“industrial-annotator” → 点击安装

第五步:接入IM
进入“通道配置” → 选择企业微信/钉钉 → 填写Bot凭证 → 发布后即可在聊天软件里下达指令

五、落地成果展示

案例:深圳某PCB制造企业,每天需标注3000张缺陷图,原有流程:

  • 人工逐张标注:8分钟/张 → 每天400小时人力
  • 标注员5人,月成本3万元

采用本方案后

  • AI自动标注:2小时完成3000张(凌晨运行)
  • 标注员修正:40秒/张 → 每天35小时
  • 人力减少至1人,月成本6000元
  • 年度节省28.8万元

效果对比

指标微调前微调后
缺陷召回率68%92%
分割边界IoU0.730.89
人工修正时间/张5分钟40秒

写在最后

当下的YOLO+OpenClaw+SAM,确实做不到实时质检。但那又怎样?

先别盯着“实时”不放,把工业场景的批量标注方案用起来——用LoRA微调SAM,用混合损失优化边界,用腾讯云一键部署,立刻就能帮标注团队提效、帮企业降本。

通过腾讯云Lighthouse,你甚至不用写一行复杂代码,就能拥有一个7×24小时在线的、经过微调的AI标注员。

我是AI小怪兽,让每一行代码都有温度。下期见!🦞

Read more

发送webhook到飞书机器人

发送webhook到飞书机器人

发送webhook到飞书机器人 参考链接 自定义机器人使用指南 创建自定义机器人 1. 邀请自定义机器人进群。 2. 3. 获取签名校验 在 安全设置 区域,选择 签名校验。 获取自定义机器人的 webhook 地址 机器人对应的 webhook 地址 格式如下: https://open.feishu.cn/open-apis/bot/v2/hook/xxxxxxxxxxxxxxxxx 请妥善保存好此 webhook 地址,不要公布在 Gitlab、博客等可公开查阅的网站上,避免地址泄露后被恶意调用发送垃圾消息。 设置自定义机器人的头像、名称与描述,并点击 添加。 在 群机器人 界面点击 添加机器人。在 添加机器人 对话框,找到并点击 自定义机器人。

Google VR SDK for Unity开发环境快速搭建指南

Google VR SDK for Unity是一个功能强大的开发工具包,专为在Unity引擎中构建沉浸式虚拟现实应用而设计。无论你是VR开发新手还是经验丰富的开发者,本指南都将帮助你快速配置完整的开发环境。 【免费下载链接】gvr-unity-sdkGoogle VR SDK for Unity 项目地址: https://gitcode.com/gh_mirrors/gv/gvr-unity-sdk 项目概览与核心优势 Google VR SDK提供了完整的VR开发解决方案,从基础的头部追踪到高级的6自由度控制器交互。该SDK支持Daydream、Cardboard等多种VR平台,让开发者能够轻松创建跨设备的VR体验。 主要功能特点 * 6自由度追踪:支持完整的空间定位和旋转 * 多平台兼容:适配Android和iOS设备 * 高性能渲染:优化的图形管线确保流畅体验 * 完整的输入系统:支持控制器、手势等多种交互方式 环境搭建快速入门 系统要求与必备工具 在开始之前,请确保你的开发环境满足以下要求: Unity版本:2017.4或更高版本 Andr

AI绘画电商产品提示词撰写指南

AI绘画电商产品提示词撰写指南

在电商领域,利用 AI 绘画生成产品图片正逐渐成为提升商品视觉吸引力、提高运营效率的重要手段。而撰写精准有效的提示词,是让 AI 理解并生成符合预期产品图片的关键。 一、明确产品关键信息 产品基础描述 产品类型与用途:清晰界定产品所属类别,无论是服装、电子产品、家居用品还是美妆产品等,这是 AI理解产品的基础。同时,简要说明产品的核心用途或目标受众,可分为3层结构(按优先级排序) * 基础层:明确产品核心属性(避免 AI 生成偏差),包括「产品类别 + 规格 + 材质 / 工艺」,例: “女士夏季短袖连衣裙(长度到膝盖),雪纺面料,蕾丝领口” * 场景层:搭建使用场景(增强代入感),包括「使用环境 + 搭配元素 + 人群画像」,例: “在海边沙滩场景,搭配草编帽和珍珠凉鞋,适合 25-35

Flutter 三方库 arcade 的鸿蒙化适配指南 - 实现高性能的端侧 Web 框架、支持轻量级 HTTP 路由分发与服务端逻辑集成

Flutter 三方库 arcade 的鸿蒙化适配指南 - 实现高性能的端侧 Web 框架、支持轻量级 HTTP 路由分发与服务端逻辑集成

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 arcade 的鸿蒙化适配指南 - 实现高性能的端侧 Web 框架、支持轻量级 HTTP 路由分发与服务端逻辑集成 前言 在进行 Flutter for OpenHarmony 的全栈式开发或特定的边缘计算场景,我们有时需要在鸿蒙应用内部直接启动一个功能完备但又极其轻量的单文件 Web 服务器。arcade 是一个主打微核心设计的 Dart 服务端框架。它能让你在鸿蒙真机上以最少的内存占用,快速运行起一套处理 REST 请求的逻辑中心。本文将指导大家如何在鸿蒙端利用该框架构建微服务。 一、原理解析 / 概念介绍 1.1 基础原理 arcade 采用了非阻塞式的 IO 事件循环架构。它通过直接包装 dart:io 的 HttpServer,提供了一套高度流式(