二月第二周周报(论文阅读)

标题

        A lake water level prediction method based on data augmentation and Physics-Informed Neural Networks with imbalanced data

背景

        作者

                Lingjiang Lu , Tao Yan, Yongcan Chen

        期刊来源

                Journal of hydrology

        DOI

                10.1016/j.jhydrol.2025.134660

摘要

        在过去三十年中,由于气候变化和用水需求增加,湖泊水位波动加剧,迫切需要准确有效的预测方法。然而,现有的基于深度学习的替代方法往往存在两大局限性:缺乏对超参数选择的物理指导,这增加了计算成本,以及极端水位样本的稀缺性,这导致数据集不平衡,准确性降低。为了解决这些局限性,本研究提出了一种新的物理信息神经网络(PINN)框架,该框架将数据增强与物理引导的超参数选择相结合。该框架采用边界水位时间序列作为输入,结合质量守恒约束,并应用基于聚类的增强方法来丰富极端事件样本。在中国南四湖下湖进行了适用性验证。使用均方根误差(RMSE)和纳什-萨特克利夫效率(NSE)进行评估表明,纳入物理约束可以显著提高预测精度,其性能甚至超过了经典的LSTM模型。物理引导下的超参数选择进一步提高了训练效率和准确性,在极端条件下,该增强方法将RMSE降低了69.1%。与现有的增强方法相比,该方法可将训练时间缩短63.35%,预测性能更好。最终代理模型的RMSE = 0.021 m,NSE > 0.94(相对于观测值),计算时间仅为传统水动力模型的2.42%。这些结果突出了该框架在可靠的现实世界水位预测及其向其他水文系统的可转移性方面的潜力。

研究区域以及数据来源

        南四湖是中国山东省最大的淡水湖,是南水北调东线工程(SNWDP-ER)的重要调节水库。20世纪60年代建成的二集大坝(EJ)将南四湖分为上湖和下湖。在干旱期,从12月到次年5月,下湖的水通过SNWDP-ER泵送到上湖。在汛期,从6月到11月,EJ闸门打开,将上湖多余的水释放到下湖。

算法

流动时间模式的识别

        通过检测连续排放的序列来识别离散的流动事件,并使用零流量记录作为事件分离的标记。然后将流动时间模式的分类表述为多维空间中的聚类问题。将每个流量事件划分为k个等持续时间的区间,并计算每个区间中总水量的比例,以获得一组相对流量值q。这种转换允许将每个流量事件表示为k维空间中的一个点。随后根据合适的相似度指数进行聚类,本研究采用欧几里得距离L2,定义为:

        式中xi(l)和xj(l)分别为流动事件I和j第l段的水体积比。为了识别具有代表性的流动时间模式。

        基于已识别的流动时间模式的特征,以及历史流动事件的持续时间和强度,选择适当的连续函数来随机生成合成流动事件,作为入口边界数据。这种方法通过补充代表性不足的流动模式和增强整体数据多样性,有助于缓解数据集中的不平衡。

利用MLP生成水位边界数据

        在使用高保真水动力模型生成训练样本时,必须指定至少一个WL边界条件来模拟湖泊水动力。这些边界条件表现出内在的依赖关系和相互影响,这意味着合成样品的WL边界数据应根据其他边界对应的合成流动事件来确定,而不是通过简单的随机生成或组合。

基于pinn的代理模型

        基于pup的代理模型(PSM),该模型集成了质量守恒的物理定律,与纯粹的数据驱动模型相比,增强了可解释性和通用性。此外,他们还引入了一种新颖的网络架构,消除了对偏导数计算的需要,显著提高了模型的鲁棒性。在此框架的基础上,本研究利用PSM构建了一个用于水动力建模的神经网络。

结果分析

        利用EJ和DD两个观测站的WL模拟对水动力模型进行了验证。两个观测站的RMSE值均低于0.1 m, NSE值均超过0.95,表明该模型在捕捉WL时空变化方面具有较高的精度。该模型在边界附近区域(如EJ和HZ)和湖内区域(如DD和中心域)表现良好,即使受到有限边界条件的约束。

        首先,使用零流量记录将2019年至2021年的历史洪流量数据分割为9个不同的流量事件。将每个事件划分为10个等持续时间区间,计算每个区间的总流量占总流量的比例。然后将这些比例用作HCA的输入。基于聚类结果,将9个流事件分为三种时间模式。为了确保增强流数据集的多样性,为每个模式随机生成三个连续函数。然后根据洪水流量的历史范围(30-2290 m3/s)和持续时间(3-58天)对这些函数进行均匀采样和缩放。此外,引入随机噪声以增强变异性,从而产生总共9个合成流量过程。

        基于EJ处的增强流事件,采用MLP模型生成HZ处相应的WL变化。MLP模型使用历史数据进行训练,输入包括前一天的流量和WL数据,以及当天的流量数据。输出是当天的WL。

        该框架为湖泊和水库的水位建模和模型优化提供了一个可重复且计算效率高的配方。物理信息的正则化和超参数规则为代理设计提供了一般指导,而基于聚类的增强策略广泛适用于极端事件代表性不足的不平衡数据集。尽管如此,该方法在研究湖泊的中心区域仍然表现出相对较大的预测误差。这种限制源于目前使用的质量守恒约束,它在每个网格单元内提供的局部指导不足。未来的工作将探索在损失函数中加入额外的物理约束,以进一步提高模型精度。

Read more

基于深度学习的无人机航拍小目标检测算法研究

基于深度学习的无人机航拍小目标检测算法研究

本项目针对无人机航拍场景下的小目标检测问题,基于 YOLO11 系列模型,在 VisDrone 2019 数据集上进行训练与优化,并提供了完整的检测系统桌面应用,支持图片、视频、摄像头的实时检测与训练指标可视化。 一、项目概述 无人机航拍图像具有目标尺度小、密集分布、多尺度混合等特点,传统检测算法难以取得理想效果。本项目采用 Ultralytics YOLO11 框架,结合 VisDrone 数据集进行训练,实现了对行人、车辆等 10 类交通相关目标的高效检测,并配套开发了基于 PyQt6 的桌面应用,便于模型验证与日常使用。 二、数据集 2.1 数据集简介 本项目使用 VisDrone 2019-DET 数据集,由天津大学机器学习与数据挖掘实验室 AISKYEYE 团队发布,对应 ICCV 2019 "Vision

【VSCode Copilot登录失败终极指南】:9大常见问题与高效解决方案

第一章:VSCode Copilot登录失败的典型表现 当使用 VSCode 中的 GitHub Copilot 插件时,用户在尝试登录过程中可能会遇到多种异常现象。这些表现不仅影响代码补全功能的正常使用,还可能干扰开发流程。以下是常见的登录失败典型表现。 认证窗口无法加载 部分用户在点击“Sign in to GitHub”后,浏览器或内置认证弹窗长时间停留在加载状态,最终显示空白页面或提示网络错误。这通常与本地网络策略、代理设置或防火墙规则有关。 登录成功但插件无响应 尽管认证流程显示已完成,Copilot 图标仍显示未登录状态,且不提供任何代码建议。此时可在命令面板(Ctrl+Shift+P)中执行以下命令检查状态: # 检查 Copilot 当前会话状态 Developer: Reload With Extensions Disabled # 重新启用后再次尝试 GitHub Copilot: Sign in to GitHub 错误提示信息汇总

YOLO+OpenClaw+SAM微调实战:工业缺陷自动标注的低代码落地

YOLO+OpenClaw+SAM微调实战:工业缺陷自动标注的低代码落地

YOLO+OpenClaw+SAM微调实战:工业缺陷自动标注的低代码落地 不能实时,不代表不能用。微调SAM+云端部署,让工业标注从“人工描边”变“一键验收”。 大家好,我是AI小怪兽。上周有位做PCB质检的读者发来一段视频:标注员正对着一块电路板缺陷图,用鼠标一点点勾勒划痕的边界,一张图花了8分钟。他说:“YOLO能框,但框不准;SAM能分割,但通用模型到我们产线就水土不服。有没有办法让标注员少点鼠标?” 当然有。今天我就结合工业缺陷检测场景,展示一套低代码落地路径:YOLO粗定位 + 微调SAM精分割 + OpenClaw自动调度,让标注员从“动手画”变成“动口验收”。 一、工业自动标注的三道坎 坎1:OpenClaw无法实时推理 OpenClaw从接收指令到调用模型返回结果,5秒以上是常态。产线上的产品不可能等5秒,但标注任务可以——把数千张图丢给AI,让它半夜慢慢跑,员工早上来验收结果,不香吗? 坎2:边缘端算力要求大,且存在安全风险 OpenClaw调用大模型需要至少8GB显存,

为什么90%的无人机避障失败?C语言优化策略全曝光

第一章:90%无人机避障失败的根源剖析 在消费级与工业级无人机广泛应用的今天,避障系统本应是飞行安全的核心保障。然而统计显示,超过90%的避障失效事故并非源于硬件损坏,而是由感知-决策链路中的系统性缺陷所致。 传感器融合算法的盲区 多数无人机依赖多传感器融合(如单目视觉、红外、超声波)进行环境建模。但由于缺乏统一的时间戳对齐机制,数据不同步常导致误判。例如: // 伪代码:未同步的传感器读取逻辑 float ultrasonic_dist = readUltrasonic(); // 延迟约50ms float vision_dist = getVisionDepthFrame().distance; // 延迟约80ms if (ultrasonic_dist > vision_dist) { // 可能错误地认为前方无障碍 continueFlight(); } 该逻辑未考虑延迟差异,在高速飞行中极易造成误判。 动态障碍物预测能力缺失 当前避障系统多基于静态环境假设,无法有效预测移动物体轨迹。测试表明,在行人横穿路径场景下,78%的商用无人机未能及时制动。 以下为常