跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

基于数据增强与物理信息神经网络的湖泊水位预测研究

一种基于数据增强与物理信息神经网络(PINN)的湖泊水位预测方法。针对现有深度学习模型缺乏物理指导及极端样本稀缺问题,该框架结合质量守恒约束与聚类增强策略。在南四湖下湖验证显示,物理约束显著提升精度,优于 LSTM 模型,极端条件下 RMSE 降低 69.1%,计算效率大幅提升。

字节跳动发布于 2026/4/5更新于 2026/5/2225 浏览

基于数据增强与物理信息神经网络的湖泊水位预测研究

摘要

在过去三十年中,由于气候变化和用水需求增加,湖泊水位波动加剧,迫切需要准确有效的预测方法。然而,现有的基于深度学习的替代方法往往存在两大局限性:缺乏对超参数选择的物理指导,这增加了计算成本,以及极端水位样本的稀缺性,这导致数据集不平衡,准确性降低。为了解决这些局限性,本研究提出了一种新的物理信息神经网络 (PINN) 框架,该框架将数据增强与物理引导的超参数选择相结合。该框架采用边界水位时间序列作为输入,结合质量守恒约束,并应用基于聚类的增强方法来丰富极端事件样本。在中国南四湖下湖进行了适用性验证。使用均方根误差 (RMSE) 和纳什 - 萨特克利夫效率 (NSE) 进行评估表明,纳入物理约束可以显著提高预测精度,其性能甚至超过了经典的 LSTM 模型。物理引导下的超参数选择进一步提高了训练效率和准确性,在极端条件下,该增强方法将 RMSE 降低了 69.1%。与现有的增强方法相比,该方法可将训练时间缩短 63.35%,预测性能更好。最终代理模型的 RMSE = 0.021 m, NSE > 0.94(相对于观测值),计算时间仅为传统水动力模型的 2.42%。这些结果突出了该框架在可靠的现实世界水位预测及其向其他水文系统的可转移性方面的潜力。

文献信息

  • 期刊来源: Journal of hydrology
  • DOI: 10.1016/j.jhydrol.2025.134660

研究区域以及数据来源

南四湖是中国山东省最大的淡水湖,是南水北调东线工程 (SNWDP-ER) 的重要调节水库。20 世纪 60 年代建成的二集大坝 (EJ) 将南四湖分为上湖和下湖。在干旱期,从 12 月到次年 5 月,下湖的水通过 SNWDP-ER 泵送到上湖。在汛期,从 6 月到 11 月,EJ 闸门打开,将上湖多余的水释放到下湖。

文章配图

算法

流动时间模式的识别

通过检测连续排放的序列来识别离散的流动事件,并使用零流量记录作为事件分离的标记。然后将流动时间模式的分类表述为多维空间中的聚类问题。将每个流量事件划分为 k 个等持续时间的区间,并计算每个区间中总水量的比例,以获得一组相对流量值 q。这种转换允许将每个流量事件表示为 k 维空间中的一个点。随后根据合适的相似度指数进行聚类,本研究采用欧几里得距离 L2,定义为:

文章配图

式中 xi(l) 和 xj(l) 分别为流动事件 I 和 j 第 l 段的水体积比。为了识别具有代表性的流动时间模式。

基于已识别的流动时间模式的特征,以及历史流动事件的持续时间和强度,选择适当的连续函数来随机生成合成流动事件,作为入口边界数据。这种方法通过补充代表性不足的流动模式和增强整体数据多样性,有助于缓解数据集中的不平衡。

利用 MLP 生成水位边界数据

在使用高保真水动力模型生成训练样本时,必须指定至少一个 WL 边界条件来模拟湖泊水动力。这些边界条件表现出内在的依赖关系和相互影响,这意味着合成样品的 WL 边界数据应根据其他边界对应的合成流动事件来确定,而不是通过简单的随机生成或组合。

基于 PINN 的代理模型

基于 PSM 的代理模型,该模型集成了质量守恒的物理定律,与纯粹的数据驱动模型相比,增强了可解释性和通用性。此外,他们还引入了一种新颖的网络架构,消除了对偏导数计算的需要,显著提高了模型的鲁棒性。在此框架的基础上,本研究利用 PSM 构建了一个用于水动力建模的神经网络。

结果分析

利用 EJ 和 DD 两个观测站的 WL 模拟对水动力模型进行了验证。两个观测站的 RMSE 值均低于 0.1 m, NSE 值均超过 0.95,表明该模型在捕捉 WL 时空变化方面具有较高的精度。该模型在边界附近区域 (如 EJ 和 HZ) 和湖内区域 (如 DD 和中心域) 表现良好,即使受到有限边界条件的约束。

文章配图

首先,使用零流量记录将 2019 年至 2021 年的历史洪流量数据分割为 9 个不同的流量事件。将每个事件划分为 10 个等持续时间区间,计算每个区间的总流量占总流量的比例。然后将这些比例用作 HCA 的输入。基于聚类结果,将 9 个流事件分为三种时间模式。为了确保增强流数据集的多样性,为每个模式随机生成三个连续函数。然后根据洪水流量的历史范围 (30-2290 m3/s) 和持续时间 (3-58 天) 对这些函数进行均匀采样和缩放。此外,引入随机噪声以增强变异性,从而产生总共 9 个合成流量过程。

文章配图

基于 EJ 处的增强流事件,采用 MLP 模型生成 HZ 处相应的 WL 变化。MLP 模型使用历史数据进行训练,输入包括前一天的流量和 WL 数据,以及当天的流量数据。输出是当天的 WL。

文章配图

该框架为湖泊和水库的水位建模和模型优化提供了一个可重复且计算效率高的配方。物理信息的正则化和超参数规则为代理设计提供了一般指导,而基于聚类的增强策略广泛适用于极端事件代表性不足的不平衡数据集。尽管如此,该方法在研究湖泊的中心区域仍然表现出相对较大的预测误差。这种限制源于目前使用的质量守恒约束,它在每个网格单元内提供的局部指导不足。未来的工作将探索在损失函数中加入额外的物理约束,以进一步提高模型精度。

目录

  1. 基于数据增强与物理信息神经网络的湖泊水位预测研究
  2. 摘要
  3. 文献信息
  4. 研究区域以及数据来源
  5. 算法
  6. 流动时间模式的识别
  7. 利用 MLP 生成水位边界数据
  8. 基于 PINN 的代理模型
  9. 结果分析
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • AIGC电商实战:OpenCSG公益课厘清“品牌叙事”与“商品素材”的AI应用边界
  • 前端加密(常用加密方式及使用)
  • Java 对象比较详解:基本类型与自定义类实现
  • 前端实战:使用 HTML、CSS 和 JavaScript 实现网页井字棋
  • Java 后端通过 WebSocket 向前端推送消息
  • 动态规划详解:爬楼梯问题与核心思想
  • 2025 年睿抗机器人开发者大赛 CAIP-编程技能赛本科组国赛解题报告
  • FPGA 验证核心:AXI Verification IP (AXI VIP) 全方位解析
  • AIGC 个性化与定制化内容生成:技术原理与应用
  • 二叉搜索树 C++ 实现:增删查改详解
  • Python asyncio 异步编程核心指南
  • 近端策略优化算法 (PPO) 原理与 PyTorch 实现详解
  • Ghostty + Yazi + Lazygit:构建现代化终端开发环境
  • ROS 2 机器人运行与命令解析:海龟仿真器及 rqt 工具
  • B 站直播间自动化弹幕机器人配置与开发指南
  • 基于 AI 工具的学术写作效率提升方案与工具对比
  • JavaSE 核心知识点整理
  • ChatGPT Prompt Hacker 技巧:优化简历通过 AI 筛选
  • C 语言快速排序详解:从基础到非递归实现
  • Apache IoTDB 时序数据管理:写入、存储与查询优化

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online