JFM | 空军工程大学宗豪华、吴云等:基于FPGA的深度强化学习框架实现超音速闭环智能流动控制实验

JFM | 空军工程大学宗豪华、吴云等:基于FPGA的深度强化学习框架实现超音速闭环智能流动控制实验

基于高速实验深度强化学习框架的超音速闭环流动控制

Closed-loop supersonic flow control with a high-speed experimental deep reinforcement learning framework

宗豪华¹,吴云¹,李金平²,苏志²,梁华²

引用格式:H. Zong, Y. Wu, J. Li, Z. Su, and H. Liang. Closed-loop supersonic flow control with a high-speed experimental deep reinforcement learning framework[J], Journal of Fluid Mechanics, 2025, 1009: A3.

编者按

复杂流动控制研究受限于缺乏低阶显示表达的流体动力学模型,所以长期以来多采用试探、观察和分析三步走“马后炮”式研究模式。无模型自适应控制、强化学习和流场预解分析技术的发展,为打破这类研究模式提供了强有力的方法基础。此文就是一篇深度强化学习解决复杂高速流动闭环控制的杰作。相比低速、低Re流动,高速流动的频谱更宽、流动结构尺度更丰富、系统复杂性更强,这对硬件响应和算法实时性提出了更大的挑战。该文以Ma=2的后台阶流动为例(Re和速度在公开文献中,皆创纪录),采用提出的FeDRL框架,通过仅需10s的风洞运行,就能设计出性能碾压传统遍历试凑法(最佳定频控制,数小时/数天)获得的控制律。

摘要:

虽然基于深度强化学习(DRL)的主动流动控制已经在低雷诺数仿真环境中得到了广泛的验证,但在真实实验条件下进行DRL控制仍存在很大挑战,其中之一便是数据采集和神经网络推理的强实时性(亚ms量级)。本研究提出了一种基于FPGA的高速实验深度强化学习框架(缩写:FeDRL),控制频率最高可10 kHz,比传统基于CPU的框架(100 Hz以下)高出两个数量级。以Mach 2的超音速后台阶流动为例,对FeDRL增强流动掺混的有效性进行测试。结果表明,仅需10秒的风洞运行时间,就能训练出比最佳定频控制还要优越的闭环控制律,将剪切层速度脉动增加21.2%。如此高的控制律优化效率在以前的闭环流动控制实验中还从未报道过(典型风洞测试时间:数小时至数天)。

正文:

图1 现有DRL流动控制研究所对应的速度和雷诺数

主动流动控制(AFC)通过在流场中引入局部可控扰动来改善绕流物体的宏观特性,有望大幅改善飞行器的气动性能,其核心是控制律。深度强化学习作为一种解决博弈和决策问题的最佳机器学习方法,为主动流动控制提供了一个全新思路。图1总结了目前基于DRL的流动控制研究。总体来看,大部分的研究都在低雷诺数条件下开展,对象包括圆柱、翼型等。相比之下,实验研究较少,尤其是高速高雷诺数航空流动的深度强化学习实验研究,目前还是一片空白(图1绿色区域)。这其中的主要难度在于航空流动速度高、湍流结构演化快,典型特征频率在kHz量级。为了能够实现实时在线控制,要求深度强化学习必须在μs量级实现流场感知、神经网络推理以及激励输出。基于CPU的DRL框架受数据通信、采集等环节的限制,控制频率通常在100Hz以下。

图2 基于DRL和RBF神经网络的高速实验DRL控制框架

本研究通过对硬件和算法的高度整合,提出了一种基于FPGA(现场可编程逻辑门阵列)的高速实验DRL控制框架(FeDRL)。数据采集模块直接挂载在FPGA上,能够在一个时钟周期内抓取和输出数据,同时神经网络的计算也能够利用FPGA进行加速,省去了传统框架中硬件间的通信时间。图2以经典的DQN算法为例进行了示意。该框架包含了两个并行执行的循环:在FPGA控制器中高速执行的实时控制循环(1-10kHz)和在CPU上的低速训练循环(10Hz)。神经网络控制律采用了结构简单、参数量少的径向基函数进行表达,典型控制频率可以达到1kHz量级以上。前期,该框架的有效性已在低速后台阶流动(POF, 2024, 36:105102)和翼型分离流动(POF, 2024, 36:091708)中得到了验证。本研究的重点旨在进一步将其拓展到超音速流动。

图3 (a)- (b)平板实验模型的示意图;(c)等离子体激励器结构

超音速后台阶流动控制实验在空军工程大学的超音速风洞中进行,马赫数为2。等离子体合成射流激励器作为主动控制装置对流场施加扰动,下游剪切层中的热线传感器提供流场的反馈信息,目标是最大化剪切层内的速度脉动。结果表明,仅需10秒的训练时间,FeDRL框架就能找到有效的闭环控制策略,使瞬时奖励rt从0上升至0.2左右,同时训练损失也在10秒内迅速收敛。对比基于策略的DRL算法(如PPO),FeDRL框架的优化效率高出一个数量级。从功率谱密度对比也可验证DRL控制的有效性,最佳案例下的的速度脉动增加量可达21.2%。通过控制律可视化可以发现,DRL控制策略可以进一步简化为二维的阈值触发控制策略:即当剪切层的瞬时位置高于基准平均位置时,应开启等离子体激励施加一次脉冲扰动。

图4 (a)瞬时奖励和损失的变化;(b)激励概率变化;(c)功率谱;(d)控制指令分布

将这种DRL控制策略与开环控制方法进行比较。结果表明,大部分放电频率下等离子体合成射流都能使功率谱峰值和低频波动幅度升高。随着放电频率的增加,热线速度脉动先增大后减小,最大值出现在放电频率为5 kHz时,与DRL中的动作更新频率一致。但定量来看,定频控制所获得的控制收益(10.5%)仅为最佳DRL控制(21.2%,案例2)的一半。

图 5 (a)功率谱密度和(b)电压脉动值的相对增加

公众号原文链接(文末附论文资源):

https://mp.weixin.qq.com/s/lGFg7WxLUo5q8RNsXnQZPA

相关论文推荐:

PRF|西北工业大学高传强,杨新宇等:复杂流动建模的新途径:基于闭环辨识的线性建模方法

AIAA J | 西北工业大学高传强,马榕池等:基于解析分析的跨声速激波抖振最优射流控制位置和角度设计

力学学报 | 西工大袁昊、寇家庆等:流体力学预解分析方法研究进展

博士学位答辩PPT分享 | 数据驱动的典型分离流及其流固耦合动力学控制研究

JFM|哈工大(深圳)胡钢团队:基于稀疏表面压力感知的动态特征驱动深度强化学习圆柱流动控制方法

POF | 哈尔滨工业大学(深圳)董欣辉等:基于代理模型和深度强化学习的圆柱主动流动控制实验研究

基于深度强化学习的方柱主动流动控制研究

梯度增强的机器学习控制方法用于稳定多频率开腔流动

注:本文由论文原作者整理并投稿分享,获作者授权发布。

Read more

CTFshow web入门 web12-20

CTFshow web入门 web12-20

目录 web12 知识点:状态码 思路总结:做题需要先使用三件套,目录扫描 dirsearch,抓包/放包/看包,看源代码,这个思路下来大部分都会找到一些有用的信息,还有查看题目提示和网页信息,看网页中有没有和题目相关的东西 web13 思路总结:这种类型的信息搜集题目,需要根据题目提示找,在网页中尝试点击任何东西,看有没有有用的东西 web14 思路总结:首先是信息收集三件套起手,之后是通过三件套收集到的信息进入到编辑器页面,在编辑器中点击可用的功能点,看是否能够获得到有用的信息,不停的尝试自己的思路,之后是找到了可疑的路径,/nothinghere,这里什么都没有,这个路径就很可疑,点进去之后发现里面有一个/f1000g.txt 文档,把/nothinghere/f1000g.txt 路径和题目的 url 路径拼接到一起得到 flag web15 web16 知识点:phpinfo、PHP 探针

Python Web 开发进阶实战:数字孪生平台 —— 在 Flask + Vue 中构建实时物理世界镜像

Python Web 开发进阶实战:数字孪生平台 —— 在 Flask + Vue 中构建实时物理世界镜像

第一章:什么是数字孪生? 1.1 定义与演进 * NASA 最初定义(2010):航天器的虚拟副本,用于地面测试 现代扩展: 产品孪生:单个设备(如风机)过程孪生:生产线流程系统孪生:整座工厂、城市 1.2 数字孪生 vs 传统可视化 维度传统 SCADA数字孪生 数据维度 | 仅数值 | 数值 + 空间位置 + 拓扑关系交互性 | 只读 | 可干预、可仿真预测能力 | 无 | 基于物理/数据模型推演未来 关键区别:双向闭环 物理 → 数据 → 虚拟 → 决策 → 物理(控制) 第二章:平台架构设计 2.1 整体数据流 [物理设备]

3步快速上手CloudBeaver:轻松搭建Web数据库管理平台

3步快速上手CloudBeaver:轻松搭建Web数据库管理平台 【免费下载链接】cloudbeaverCloud Database Manager 项目地址: https://gitcode.com/gh_mirrors/cl/cloudbeaver CloudBeaver是一款强大的开源云数据库管理工具,让你通过浏览器就能统一管理多种数据库。无论你是开发人员还是数据库管理员,都能快速搭建属于自己的数据库管理平台。本指南将带你从零开始,3步完成CloudBeaver的部署和使用。 🎯 为什么选择CloudBeaver? 你是否遇到过这些问题? * 需要在不同数据库之间频繁切换,操作繁琐 * 团队成员使用不同的数据库客户端,难以统一管理 * 想要通过Web界面远程管理数据库,但找不到合适的工具 CloudBeaver正是为解决这些问题而生: * 统一管理:支持MySQL、PostgreSQL、Oracle等主流数据库 * Web界面:无需安装客户端,浏览器即可访问 * 开源免费:完全开源,无需支付任何费用 📋 环境准备检查 在开始安装前,请确保你的

Java Web 汽车票网上预订系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】

Java Web 汽车票网上预订系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】

摘要 随着互联网技术的快速发展,传统汽车票购票方式已无法满足现代用户的便捷性需求。线下购票存在排队时间长、信息不透明、跨区域购票困难等问题,亟需通过信息化手段优化服务流程。汽车票网上预订系统通过整合线上线下资源,为用户提供实时查询、在线选座、电子支付等功能,大幅提升购票效率和用户体验。该系统不仅解决了传统购票模式的痛点,还为交通运营企业提供了数据分析和运营优化的支持,推动行业数字化转型。关键词:汽车票预订、数字化转型、用户体验、线上支付、SpringBoot。 本系统采用前后端分离架构,后端基于SpringBoot2框架搭建,结合MyBatis-Plus实现高效数据操作,MySQL8.0作为主数据库保障数据存储的稳定性和扩展性。前端使用Vue3框架开发,通过Axios与后端交互,实现动态数据渲染和响应式布局。系统核心功能包括用户注册登录、车次查询、在线选座、订单管理、支付接口集成等,同时支持管理员对车辆信息、班次调度、用户行为等数据的可视化分析。系统设计遵循高内聚低耦合原则,确保代码可维护性和可扩展性。关键词:SpringBoot2、Vue3、MyBatis-Plus、MySQL8