JFM | 空军工程大学宗豪华、吴云等:基于FPGA的深度强化学习框架实现超音速闭环智能流动控制实验

JFM | 空军工程大学宗豪华、吴云等:基于FPGA的深度强化学习框架实现超音速闭环智能流动控制实验

基于高速实验深度强化学习框架的超音速闭环流动控制

Closed-loop supersonic flow control with a high-speed experimental deep reinforcement learning framework

宗豪华¹,吴云¹,李金平²,苏志²,梁华²

引用格式:H. Zong, Y. Wu, J. Li, Z. Su, and H. Liang. Closed-loop supersonic flow control with a high-speed experimental deep reinforcement learning framework[J], Journal of Fluid Mechanics, 2025, 1009: A3.

编者按

复杂流动控制研究受限于缺乏低阶显示表达的流体动力学模型,所以长期以来多采用试探、观察和分析三步走“马后炮”式研究模式。无模型自适应控制、强化学习和流场预解分析技术的发展,为打破这类研究模式提供了强有力的方法基础。此文就是一篇深度强化学习解决复杂高速流动闭环控制的杰作。相比低速、低Re流动,高速流动的频谱更宽、流动结构尺度更丰富、系统复杂性更强,这对硬件响应和算法实时性提出了更大的挑战。该文以Ma=2的后台阶流动为例(Re和速度在公开文献中,皆创纪录),采用提出的FeDRL框架,通过仅需10s的风洞运行,就能设计出性能碾压传统遍历试凑法(最佳定频控制,数小时/数天)获得的控制律。

摘要:

虽然基于深度强化学习(DRL)的主动流动控制已经在低雷诺数仿真环境中得到了广泛的验证,但在真实实验条件下进行DRL控制仍存在很大挑战,其中之一便是数据采集和神经网络推理的强实时性(亚ms量级)。本研究提出了一种基于FPGA的高速实验深度强化学习框架(缩写:FeDRL),控制频率最高可10 kHz,比传统基于CPU的框架(100 Hz以下)高出两个数量级。以Mach 2的超音速后台阶流动为例,对FeDRL增强流动掺混的有效性进行测试。结果表明,仅需10秒的风洞运行时间,就能训练出比最佳定频控制还要优越的闭环控制律,将剪切层速度脉动增加21.2%。如此高的控制律优化效率在以前的闭环流动控制实验中还从未报道过(典型风洞测试时间:数小时至数天)。

正文:

图1 现有DRL流动控制研究所对应的速度和雷诺数

主动流动控制(AFC)通过在流场中引入局部可控扰动来改善绕流物体的宏观特性,有望大幅改善飞行器的气动性能,其核心是控制律。深度强化学习作为一种解决博弈和决策问题的最佳机器学习方法,为主动流动控制提供了一个全新思路。图1总结了目前基于DRL的流动控制研究。总体来看,大部分的研究都在低雷诺数条件下开展,对象包括圆柱、翼型等。相比之下,实验研究较少,尤其是高速高雷诺数航空流动的深度强化学习实验研究,目前还是一片空白(图1绿色区域)。这其中的主要难度在于航空流动速度高、湍流结构演化快,典型特征频率在kHz量级。为了能够实现实时在线控制,要求深度强化学习必须在μs量级实现流场感知、神经网络推理以及激励输出。基于CPU的DRL框架受数据通信、采集等环节的限制,控制频率通常在100Hz以下。

图2 基于DRL和RBF神经网络的高速实验DRL控制框架

本研究通过对硬件和算法的高度整合,提出了一种基于FPGA(现场可编程逻辑门阵列)的高速实验DRL控制框架(FeDRL)。数据采集模块直接挂载在FPGA上,能够在一个时钟周期内抓取和输出数据,同时神经网络的计算也能够利用FPGA进行加速,省去了传统框架中硬件间的通信时间。图2以经典的DQN算法为例进行了示意。该框架包含了两个并行执行的循环:在FPGA控制器中高速执行的实时控制循环(1-10kHz)和在CPU上的低速训练循环(10Hz)。神经网络控制律采用了结构简单、参数量少的径向基函数进行表达,典型控制频率可以达到1kHz量级以上。前期,该框架的有效性已在低速后台阶流动(POF, 2024, 36:105102)和翼型分离流动(POF, 2024, 36:091708)中得到了验证。本研究的重点旨在进一步将其拓展到超音速流动。

图3 (a)- (b)平板实验模型的示意图;(c)等离子体激励器结构

超音速后台阶流动控制实验在空军工程大学的超音速风洞中进行,马赫数为2。等离子体合成射流激励器作为主动控制装置对流场施加扰动,下游剪切层中的热线传感器提供流场的反馈信息,目标是最大化剪切层内的速度脉动。结果表明,仅需10秒的训练时间,FeDRL框架就能找到有效的闭环控制策略,使瞬时奖励rt从0上升至0.2左右,同时训练损失也在10秒内迅速收敛。对比基于策略的DRL算法(如PPO),FeDRL框架的优化效率高出一个数量级。从功率谱密度对比也可验证DRL控制的有效性,最佳案例下的的速度脉动增加量可达21.2%。通过控制律可视化可以发现,DRL控制策略可以进一步简化为二维的阈值触发控制策略:即当剪切层的瞬时位置高于基准平均位置时,应开启等离子体激励施加一次脉冲扰动。

图4 (a)瞬时奖励和损失的变化;(b)激励概率变化;(c)功率谱;(d)控制指令分布

将这种DRL控制策略与开环控制方法进行比较。结果表明,大部分放电频率下等离子体合成射流都能使功率谱峰值和低频波动幅度升高。随着放电频率的增加,热线速度脉动先增大后减小,最大值出现在放电频率为5 kHz时,与DRL中的动作更新频率一致。但定量来看,定频控制所获得的控制收益(10.5%)仅为最佳DRL控制(21.2%,案例2)的一半。

图 5 (a)功率谱密度和(b)电压脉动值的相对增加

公众号原文链接(文末附论文资源):

https://mp.weixin.qq.com/s/lGFg7WxLUo5q8RNsXnQZPA

相关论文推荐:

PRF|西北工业大学高传强,杨新宇等:复杂流动建模的新途径:基于闭环辨识的线性建模方法

AIAA J | 西北工业大学高传强,马榕池等:基于解析分析的跨声速激波抖振最优射流控制位置和角度设计

力学学报 | 西工大袁昊、寇家庆等:流体力学预解分析方法研究进展

博士学位答辩PPT分享 | 数据驱动的典型分离流及其流固耦合动力学控制研究

JFM|哈工大(深圳)胡钢团队:基于稀疏表面压力感知的动态特征驱动深度强化学习圆柱流动控制方法

POF | 哈尔滨工业大学(深圳)董欣辉等:基于代理模型和深度强化学习的圆柱主动流动控制实验研究

基于深度强化学习的方柱主动流动控制研究

梯度增强的机器学习控制方法用于稳定多频率开腔流动

注:本文由论文原作者整理并投稿分享,获作者授权发布。

Read more

一分钟看完:深圳都有哪些机器人公司

1. 人形机器人与具身智能(当下最火,运控/LLM背景) 序号公司名称核心业务(10字内)公司地址(补齐与精确化)1优必选 (UBTECH)商业化双足人形机器人南山区学苑大道1001号南山智园 C1 栋2乐聚机器人 (Leju)人形机器人本体与算法南山区学苑大道1068号南山智园 C2 栋3众擎机器人 (EngineAI)通用人形与外骨骼电机南山区学苑大道1001号南山智园 (具体栋数在C区)4逐际动力 (LimX)动态双足/四足运控算法南山区南头街道前海华润金融中心 (研发中心)5星尘智能 (Astribot)绳驱 AI 机器人与灵巧手南山区打石一路深圳国际创新谷 6 栋6帕西尼感知 (PaXini)触觉传感器与人形手南山区粤海街道深圳湾科技生态园7自变量机器人 (X Square)端到端具身智能大模型南山区西丽街道万科云城8数字华夏康养与文旅服务人形机器人南山区西丽街道留仙大道创智云城9跨维智能 (DexForce)三维视觉与具身操作大模型南山区粤海街道软件产业基地10腾讯 Robotics X实验室前沿轮足与灵巧手南山区粤海街道腾讯滨海大厦/朗科大厦11易择智擎VLA 具身

FLUX.1-dev与Stable Diffusion对比评测:图像质量与生成速度

FLUX.1-dev与Stable Diffusion对比评测:图像质量与生成速度 作为一名长期关注AI图像生成技术的开发者,我一直在寻找能够在质量和速度之间取得最佳平衡的解决方案。最近,Black Forest Labs开源的FLUX.1-dev模型引起了我的注意,特别是它声称能够在消费级硬件上运行,同时保持出色的图像质量。 今天我将通过实际测试,从图像细节、风格控制、生成速度等多个维度,对比FLUX.1-dev与大家熟悉的Stable Diffusion,看看这两个模型在实际使用中究竟表现如何。 1. 测试环境与方法 为了确保对比的公平性,我搭建了统一的测试环境。使用NVIDIA RTX 4090显卡,24GB显存,Intel i9-13900K处理器,64GB DDR5内存。操作系统为Ubuntu 22.04,所有测试都在相同的硬件和软件环境下进行。 测试方法包括定量评估和定性分析。定量方面主要测量生成速度、内存占用等硬性指标;定性方面则通过同一组提示词生成图像,从视觉质量、细节表现、风格一致性等角度进行对比。 我选择了50组涵盖不同场景的提示词,包括人物肖像、风景

FPGA AD7606串行驱动与并行驱动

FPGA AD7606串行驱动与并行驱动

AD7606是一个八通道16分辨率的adc,有两种测量范围5v和10v,每个通道采样率最高200ksps,支持多种驱动方案,最常用的有串行方案与并行方案,其中串行方案采用spi协议进行数据传输,可以在io引脚不够用的情况下采用,而并行方案采用16个io在一个采样边沿同时接收一次采样数据。 首先介绍ad7606的内部结构 内部主要部分有四个模块,模块1是在每个通道处添加了2阶巴特沃斯模拟低通滤波器,用来抗混叠,其截止频率受电压测量范围影响,当范围为5v时截止频率15khz,10v时23khz 因此在使用ad7606测量截止频率以上的信号时,需要在前方加入仪表放大器来放大信号,否则信号会被ad7606滤除 模块2用来控制复位、测量范围、通道转换,range为0时测量范围0~5v,1时测量范围0~10v,通道转换是指八个通道可分为两组,A组包含0~3通道,B组包含4~7通道,转换的意思就是在adc内部进行模拟量向数字量的转换,转换需要消耗一定的时间,而要指定那组通道转换则受convst信号影响,convst A信号拉高会让A组转换,convst B拉高会让B组转换,一般convst

图谱驱动大模型智能体普惠时代:Neo4j Aura Agent正式全面上线

图谱驱动大模型智能体普惠时代:Neo4j Aura Agent正式全面上线

摘要: Neo4j Aura Agent正式商用,基于知识图谱的智能体构建平台实现分钟级部署,重塑企业AI应用开发范式。 往期推荐 [290页电子书]打造企业级知识图谱的实战手册,Neo4j 首席科学家力作!从图数据库基础到图原生机器学习 [550页电子书]2025年10月最新出版-知识图谱与大语言模型融合的实战指南:KG&LLM in Action [30页电子书]GraphRAG开发者指南 [180页电子书]GraphRAG全面解析及实践-Neo4j:构建准确、可解释、具有上下文意识的生成式人工智能应用 [140页]Neo4j GraphRAG白皮书 引言 在AI智能体(Agentic AI)市场快速扩张的当下,Neo4j宣布其开创性的智能体创建平台——Neo4j Aura Agent正式进入全面可用阶段,并在2026年2月全月提供免费使用。这一平台为AuraDB客户带来了革命性的体验:只需几分钟即可构建和部署基于知识图谱的智能体,并配备强大的新功能——包括基于本体的自动化智能体构建,以及一键部署到安全托管的MCP服务器。 智能体AI不仅仅是制造巨大的市