JFM | 空军工程大学宗豪华、吴云等:基于FPGA的深度强化学习框架实现超音速闭环智能流动控制实验

JFM | 空军工程大学宗豪华、吴云等:基于FPGA的深度强化学习框架实现超音速闭环智能流动控制实验

基于高速实验深度强化学习框架的超音速闭环流动控制

Closed-loop supersonic flow control with a high-speed experimental deep reinforcement learning framework

宗豪华¹,吴云¹,李金平²,苏志²,梁华²

引用格式:H. Zong, Y. Wu, J. Li, Z. Su, and H. Liang. Closed-loop supersonic flow control with a high-speed experimental deep reinforcement learning framework[J], Journal of Fluid Mechanics, 2025, 1009: A3.

编者按

复杂流动控制研究受限于缺乏低阶显示表达的流体动力学模型,所以长期以来多采用试探、观察和分析三步走“马后炮”式研究模式。无模型自适应控制、强化学习和流场预解分析技术的发展,为打破这类研究模式提供了强有力的方法基础。此文就是一篇深度强化学习解决复杂高速流动闭环控制的杰作。相比低速、低Re流动,高速流动的频谱更宽、流动结构尺度更丰富、系统复杂性更强,这对硬件响应和算法实时性提出了更大的挑战。该文以Ma=2的后台阶流动为例(Re和速度在公开文献中,皆创纪录),采用提出的FeDRL框架,通过仅需10s的风洞运行,就能设计出性能碾压传统遍历试凑法(最佳定频控制,数小时/数天)获得的控制律。

摘要:

虽然基于深度强化学习(DRL)的主动流动控制已经在低雷诺数仿真环境中得到了广泛的验证,但在真实实验条件下进行DRL控制仍存在很大挑战,其中之一便是数据采集和神经网络推理的强实时性(亚ms量级)。本研究提出了一种基于FPGA的高速实验深度强化学习框架(缩写:FeDRL),控制频率最高可10 kHz,比传统基于CPU的框架(100 Hz以下)高出两个数量级。以Mach 2的超音速后台阶流动为例,对FeDRL增强流动掺混的有效性进行测试。结果表明,仅需10秒的风洞运行时间,就能训练出比最佳定频控制还要优越的闭环控制律,将剪切层速度脉动增加21.2%。如此高的控制律优化效率在以前的闭环流动控制实验中还从未报道过(典型风洞测试时间:数小时至数天)。

正文:

图1 现有DRL流动控制研究所对应的速度和雷诺数

主动流动控制(AFC)通过在流场中引入局部可控扰动来改善绕流物体的宏观特性,有望大幅改善飞行器的气动性能,其核心是控制律。深度强化学习作为一种解决博弈和决策问题的最佳机器学习方法,为主动流动控制提供了一个全新思路。图1总结了目前基于DRL的流动控制研究。总体来看,大部分的研究都在低雷诺数条件下开展,对象包括圆柱、翼型等。相比之下,实验研究较少,尤其是高速高雷诺数航空流动的深度强化学习实验研究,目前还是一片空白(图1绿色区域)。这其中的主要难度在于航空流动速度高、湍流结构演化快,典型特征频率在kHz量级。为了能够实现实时在线控制,要求深度强化学习必须在μs量级实现流场感知、神经网络推理以及激励输出。基于CPU的DRL框架受数据通信、采集等环节的限制,控制频率通常在100Hz以下。

图2 基于DRL和RBF神经网络的高速实验DRL控制框架

本研究通过对硬件和算法的高度整合,提出了一种基于FPGA(现场可编程逻辑门阵列)的高速实验DRL控制框架(FeDRL)。数据采集模块直接挂载在FPGA上,能够在一个时钟周期内抓取和输出数据,同时神经网络的计算也能够利用FPGA进行加速,省去了传统框架中硬件间的通信时间。图2以经典的DQN算法为例进行了示意。该框架包含了两个并行执行的循环:在FPGA控制器中高速执行的实时控制循环(1-10kHz)和在CPU上的低速训练循环(10Hz)。神经网络控制律采用了结构简单、参数量少的径向基函数进行表达,典型控制频率可以达到1kHz量级以上。前期,该框架的有效性已在低速后台阶流动(POF, 2024, 36:105102)和翼型分离流动(POF, 2024, 36:091708)中得到了验证。本研究的重点旨在进一步将其拓展到超音速流动。

图3 (a)- (b)平板实验模型的示意图;(c)等离子体激励器结构

超音速后台阶流动控制实验在空军工程大学的超音速风洞中进行,马赫数为2。等离子体合成射流激励器作为主动控制装置对流场施加扰动,下游剪切层中的热线传感器提供流场的反馈信息,目标是最大化剪切层内的速度脉动。结果表明,仅需10秒的训练时间,FeDRL框架就能找到有效的闭环控制策略,使瞬时奖励rt从0上升至0.2左右,同时训练损失也在10秒内迅速收敛。对比基于策略的DRL算法(如PPO),FeDRL框架的优化效率高出一个数量级。从功率谱密度对比也可验证DRL控制的有效性,最佳案例下的的速度脉动增加量可达21.2%。通过控制律可视化可以发现,DRL控制策略可以进一步简化为二维的阈值触发控制策略:即当剪切层的瞬时位置高于基准平均位置时,应开启等离子体激励施加一次脉冲扰动。

图4 (a)瞬时奖励和损失的变化;(b)激励概率变化;(c)功率谱;(d)控制指令分布

将这种DRL控制策略与开环控制方法进行比较。结果表明,大部分放电频率下等离子体合成射流都能使功率谱峰值和低频波动幅度升高。随着放电频率的增加,热线速度脉动先增大后减小,最大值出现在放电频率为5 kHz时,与DRL中的动作更新频率一致。但定量来看,定频控制所获得的控制收益(10.5%)仅为最佳DRL控制(21.2%,案例2)的一半。

图 5 (a)功率谱密度和(b)电压脉动值的相对增加

公众号原文链接(文末附论文资源):

https://mp.weixin.qq.com/s/lGFg7WxLUo5q8RNsXnQZPA

相关论文推荐:

PRF|西北工业大学高传强,杨新宇等:复杂流动建模的新途径:基于闭环辨识的线性建模方法

AIAA J | 西北工业大学高传强,马榕池等:基于解析分析的跨声速激波抖振最优射流控制位置和角度设计

力学学报 | 西工大袁昊、寇家庆等:流体力学预解分析方法研究进展

博士学位答辩PPT分享 | 数据驱动的典型分离流及其流固耦合动力学控制研究

JFM|哈工大(深圳)胡钢团队:基于稀疏表面压力感知的动态特征驱动深度强化学习圆柱流动控制方法

POF | 哈尔滨工业大学(深圳)董欣辉等:基于代理模型和深度强化学习的圆柱主动流动控制实验研究

基于深度强化学习的方柱主动流动控制研究

梯度增强的机器学习控制方法用于稳定多频率开腔流动

注:本文由论文原作者整理并投稿分享,获作者授权发布。

Read more

2026 年了,这些 AI IDE 还能白嫖

2026 年了,这些 AI IDE 还能白嫖

大家好,我是极客老墨。 去年这个时候,我还在纠结要不要订阅 Cursor Pro。今年,我的电脑里装了七八个 AI IDE,一个月下来,花的钱是零。 不是我抠门,是这些工具的免费额度真的够用。写个脚本、改改 Bug、重构代码,基本不用掏钱。当然,如果你是重度用户,每天写几千行代码,那该付费还是得付费。但对于大部分开发者来说,薅羊毛的空间还是很大的。 下面这些工具是我这段时间用下来觉得值得折腾的,有些需要科学上网,有些需要改地区,有些直接某宝买个 Key 就能用。别问我怎么搞,懂的都懂。 为什么需要 AI IDE? 说实话,刚开始我也觉得 AI 写代码是噱头。直到有一次我要写个 Python 脚本处理 JSON 数据,平时可能要查半天文档,结果 Cursor 直接给我生成了,改都不用改。

VSCode配置 AI agent skills 详细步骤

VSCode配置 AI agent skills 详细步骤

在VS Code中配置“Agent Skills”,是为你的AI编程助手(如GitHub Copilot)定制可复用的专业能力包。你可以把它理解为教你助手如何执行特定任务的标准说明书 它主要由一个 SKILL.md 文件以及相关的脚本、示例组成。当你的需求与某个技能描述匹配时,Copilot会自动加载这个“技能包”来更精准地帮你完成任务,比如创建测试、调试工作流等 启用功能 技能创建位置 在项目根目录或个人配置文件夹中,创建一个特定的文件夹来存放你的技能包 * 项目技能:在项目根目录创建 .github/skills/ 目录。就会作用于项目 * 个人技能:在你电脑用户目录下创建 ~/.copilot/skills/(推荐)或 ~/.claude/skills/。作用于你电脑里所有的项目 技能编写规范 my-skill/ (技能文件夹) ├── SKILL.md # 必需:核心入口文件,包含元数据和主要指令 ‼️‼️‼️ ├── references/ 或 resources/

2026年3月13日AI热点:芯片大战、Agent爆发、安全争议

2026年3月13日AI热点:芯片大战、Agent爆发、安全争议 今日AI圈发生了什么?十大热点一文打尽 ChatGPT o3 pro | Claude 3.7 | Gemini 2.5 pro免费用 👉 AI工具集 今天的AI圈依然热闹非凡!从芯片巨头的大手笔投入,到Agent时代的全面爆发,再到AI安全争议愈演愈烈…让我带你一篇看完今日AI十大热点! 🔥 十大AI新闻 1. Anthropic 起诉美国国防部 Anthropic就供应链风险认定起诉五角大楼,称这一认定可能让其损失数十亿美元。特朗普政府表示不排除对Anthropic采取进一步行动。 2. Nvidia 投资260亿美元开发开源模型 最新文件显示,Nvidia计划投入260亿美元构建开源权重AI模型,展现其对开源生态的承诺。 3. Meta 发布4款新AI芯片 Meta推出了MTIA 300芯片,用于训练Instagram和Facebook的排序推荐系统。MTIA 400/450/500将在2027年前支持生成式AI推理。 4. Google Gemini 登陆 Chrome

别让 AI 越权!OpenClaw 权限配置完全指南

别让 AI 越权!OpenClaw 权限配置完全指南

一、限制只能聊天(纯对话模式) 适用场景:只想让 AI 帮你思考、写文案、做分析,不需要它执行任何文件操作或命令。 从 2026.3.2 版本开始,OpenClaw 默认已经收紧了权限,但如果你想确保它彻底无法调用工具,可以这样配置: 核心配置命令: bash openclaw config set tools.profile messaging tools.profile 的四种模式对比: 表格 模式能力范围适用场景messaging纯对话,禁用所有工具(文件读写、命令执行、技能调用等)只想聊天、咨询的场景minimal极简工具集(如只允许网页搜索)需要查信息但不执行操作default基础工具集(文件读写、部分命令)日常轻度使用full完整工具集(包括高风险操作)开发、自动化等场景 验证配置: bash openclaw config