跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

空军工程大学:基于 FPGA 的深度强化学习框架实现超音速闭环智能流动控制

综述由AI生成一种基于 FPGA 的高速实验深度强化学习框架(FeDRL),用于解决超音速流动闭环控制问题。针对高速流动频谱宽、结构复杂导致传统 CPU 框架控制频率低(<100Hz)的挑战,该框架利用 FPGA 实现亚毫秒级实时数据采集与推理,控制频率高达 10kHz。在 Mach 2 超音速后台阶流动实验中,仅用 10 秒风洞运行时间便训练出优于传统定频控制的闭环策略,使剪切层速度脉动增加 21.2%,显著提升了控制律优化效率。

DebugKing发布于 2026/4/6更新于 2026/5/2022 浏览
空军工程大学:基于 FPGA 的深度强化学习框架实现超音速闭环智能流动控制

基于高速实验深度强化学习框架的超音速闭环流动控制

作者

宗豪华,吴云,李金平,苏志,梁华

摘要

虽然基于深度强化学习(DRL)的主动流动控制已经在低雷诺数仿真环境中得到了广泛的验证,但在真实实验条件下进行 DRL 控制仍存在很大挑战,其中之一便是数据采集和神经网络推理的强实时性(亚 ms 量级)。本研究提出了一种基于 FPGA 的高速实验深度强化学习框架(缩写:FeDRL),控制频率最高可 10 kHz,比传统基于 CPU 的框架(100 Hz 以下)高出两个数量级。以 Mach 2 的超音速后台阶流动为例,对 FeDRL 增强流动掺混的有效性进行测试。结果表明,仅需 10 秒的风洞运行时间,就能训练出比最佳定频控制还要优越的闭环控制律,将剪切层速度脉动增加 21.2%。如此高的控制律优化效率在以前的闭环流动控制实验中还从未报道过(典型风洞测试时间:数小时至数天)。

正文

复杂流动控制研究受限于缺乏低阶显式表达的流体动力学模型,长期以来多采用试探、观察和分析的事后分析模式。无模型自适应控制、强化学习和流场预解分析技术的发展,为打破这类研究模式提供了方法基础。相比低速、低 Re 流动,高速流动的频谱更宽、流动结构尺度更丰富、系统复杂性更强,这对硬件响应和算法实时性提出了更大的挑战。

文章配图 图 1 现有 DRL 流动控制研究所对应的速度和雷诺数

主动流动控制(AFC)通过在流场中引入局部可控扰动来改善绕流物体的宏观特性,有望大幅改善飞行器的气动性能,其核心是控制律。深度强化学习作为一种解决博弈和决策问题的机器学习方法,为主动流动控制提供了新思路。大部分的研究都在低雷诺数条件下开展,对象包括圆柱、翼型等。相比之下,实验研究较少,尤其是高速高雷诺数航空流动的深度强化学习实验研究,目前还是一片空白。这其中的主要难度在于航空流动速度高、湍流结构演化快,典型特征频率在 kHz 量级。为了能够实现实时在线控制,要求深度强化学习必须在 μs 量级实现流场感知、神经网络推理以及激励输出。基于 CPU 的 DRL 框架受数据通信、采集等环节的限制,控制频率通常在 100Hz 以下。

文章配图 图 2 基于 DRL 和 RBF 神经网络的高速实验 DRL 控制框架

本研究通过对硬件和算法的高度整合,提出了一种基于 FPGA(现场可编程逻辑门阵列)的高速实验 DRL 控制框架(FeDRL)。数据采集模块直接挂载在 FPGA 上,能够在一个时钟周期内抓取和输出数据,同时神经网络的计算也能够利用 FPGA 进行加速,省去了传统框架中硬件间的通信时间。该框架包含了两个并行执行的循环:在 FPGA 控制器中高速执行的实时控制循环(1-10kHz)和在 CPU 上的低速训练循环 (10Hz)。神经网络控制律采用了结构简单、参数量少的径向基函数进行表达,典型控制频率可以达到 1kHz 量级以上。前期,该框架的有效性已在低速后台阶流动和翼型分离流动中得到了验证。本研究的重点旨在进一步将其拓展到超音速流动。

文章配图 图 3 (a)- (b) 平板实验模型的示意图;(c) 等离子体激励器结构

超音速后台阶流动控制实验在空军工程大学的超音速风洞中进行,马赫数为 2。等离子体合成射流激励器作为主动控制装置对流场施加扰动,下游剪切层中的热线传感器提供流场的反馈信息,目标是最大化剪切层内的速度脉动。结果表明,仅需 10 秒的训练时间,FeDRL 框架就能找到有效的闭环控制策略,使瞬时奖励 rt 从 0 上升至 0.2 左右,同时训练损失也在 10 秒内迅速收敛。对比基于策略的 DRL 算法(如 PPO),FeDRL 框架的优化效率高出一个数量级。从功率谱密度对比也可验证 DRL 控制的有效性,最佳案例下的的速度脉动增加量可达 21.2%。通过控制律可视化可以发现,DRL 控制策略可以进一步简化为二维的阈值触发控制策略:即当剪切层的瞬时位置高于基准平均位置时,应开启等离子体激励施加一次脉冲扰动。

文章配图 图 4 (a) 瞬时奖励和损失的变化;(b) 激励概率变化;(c) 功率谱;(d) 控制指令分布

将这种 DRL 控制策略与开环控制方法进行比较。结果表明,大部分放电频率下等离子体合成射流都能使功率谱峰值和低频波动幅度升高。随着放电频率的增加,热线速度脉动先增大后减小,最大值出现在放电频率为 5 kHz 时,与 DRL 中的动作更新频率一致。但定量来看,定频控制所获得的控制收益(10.5%)仅为最佳 DRL 控制(21.2%,案例 2)的一半。

文章配图 图 5 (a) 功率谱密度和 (b) 电压脉动值的相对增加

目录

  1. 基于高速实验深度强化学习框架的超音速闭环流动控制
  2. 作者
  3. 摘要
  4. 正文
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • MySQL 查询结果排序不一致的原因与稳定化方案
  • 云开发 Copilot:AI 如何重塑低代码开发流程
  • Linux 环境下配置海外软件源及 Antigravity 网络优化指南
  • Stable Diffusion 3.5 云端部署方案:老旧 Windows 电脑运行指南
  • OpenClaw Nginx 反向代理部署及 disconnected (1008) 问题解决
  • Java 大厂实习面试核心考点:数据库、中间件与基础原理
  • 云开发 Copilot:AI 如何重塑开发流程
  • Python 基础语法完全指南:变量、数据类型与运算符详解
  • 单链表核心操作全实现与指针思维精讲
  • macOS Web:基于 Web 技术的 macOS 桌面模拟器
  • Java ArrayList 集合详解与底层原理
  • 贪心算法实战:三道经典 LeetCode 题解
  • 大模型微调的技术含量取决于具体实践与定位
  • 构建 AI 鸿蒙应用:架构逻辑的转变
  • AI 产品经理数据标注全流程指南
  • 2021 年信奥赛 C++ 提高组 CSP-S 初赛真题解析:阅读程序第 1 题
  • Buzz 离线语音转文字工具安装与 Whisper 模型使用指南
  • llama.cpp 大模型本地部署与推理指南
  • Python 自动化脚本:实现定时与循环发送消息
  • Windows 10 彻底关闭 Microsoft 365 Copilot 弹窗的 6 种方法

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online