一、MPC 机理
学习模型预测控制的核心思想是:利用机器学习或数据驱动的方法,从系统的运行数据中学习出模型不确定性、未建模动态或外部扰动,并将其补偿到 MPC 的预测模型中,从而获得更精确、更鲁棒的控制器。
- 步骤一:测量与数据获取
在当前的采样时刻 k,通过传感器(如电流传感器、编码器)测量系统的实际输出。包括定子电流 i_d(k), i_q(k)、转子机械转速 ω_m(k)。获取系统的真实状态,作为反馈信号和学习基准。将这些测量值集合为状态向量 x(k) = [i_d(k), i_q(k), ω_m(k)]^T。
- 步骤二:学习与估计(学习的核心)
这是整个算法中最关键的一步,目的是量化模型的不准确性。计算集总扰动 d(k) 的估计值 d_est(k)。
- 步骤三:模型预测与优化(预测控制的核心)
这一步使用修正后的模型进行传统的 MPC 优化。将学习到的扰动补偿到预测模型中。对于未来的预测时域 (k+1, k+2, ... k+N),使用修正后的模型:
x(k+i+1) = f(x(k+i), u(k+i)) + d_est(k)
- 步骤四:执行与更新
执行:MPC 优化器会给出未来一串控制序列,但我们只取这个序列中的第一个元素 u(k)。将 u(k)(通常是 u_d(k) 和 u_q(k))通过空间矢量调制传递给逆变器,驱动 PMSM。时间步进,k -> k+1,等待下一个控制周期的到来,然后跳回步骤一。
步骤总结:将以上过程总结为一个清晰的循环
- 测量:获取系统当前实际状态 x(k)。
- 学习:计算扰动估计 d_est(k) = x(k) - f(x(k-1), u(k-1))。
- 预测:使用修正模型 x(k+i+1) = f(x(k+i), u(k+i)) + d_est(k) 预测系统未来动态。
- 优化:求解优化问题,得到最优控制序列,并取其第一个值 u(k)。
- 执行:将 u(k) 施加给系统。
- 滚动:进入下一个采样周期,重复过程。
这个循环确保了控制器能够持续地从实时数据中学习系统的变化,并动态地调整其预测模型,从而在面对参数变化和未知扰动时,依然能保持卓越的控制性能。这正是学习模型预测控制相比传统 MPC 在 PMSM 应用中的强大之处。
二、MPC 与 FOC、DTC 之间的差异
FOC:工业界的'全能标兵',追求精确、平稳与高效。适用于大多数工业应用,如家电、风机水泵、电动汽车巡航等,是性能与成本平衡的典范。
DTC:动态响应的'闪电侠',核心:追求结构简单与动态速度。适用于对动态响应要求极高、对转矩脉动和噪音不敏感的场景,如起重、牵引驱动。
MPC:未来的'智能战略家',核心:追求多目标优化与约束下的全局最优。适用于高性能、多约束的复杂系统,如高端伺服驱动、先进电动汽车,是未来发展的方向。
三、MPC 控制结构图
整个系统的工作流程是一个闭环控制,可以分为三个主要部分:
1. 核心 MPC 控制
这是整个控制系统的'大脑',负责进行计算和决策。
预测模型:它接收上一个时刻的测量值(如电流)和当前计算出的最优控制量(通常是电压矢量),来预测电机在下一个时刻的状态会如何变化。
目标函数:这是 MPC 的'优化准则'。它定义了控制系统的好坏标准。目标函数通常包含跟踪误差(如转矩误差、磁链误差)和控制量的大小等因素。
最优控制:这是一个优化求解过程。它的任务是寻找一个能使目标函数 J 的值最小化的控制量(电压矢量)。
2. 被控对象与测量
这是控制系统的'身体'和'感官'。
DC 源 & 逆变器:这是系统的执行机构。DC 源提供直流电,逆变器根据 MPC 控制器给出的最优控制信号(即开关状态),产生相应的三相交流电压来驱动电机。
PMSM:永磁同步电机,是被控对象。
磁链观测器:这是一个软件算法。它根据测量到的电机电压和电流,实时估算出电机内部无法直接测量的状态——转子磁链的幅值和位置。
3. 信号流与闭环
输入信号:
i_sα, i_sβ:这是通过 Clarke 变换得到的在静止 α-β坐标系下的定子电流。它们是系统的反馈信号。


