融合条件扩散与图学习的 EEG 信号重建与认知负荷识别 | 极客日志

PythonAI算法

融合条件扩散与图学习的 EEG 信号重建与认知负荷识别

该研究提出一种统一框架，利用条件引导去噪扩散概率模型（CG-DDPM）修复多源伪迹污染的脑电信号，并通过融合 CNN、GCN 与 KAN 的 EEGGX-Net 网络进行认知负荷分级。在 STEW 和 iNCog-EEG 数据集上，二分类准确率超 98%，三分类超 95%。文章详细分析了扩散模型相比传统生成模型的优势，探讨了三分支架构的设计动机，并批判性评估了合成噪声与真实场景的差异、被试间变异及计算效率等局限，为 EEG-BCI 的实际部署提供了参考。

孤勇者发布于 2026/3/30更新于 2026/7/2132 浏览

融合条件扩散与图学习的 EEG 信号重建与认知负荷识别

论文信息

标题：Fusion-driven EEG reconstruction and cognitive workload recognition using conditional diffusion and graph-based learning
期刊：Advanced Engineering Informatics 71 (2026) 104243
DOI：10.1016/j.aei.2025.104243
作者：Fariya Bintay Shafi, Md. Faysal Ahamed, Amith Khandakar*, Mohamed Arselene Ayari, Shahriar Islam Siyam
机构：Qatar University（电气工程系、土木与环境工程系），Rajshahi University of Engineering & Technology（孟加拉）
关键词：认知负荷、脑电图、条件引导去噪扩散概率模型、EEG 图融合网络、信号重建

该研究提出了一种'重建 - 分类'统一框架。第一阶段利用**条件引导去噪扩散概率模型（CG-DDPM）**同时修复 6 种伪迹污染的 EEG 信号，第二阶段使用融合 CNN、GCN、KAN 三分支编码器的 EEGGX-Net 对认知负荷进行分级识别。在 STEW 和自采集 iNCog-EEG 两个数据集上，二分类准确率均超过 98%，三分类超过 95%，且均为被试独立评估。

一、研究背景：EEG 认知负荷识别的三大挑战

1.1 认知负荷监测的工程需求

认知负荷指人在信息处理和态势感知过程中所消耗的心理资源。在空中交通管制、飞行驾驶、外科手术等高风险场景中，操作员的认知负荷水平直接关系到系统安全——过高导致注意力崩溃，过低则引发态势感知丧失。因此，实时、准确地监测认知负荷是人机系统安全设计的核心需求。

在各类生理指标中，脑电图（EEG）因其非侵入性和毫秒级时间分辨率成为主要手段。前额叶 theta（4-8 Hz）功率增强是认知负荷最稳健的神经标志物，同时伴随 alpha（8-13 Hz）功率抑制和 beta（13-30 Hz）功率上升。

1.2 三大结构性挑战

将这些频谱标志物转化为可靠的自动分类系统，面临三个挑战：

（1）多源伪迹的同时污染 真实场景中，EEG 信号同时受到多种伪迹干扰：EMG（肌电）、EOG（眼动）、ECG（心电）、呼吸运动、工频干扰及电极脱落导致的信号缺失。传统方法各有局限：ICA 需要专家手动识别；小波阈值对参数敏感且有伪 Gibbs 现象；陷波滤波器会扭曲临近频率。没有任何单一传统方法能同时处理全部伪迹类型。

（2）被试间变异 颅骨厚度、皮层褶皱、电极阻抗等因素导致 EEG 信号存在巨大的被试间分布差异。在 STEW 数据集上，被试独立分类准确率历史上仅为 66-83%，而被试依赖评估可达 >95%。这意味着分类器必须学习到跨个体通用的认知负荷表征，而非记忆特定被试的信号特征。

（3）重建与分类的脱节 以往工作将信号去噪和负荷分类视为独立的顺序问题。去噪阶段优化的是信号保真度指标（如 SNR、MSE），而非下游分类性能。基于深度学习的去噪方法往往产生过度平滑的输出，丢弃了对分类至关重要的高频成分。

1.3 现有方法的能力对比

研究	方法	数据集	处理伪迹	被试独立	最佳准确率
Wang et al. (2024)	LGNet (CNN+Transformer)	模拟飞行	-	√	91.19%
Siddhad et al. (2024)	Transformer	STEW

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

特性	自编码器/VAE	GAN	DDPM
训练稳定性	稳定	模式崩溃、训练不稳定	单一模型，稳定收敛
高频细节保留	过度平滑	可能引入伪影	逐步恢复，保留细节
输出多样性	-	模式坍缩风险	概率性采样，覆盖完整分布

损失组分	作用	权重
扩散损失	噪声预测精度（时域）	1.0
频谱损失	重建信号与原始信号在频域上的结构一致性	0.1
KL 散度	CVAE 潜在空间正则化，防止过拟合	0.1
时间一致性	相邻时间步之间的平滑过渡	0.01

参数	详情
来源	Lim et al. (2018), IEEE TNSRE
被试	48 人（18-35 岁男性大学生）
设备	Emotiv EPOC（消费级），14 通道，128 Hz
范式	2.5 分钟静息 + 2.5 分钟 SIMKAP 多任务
标签	NASA-TLX 1-9 量表 → 二分类 + 三分类

参数	详情
被试	40 人
设备	KT88-3200（临床级），16 通道，200 Hz
范式	5 分钟静息 + 三个 5 分钟多任务阶段
噪声设计	30 人干净数据 + 10 人含真实伪迹

指标	CG-DDPM	理想范围	说明
SNR	16.50 dB	>20 dB	信号功率约为噪声的 45 倍
MSE	14.23 (μV)²	<10	中等失真水平
MAE	3.45 μV	<3-5 μV	达到可接受下限
CC	0.86	>0.85	时域波形强相关
SC	0.79	>0.8	频谱保真度接近理想

重建方法	SNR	CC	SC	STEW 二分类	STEW 三分类
TAE（传统自编码器）	10.85	0.59	0.48	90.88%	84.13%
VAE	11.21	0.67	0.54	88.42%	85.44%
GAN	13.40	0.70	0.61	94.72%	88.92%
CG-DDPM	16.50	0.86	0.79	98.86%	98.65%

模型	原始数据	含噪/缺失数据	重建后数据
SSGCNet (2023)	93.04%	82.10%	90.07%
MTCN (2024)	94.88%	83.46%	91.38%
FBSTCNet (2024)	97.02%	90.02%	95.23%
GMAEEG (2024)	96.15%	87.13%	94.31%
EEG-DG (2024)	97.72%	89.19%	96.28%
EEGGX-Net	99.74%	92.43%	98.86%

模型	原始数据	含噪/缺失数据	重建后数据
SSGCNet (2023)	90.66%	78.59%	86.24%
MTCN (2024)	92.57%	81.33%	89.91%
FBSTCNet (2024)	95.89%	87.12%	92.35%
GMAEEG (2024)	93.25%	83.05%	90.98%
EEG-DG (2024)	96.82%	86.80%	94.24%
EEGGX-Net	99.65%	90.95%	98.65%

模块	推理延迟（batch=128）	吞吐量	参数量	模型大小
CG-DDPM	153.65 ms	833.05 Hz	4.30 M	16.42 MB
EEGGX-Net	73.17 ms	1749.40 Hz	2.77 M	43.75 MB

融合条件扩散与图学习的 EEG 信号重建与认知负荷识别

融合条件扩散与图学习的 EEG 信号重建与认知负荷识别

论文信息

一、研究背景：EEG 认知负荷识别的三大挑战

1.1 认知负荷监测的工程需求

1.2 三大结构性挑战

1.3 现有方法的能力对比

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、方法学：CG-DDPM 信号重建

2.1 为什么选择扩散模型？

2.2 CG-DDPM 的条件引导机制

2.3 多组分损失函数

2.4 处理的伪迹类型

三、方法学：EEGGX-Net 分类网络

3.1 三分支编码器的设计动机

3.2 CNN 分支：时域局部特征提取

3.3 GCN 分支：电极拓扑图学习

3.4 KAN 分支：自适应非线性建模

3.5 双向多头交叉注意力融合（MHCAF）

3.6 层次化胶囊分类器（HCC）

3.7 两阶段分类策略

四、数据集与实验设置

4.1 STEW 数据集（公开基准）

4.2 iNCog-EEG 数据集（自采集）

4.3 预处理与特征工程

4.4 评估方案

五、核心实验结果

5.1 CG-DDPM 重建性能

5.2 STEW 数据集分类性能

5.3 iNCog-EEG 外部验证

5.4 消融实验

5.5 可视化验证

5.6 计算效率

六、局限性与批判性分析

6.1 STEW 二分类准确率的可信度

6.2 合成噪声与真实伪迹的差距

6.3 人口统计学局限

6.4 缺少跨语料库迁移实验

6.5 扩散模型的推理开销

6.6 手工特征 vs. 端到端学习

七、个人思考与总结

7.1 这篇论文的主要贡献

7.2 一些值得进一步思考的问题

附录：核心参考文献

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具