跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

DREAM 数据库:脑电与梦境配对开启意识研究大数据时代

综述由AI生成该文章介绍了 Nature Communications 2025 年发表的 DREAM 数据库,首个睡眠脑电与标准化梦境报告配对的开放资源。包含 505 名被试、2643 次唤醒记录。文章阐述了统一的三级梦境分类体系及数据质量控制标准。核心分析发现 N1 阶段体验报告率最高,并提出 Hypnodensity 概念揭示 NREM 梦境可能源于隐蔽清醒。通过 EEG 特征(如 PSD 和 Catch22)可预测梦境体验,REM 阶段非线性特征表现更佳。该数据库为意识神经关联研究提供了大规模标准化数据支持,对临床意识检测具有潜在应用价值。

神经兮兮发布于 2026/4/6更新于 2026/5/2231 浏览

📖 论文信息

标题:A dream EEG and mentation database 期刊:Nature Communications (2025) 16:7495 DOI:10.1038/s41467-025-61945-1 数据库:https://monash.edu/dream-database 作者:William Wong, Rubén Herzog 等 53 位作者,来自 13 个国家 37 家机构 关键词:睡眠脑电、梦境报告、意识神经关联、数据库、NREM/REM

本文构建了首个将睡眠脑电(M/EEG)与标准化梦境报告配对的开放数据库——DREAM(Dream EEG and Mentation),首批发布包含 20 个数据集、505 名被试、2643 次唤醒记录,并展示了通过 EEG 特征预测睡眠中是否存在意识体验的可行性。

一、研究背景:梦境研究为何需要一个大型数据库?

1.1 梦境科学的三大困境

人的一生约有 三分之一 的时间处于睡眠中,其中相当一部分时间伴随着梦境。研究睡眠中的意识体验不仅事关梦境科学本身,更是探索意识神经关联(Neural Correlates of Consciousness, NCC)的核心范式之一。然而,梦境的神经科学研究长期受困于三个结构性难题:

(1)样本量严重不足

梦境研究的金标准方法——连续唤醒范式(Serial Awakening Paradigm)——要求被试在实验室中连续数夜睡眠,并被反复唤醒以报告梦境体验。这使得数据采集极为耗时耗力。以往绝大多数研究的样本量仅在'数十次唤醒'的量级,即便是里程碑式的 Siclari et al.(2017, Nature Neuroscience)研究也仅使用了 32+7 名被试。Hudachek & Wamsley(2023)的统计功效分析表明:在梦境研究的典型效应量下(SMD ≈ 0.52),25 名被试仅能提供约 20% 的统计功效,远低于合理阈值。

(2)方法学异质性

不同实验室对梦境的分类标准差异巨大:有的使用二元(有/无)判断,有的使用 Likert 量表,有的用开放式口头报告。Foulkes(1962)早就发现,仅仅将问题从'你做梦了吗?'改为'你有过任何心理活动吗?',NREM 的梦境回忆率就会从 5-10% 跃升至 50%。EEG 记录参数(通道数、采样率、参考方案等)也各不相同,使跨研究比较几乎不可能。

(3)缺乏共享基础设施

在本项目之前,相关数据库要么只有睡眠脑电但无梦境报告(如 NSRR 拥有超过 46,000 例多导睡眠图),要么只有梦境文本但无神经生理记录(如 DreamBank 拥有约 2-3 万条文本报告,Sleep and Dream Database 拥有 44,500+ 条报告)。将脑电与主观体验配对的资源完全空白。

1.2 现有数据库的对比
数据库睡眠脑电梦境报告脑电 + 报告配对规模主要用途
NSRR (sleepdata.org)√--~46,000 被试临床睡眠医学
DreamBank.net-√-~20,000-30,000 条文本梦境内容分析
Sleep and Dream Database-√-~44,500+ 条报告内容与人口学
OpenNeuro√(少量)--BIDS 格式数据神经影像方法
DREAM√√√505 被试,2643 次唤醒梦境意识的神经关联

DREAM 数据库是唯一将每一条脑电记录与标准化主观体验分类配对的开放资源,填补了该领域最关键的数据空白。

二、方法学创新:如何驯服异质数据?

2.1 统一的梦境报告三级分类体系

论文最重要的方法学贡献是提出了一套最小公约数式的梦境分类方案,将所有贡献数据集的梦境报告统一映射至三个有序等级:

分类英文名定义
有体验Experience (E)被试报告在唤醒前的睡眠中有过体验,且能回忆具体内容
有体验但无法回忆Experience without recall (EWR)被试强烈感觉做了梦,但无法回忆任何具体内容(又称'白梦')
无体验No experience (NE)被试没有任何做梦的印象,也不认为有过体验

为什么要保留'有体验但无法回忆'这个中间类别?这涉及梦境研究中一个根本性的认识论难题:当被试报告'没有做梦'时,究竟是真的没有意识体验,还是仅仅遗忘了? Ruby(2020)在评论 Siclari et al.(2017)时精确地指出了这一点。保留三级分类允许研究者在分析中处理这个模糊地带,而不是被迫做出二元假设。

对于原始分类与 DREAM 标准不完全匹配的数据集,论文制定了三条映射规则:

  1. 直接映射:原始分类可类比于标准定义时,直接对应;
  2. 重新分类:原始分类不能直接对应,但原始报告数据允许重新分类时,提供重分类结果;
  3. 组合分类:无法明确重分类时,保留原始分类并标记为标准类别的组合(如'EWR 或 NE')。
2.2 数据标准与质量控制

最低技术标准:

  • 至少 2 个可定位的 EEG 电极(10-5 系统)
  • 唤醒前至少 20 秒连续睡眠记录
  • 采样率 ≥ 100 Hz
  • 原始数据或最小预处理数据

数据格式:所有多导睡眠图统一为 EDF+ 格式,被试 ID 和案例 ID 编码于 EDF 头文件中。数据库遵循 FAIR 原则(可发现、可访问、可互操作、可复用),并托管于 Monash University,采用 CC BY 4.0 许可。

质量控制:结合人工审查和自动检查,确保文件结构、数据格式和元数据一致性。最后 20 秒中无伪迹 EEG 不足 10 秒的数据被排除。

2.3 首批 20 个数据集概览

首批数据集涵盖了极为多样的实验范式,包括:

  • 多次 REM/NREM 唤醒(De Gennaro & Scarpelli 系列)
  • 清醒梦研究(Konkoly et al., TWC USA)
  • 睡眠入梦期创造力任务(Lacaux et al.)
  • 空间学习后睡眠(Zhang & Wamsley)
  • 有声书入睡研究(Kumral et al.)
  • 便携 EEG 家庭睡眠记录(LODE, Elce et al.)
  • MEG + EEG 同步记录(MEG Kyushu, 单被试 31 次唤醒)
  • 儿童发育性阅读障碍(Children Dreaming)
  • 老年人群体(Older Adults)
  • 梦话研究(Sleep Talking)

三、核心结果:四项关键分析

3.1 行为分析:睡眠深度与梦境频率的关系

基于 1550 次有完整睡眠分期和梦境分类的唤醒数据,作者进行了卡方检验和广义线性混合效应模型分析。

睡眠阶段 × 体验类型的列联表:

睡眠阶段无体验 (NE)有体验无回忆 (EWR)有体验 (E)合计
N112 (11%)1 (1%)97 (88%)110
N2308 (36%)68 (8%)485 (56%)861
N326 (41%)7 (11%)31 (48%)64
REM87 (17%)12 (2%)416 (81%)515

卡方检验:χ² = 120.9, df = 6, p < 10⁻¹⁵,高度显著。

关键发现:

  • N1 阶段的体验报告率最高(88%),甚至超过了 REM(81%)
  • NREM 睡眠越深,梦境报告率越低(N1 > N2 > N3)
  • 混合效应模型以 >99% 的置信度确认了上述趋势

深度解读:N1 的高梦境率值得特别关注。N1 是清醒与睡眠之间的过渡状态,伴随入睡前幻觉(hypnagogic imagery)。其体验率超过 REM,表明意识并不随着生理性睡眠标志的出现而立即消失。这挑战了将睡眠阶段视为离散、互斥状态的简单化模型,支持 睡眠阶段是流动的、可解离的生理过程集群 这一新兴共识。

3.2 功率谱密度分析:睡眠阶段的频谱特征

选取 6 个符合 EEG 分析标准的数据集(排除了使用干电极、睡眠中存在刺激或人口学特殊的数据集),共 1462 个 30 秒 epoch,从中央电极(C3 或 C4)提取功率谱密度(PSD)。

结果符合经典预期:

  • 清醒(W):显著的 alpha 峰(8-12 Hz)
  • NREM:sigma(纺锤波)峰(12-15 Hz),N3 中 delta 功率(0.5-4 Hz)显著增强
  • REM:theta 范围(4-8 Hz)活动增强

这一分析本身并非新发现,但重要的是它验证了来自不同实验室、不同设备的数据在标准化后仍然保持了一致的频谱特征,证明了数据库的有效性。

3.3 自动睡眠分期:人工 vs 算法

使用经过验证的自动睡眠分期算法(Stephansen et al., 2018),对 6 个数据集进行自动分期,并与人工评分结果比较。

结果:

  • 各数据集准确率从 0.505 到 1.000 不等
  • 全局平均准确率 ≈ 0.743
  • 接近人类评分者间一致性(根据 AASM 指南,6 名评分者仅有 46±9% 的 epoch 达到一致)

这一结果有双重意义:(1)验证了 DREAM 数据库数据可直接用于自动化分析流水线;(2)揭示了睡眠分期本身固有的模糊性——这种模糊性恰恰是后续 hypnodensity 分析的切入点。

3.4 核心发现:Hypnodensity 分析与'隐蔽清醒'假说

这是论文中最具理论意义的分析。

什么是 Hypnodensity?

传统睡眠分期将每个 epoch 强制分配到一个离散类别(W/N1/N2/N3/REM),但实际上大脑状态是连续的。Hypnodensity 是自动分期算法输出的概率分布——即对每个 epoch,给出它属于各睡眠阶段的概率,而非单一标签。

分析方法:贝叶斯 ANOVA,建模自动分期阶段和梦境报告类别的主效应,以及数据集的随机效应。

关键结果:

  • 睡眠阶段的主效应:log(BF_inclusion) = +∞(极强证据)
  • 梦境报告类别的主效应:log(BF_inclusion) = 8.582(极强证据)
  • 交互效应:log(BF_inclusion) = 10.367(极强证据)
  • NREM 中报告有梦境体验的 epoch,其 hypnodensity 向清醒(W)方向偏移,即这些 epoch 的'清醒概率'显著高于无梦境体验的 NREM epoch

理论意义——从'隐蔽 REM'到'隐蔽清醒'

Nielsen(2000)在其经典综述中提出了 '隐蔽 REM(Covert REM)'假说:NREM 中的梦境可能源于解离的 REM 样过程渗入 NREM 睡眠。本文的 hypnodensity 分析提供了一种更精细的解读:NREM 中的梦境可能不特异性地反映'隐蔽 REM',而是更一般地反映 '隐蔽清醒(Covert Wake)'——即皮层激活水平的局部升高使大脑处于一种类清醒状态,从而产生意识体验。

这与 Siclari et al.(2017)发现的后部皮层'热区'中 delta 功率降低与梦境的关联一致,也与整合信息理论(IIT)的核心主张相容:意识需要足够的皮层复杂性和分化,而深度同步慢波活动恰恰抑制了这种复杂性。

3.5 EEG 特征对梦境体验的分类预测

数据:仅使用 3 个共有电极(F4, C4, O2),提取唤醒前 30 秒的 EEG 特征。

三组特征:

  1. PSD 特征:6 个频段的归一化功率(delta, theta, alpha, sigma, beta, gamma),共 18 个特征
  2. Catch22bb:对宽带(0.5-35 Hz)EEG 计算 catch22 时序特征,共 66 个特征
  3. Catch22bf:对 6 个频段分别计算 catch22 特征,共 396 个特征

catch22 是什么? 由 Lubba et al.(2019)提出的 22 个规范时间序列特征,涵盖线性/非线性自相关、熵、平稳性和波动缩放等性质,计算速度比完整特征库快约 1000 倍,同时保留约 93% 的分类性能。

分类结果(200 次随机训练 - 测试划分):

睡眠阶段最佳特征集AUC(均值)AUC(5th - 95th)显著性
NREMPSD0.5860.505 - 0.608p < 0.001*
REMCatch22_bf0.7000.663 - 0.731p < 0.001*

*Bonferroni 校正后的 Wilcoxon 秩和检验 vs 置换零分布

解读:

  • 所有分类结果均显著优于随机水平
  • NREM 的 AUC = 0.586 看似不高,但仅使用了 3 个电极,且 NREM 梦境的神经信号本身就微弱而异质
  • REM 的 AUC = 0.700 更有说服力,且 catch22(非线性特征)优于 PSD(线性频谱特征)
  • catch22 仅在 REM 中优于 PSD,提示 REM 梦境的神经标记更多编码在时间动态特性而非频谱功率中
  • 对比 Moctezuma et al.(2025)使用 DREAM 数据库的 58 通道高密度 EEG,N2 梦境检测准确率可达 0.94 / AUROC 0.97——数据库的潜力远超 3 电极初步分析所呈现的结果

四、深层意义:梦境作为意识研究的'干净范式'

4.1 为什么梦境是研究意识的最佳窗口?

传统意识研究比较的是截然不同的脑状态(清醒 vs 深睡、清醒 vs 全麻),但这些'状态间'对比涉及神经调节环境、感觉加工和行为反应的全面改变,无法分离哪些神经差异与意识本身相关。

梦境提供了所谓的 '无报告 - 状态内'范式(no-report within-state paradigm):

  • 状态内对比:在同一睡眠阶段内(如 N2 中),比较报告有梦 vs 无梦的 epoch,全局脑状态近似恒定
  • 无报告:梦境者在体验过程中不执行任何实验任务,无需关注报告本身,消除了注意、元认知和运动计划的混淆
  • 自然发生:梦境是自发产生的意识体验,最小化了实验者施加的人工影响

正如 Koch et al.(2016)和 Boly et al.(2017)所论述的,梦境可能代表了识别完整意识神经关联的最干净方法。

4.2 临床启示

梦境每晚都在证明一个事实:意识可以在没有行为反应的情况下存在。这对以下临床场景有直接启示:

  • 无反应觉醒综合征(UWS):约 40% 的植物状态患者可能被误诊,部分患者的脑反应提示存在隐蔽意识(认知 - 运动解离)
  • 全身麻醉:约 20% 的麻醉患者可能保留某种形式的意识,术中体验在现象学上常类似于梦境
  • 意识检测:在 DREAM 数据库上验证的意识检测方法,可能迁移至这些无法自主沟通的临床情境

五、局限性与未来方向

5.1 当前局限
局限说明
报告依赖性梦境报告必须唤醒被试,受睡眠惯性和快速遗忘影响
认识论模糊'无体验'可能是真正的无意识,也可能是遗忘
信息损失将不同分类方案映射至三级系统时不可避免地丢失细节
分析限制仅 6/20 个数据集符合严格的 EEG 分析标准;仅使用 3 个共有电极
分期噪声自动分期准确率约 0.72,误差可能系统性偏置 hypnodensity 分析
主观 - 客观不一致部分 epoch 被客观分期标为'清醒',但被试主观报告仍在睡眠中
5.2 未来方向
  1. 高密度 EEG 数据集的纳入:当更多 hdEEG(64-256 通道)数据集加入后,可进行源定位、连接性分析,进一步验证 Siclari et al. 的后部皮层'热区'发现
  2. 深度学习方法:利用数据库训练更先进的意识检测模型,探索能否泛化到麻醉和意识障碍患者
  3. 预注册研究:数据库天然适配'注册报告/注册分析'范式,可先行估计样本量、缩小假设空间
  4. 梦境内容解码:Dream2Image 项目(2025)已开始将 DREAM 数据库 EEG 与 AI 生成的梦境视觉重建结合
  5. 清醒梦研究:数据库包含清醒梦数据集(TWC USA),为研究意识的自我觉知维度提供基础

六、个人思考与总结

6.1 论文重要性

对梦境研究:DREAM 数据库标志着梦境神经科学从'各自为战的小型研究'转向'标准化、可复用、累积性的大规模协作'。505 名被试和 2643 次唤醒构成了比以往任何单一研究都大一个量级的样本。

对意识科学:它为意识的'状态内对比'提供了迄今最大的标准化数据支持。Hypnodensity 分析揭示的'隐蔽清醒'现象挑战了睡眠阶段作为离散状态的传统观念,暗示意识是一个连续维度,而非开关式的二元状态。

对临床应用:它搭建了一座桥梁——从基础的梦境意识研究到临床意识检测的转化应用。在 DREAM 数据库上验证的方法,未来可能帮助检测无法自主报告的患者中的隐蔽意识。

6.2 一些值得思考的问题
  • 如果 NREM 中的梦境确实反映了局部的'隐蔽清醒',那么这种清醒是均匀分布于皮层还是集中于特定区域(如 Siclari 所说的后部热区)?
  • Catch22 特征在 REM 中显著优于 PSD,这是否暗示 REM 意识的编码方式根本不同于 NREM?
  • 随着数据库持续扩展,是否有可能构建一个跨睡眠阶段、跨人群的通用意识检测模型?
  • '白梦'(EWR)到底代表什么?是意识体验的记忆编码失败,还是一种低质量的边缘意识状态?

附录:核心参考文献

  1. Wong, W., Herzog, R. et al. 'A dream EEG and mentation database.' Nature Communications 16, 7495 (2025). DOI
  2. Siclari, F. et al. 'The neural correlates of dreaming.' Nature Neuroscience 20, 872–878 (2017).
  3. Nielsen, T.A. 'A review of mentation in REM and NREM sleep: 'covert' REM sleep as a possible reconciliation of two opposing models.' Behavioral and Brain Sciences 23, 851–866 (2000).
  4. Koch, C. et al. 'Neural correlates of consciousness: progress and problems.' Nature Reviews Neuroscience 17, 307–321 (2016).
  5. Lubba, C.H. et al. 'catch22: Canonical time-series characteristics.' Data Mining and Knowledge Discovery 33, 1821–1852 (2019).
  6. Stephansen, J.B. et al. 'Neural network analysis of sleep stages enables efficient diagnosis of narcolepsy.' Nature Communications 9, 5229 (2018).
  7. Hudachek, L. & Wamsley, E. 'Prospects of open science practices and large-scale collaborations for dream research.' SLEEP 46(12), zsad139 (2023).

目录

  1. 一、研究背景:梦境研究为何需要一个大型数据库?
  2. 1.1 梦境科学的三大困境
  3. 1.2 现有数据库的对比
  4. 二、方法学创新:如何驯服异质数据?
  5. 2.1 统一的梦境报告三级分类体系
  6. 2.2 数据标准与质量控制
  7. 2.3 首批 20 个数据集概览
  8. 三、核心结果:四项关键分析
  9. 3.1 行为分析:睡眠深度与梦境频率的关系
  10. 3.2 功率谱密度分析:睡眠阶段的频谱特征
  11. 3.3 自动睡眠分期:人工 vs 算法
  12. 3.4 核心发现:Hypnodensity 分析与“隐蔽清醒”假说
  13. 3.5 EEG 特征对梦境体验的分类预测
  14. 四、深层意义:梦境作为意识研究的“干净范式”
  15. 4.1 为什么梦境是研究意识的最佳窗口?
  16. 4.2 临床启示
  17. 五、局限性与未来方向
  18. 5.1 当前局限
  19. 5.2 未来方向
  20. 六、个人思考与总结
  21. 6.1 论文重要性
  22. 6.2 一些值得思考的问题
  23. 附录:核心参考文献
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Rust 异步代码测试与调试实战
  • 基于 Q-learning 的无人机三维路径规划原理及 MATLAB 实现
  • 渐进式 AIGC 系统:多模态大模型与 Agent 智能体私有化部署方案
  • Qoder AI 编码工具功能详解
  • CentOS 7 Docker 安装指南
  • Agent AI 探索多模态交互前沿领域综述
  • GraphQL在Python中的实现:从基础到企业级实战
  • 前端请求分层与自动接口生成方案
  • FAIR plus 2026 机器人全产业链链接会技术亮点梳理
  • 大语言模型(LLM)核心知识体系概览
  • Flutter Web 开发解决跨域(CORS)问题指南
  • 堆数据结构与字符串处理算法详解
  • YOLO11 驱动的无人机航拍小目标检测系统实战
  • OpenAI Whisper 语音识别与转录使用指南
  • Spring Boot 常用注解速查表:30 个必会注解与实战案例
  • 基于 Web Unlocker 与 n8n 的自动化资讯采集与推送实践
  • LLM 存储记忆功能:BaseChatMemory 详解与子类实战
  • 飞算 JavaAI:代码智能构造平台
  • 图对比学习综述(一):对比范式与优化目标
  • OpenClaw 部署指南:Coding Plan 配置 + CC Switch + 飞书机器人

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online