【论文阅读 | Nature Communications 2025】DREAM 数据库:当脑电遇见梦境,意识研究迎来“大数据“时代

📖 论文信息标题:A dream EEG and mentation database期刊:Nature Communications (2025) 16:7495DOI10.1038/s41467-025-61945-1数据库https://monash.edu/dream-database作者:William Wong, Rubén Herzog 等 53 位作者,来自 13 个国家 37 家机构关键词:睡眠脑电、梦境报告、意识神经关联、数据库、NREM/REM

本文构建了首个将睡眠脑电(M/EEG)与标准化梦境报告配对的开放数据库——DREAM(Dream EEG and Mentation),首批发布包含 20 个数据集、505 名被试、2643 次唤醒记录,并展示了通过 EEG 特征预测睡眠中是否存在意识体验的可行性。


一、研究背景:梦境研究为何需要一个大型数据库?

1.1 梦境科学的三大困境

人的一生约有 三分之一 的时间处于睡眠中,其中相当一部分时间伴随着梦境。研究睡眠中的意识体验不仅事关梦境科学本身,更是探索意识神经关联(Neural Correlates of Consciousness, NCC)的核心范式之一。然而,梦境的神经科学研究长期受困于三个结构性难题:

(1)样本量严重不足

梦境研究的金标准方法——连续唤醒范式(Serial Awakening Paradigm)——要求被试在实验室中连续数夜睡眠,并被反复唤醒以报告梦境体验。这使得数据采集极为耗时耗力。以往绝大多数研究的样本量仅在"数十次唤醒"的量级,即便是里程碑式的 Siclari et al.(2017, Nature Neuroscience)研究也仅使用了 32+7 名被试。Hudachek & Wamsley(2023)的统计功效分析表明:在梦境研究的典型效应量下(SMD ≈ 0.52),25 名被试仅能提供约 20% 的统计功效,远低于合理阈值。

(2)方法学异质性

不同实验室对梦境的分类标准差异巨大:有的使用二元(有/无)判断,有的使用 Likert 量表,有的用开放式口头报告。Foulkes(1962)早就发现,仅仅将问题从"你做梦了吗?“改为"你有过任何心理活动吗?”,NREM 的梦境回忆率就会从 5-10% 跃升至 50%。EEG 记录参数(通道数、采样率、参考方案等)也各不相同,使跨研究比较几乎不可能。

(3)缺乏共享基础设施

在本项目之前,相关数据库要么只有睡眠脑电但无梦境报告(如 NSRR 拥有超过 46,000 例多导睡眠图),要么只有梦境文本但无神经生理记录(如 DreamBank 拥有约 2-3 万条文本报告,Sleep and Dream Database 拥有 44,500+ 条报告)。将脑电与主观体验配对的资源完全空白。

1.2 现有数据库的对比

数据库睡眠脑电梦境报告脑电+报告配对规模主要用途
NSRR (sleepdata.org)--~46,000 被试临床睡眠医学
DreamBank.net--~20,000-30,000 条文本梦境内容分析
Sleep and Dream Database--~44,500+ 条报告内容与人口学
OpenNeuro√(少量)--BIDS 格式数据神经影像方法
DREAM505 被试, 2643 次唤醒梦境意识的神经关联
DREAM 数据库是唯一将每一条脑电记录与标准化主观体验分类配对的开放资源,填补了该领域最关键的数据空白。

二、方法学创新:如何驯服异质数据?

2.1 统一的梦境报告三级分类体系

论文最重要的方法学贡献是提出了一套最小公约数式的梦境分类方案,将所有贡献数据集的梦境报告统一映射至三个有序等级:

分类英文名定义
有体验Experience (E)被试报告在唤醒前的睡眠中有过体验,且能回忆具体内容
有体验但无法回忆Experience without recall (EWR)被试强烈感觉做了梦,但无法回忆任何具体内容(又称"白梦")
无体验No experience (NE)被试没有任何做梦的印象,也不认为有过体验

为什么要保留"有体验但无法回忆"这个中间类别?这涉及梦境研究中一个根本性的认识论难题:当被试报告"没有做梦"时,究竟是真的没有意识体验,还是仅仅遗忘了? Ruby(2020)在评论 Siclari et al.(2017)时精确地指出了这一点。保留三级分类允许研究者在分析中处理这个模糊地带,而不是被迫做出二元假设。

对于原始分类与 DREAM 标准不完全匹配的数据集,论文制定了三条映射规则:

  1. 直接映射:原始分类可类比于标准定义时,直接对应;
  2. 重新分类:原始分类不能直接对应,但原始报告数据允许重新分类时,提供重分类结果;
  3. 组合分类:无法明确重分类时,保留原始分类并标记为标准类别的组合(如"EWR 或 NE")。

2.2 数据标准与质量控制

最低技术标准

  • 至少 2 个可定位的 EEG 电极(10-5 系统)
  • 唤醒前至少 20 秒连续睡眠记录
  • 采样率 ≥ 100 Hz
  • 原始数据或最小预处理数据

数据格式:所有多导睡眠图统一为 EDF+ 格式,被试 ID 和案例 ID 编码于 EDF 头文件中。数据库遵循 FAIR 原则(可发现、可访问、可互操作、可复用),并托管于 Monash University,采用 CC BY 4.0 许可。

质量控制:结合人工审查和自动检查,确保文件结构、数据格式和元数据一致性。最后 20 秒中无伪迹 EEG 不足 10 秒的数据被排除。

2.3 首批 20 个数据集概览

首批数据集涵盖了极为多样的实验范式,包括:

  • 多次 REM/NREM 唤醒(De Gennaro & Scarpelli 系列)
  • 清醒梦研究(Konkoly et al., TWC USA)
  • 睡眠入梦期创造力任务(Lacaux et al.)
  • 空间学习后睡眠(Zhang & Wamsley)
  • 有声书入睡研究(Kumral et al.)
  • 便携 EEG 家庭睡眠记录(LODE, Elce et al.)
  • MEG + EEG 同步记录(MEG Kyushu, 单被试 31 次唤醒)
  • 儿童发育性阅读障碍(Children Dreaming)
  • 老年人群体(Older Adults)
  • 梦话研究(Sleep Talking)

三、核心结果:四项关键分析

3.1 行为分析:睡眠深度与梦境频率的关系

基于 1550 次有完整睡眠分期和梦境分类的唤醒数据,作者进行了卡方检验和广义线性混合效应模型分析。

睡眠阶段 × 体验类型的列联表:

睡眠阶段无体验 (NE)有体验无回忆 (EWR)有体验 (E)合计
N112 (11%)1 (1%)97 (88%)110
N2308 (36%)68 (8%)485 (56%)861
N326 (41%)7 (11%)31 (48%)64
REM87 (17%)12 (2%)416 (81%)515
卡方检验:χ² = 120.9, df = 6, p < 10⁻¹⁵,高度显著。

关键发现

  • N1 阶段的体验报告率最高(88%),甚至超过了 REM(81%)
  • NREM 睡眠越深,梦境报告率越低(N1 > N2 > N3)
  • 混合效应模型以 >99% 的置信度确认了上述趋势

深度解读:N1 的高梦境率值得特别关注。N1 是清醒与睡眠之间的过渡状态,伴随入睡前幻觉(hypnagogic imagery)。其体验率超过 REM,表明意识并不随着生理性睡眠标志的出现而立即消失。这挑战了将睡眠阶段视为离散、互斥状态的简单化模型,支持 睡眠阶段是流动的、可解离的生理过程集群 这一新兴共识。

3.2 功率谱密度分析:睡眠阶段的频谱特征

选取 6 个符合 EEG 分析标准的数据集(排除了使用干电极、睡眠中存在刺激或人口学特殊的数据集),共 1462 个 30 秒 epoch,从中央电极(C3 或 C4)提取功率谱密度(PSD)。

结果符合经典预期:

  • 清醒(W):显著的 alpha 峰(8-12 Hz)
  • NREM:sigma(纺锤波)峰(12-15 Hz),N3 中 delta 功率(0.5-4 Hz)显著增强
  • REM:theta 范围(4-8 Hz)活动增强

这一分析本身并非新发现,但重要的是它验证了来自不同实验室、不同设备的数据在标准化后仍然保持了一致的频谱特征,证明了数据库的有效性。

3.3 自动睡眠分期:人工 vs 算法

使用经过验证的自动睡眠分期算法(Stephansen et al., 2018),对 6 个数据集进行自动分期,并与人工评分结果比较。

结果

  • 各数据集准确率从 0.505 到 1.000 不等
  • 全局平均准确率 ≈ 0.743
  • 接近人类评分者间一致性(根据 AASM 指南,6 名评分者仅有 46±9% 的 epoch 达到一致)

这一结果有双重意义:(1)验证了 DREAM 数据库数据可直接用于自动化分析流水线;(2)揭示了睡眠分期本身固有的模糊性——这种模糊性恰恰是后续 hypnodensity 分析的切入点。

3.4 核心发现:Hypnodensity 分析与"隐蔽清醒"假说

这是论文中最具理论意义的分析。

什么是 Hypnodensity?

传统睡眠分期将每个 epoch 强制分配到一个离散类别(W/N1/N2/N3/REM),但实际上大脑状态是连续的。Hypnodensity 是自动分期算法输出的概率分布——即对每个 epoch,给出它属于各睡眠阶段的概率,而非单一标签。

分析方法:贝叶斯 ANOVA,建模自动分期阶段和梦境报告类别的主效应,以及数据集的随机效应。

关键结果

  • 睡眠阶段的主效应:log(BF_inclusion) = +∞(极强证据)
  • 梦境报告类别的主效应:log(BF_inclusion) = 8.582(极强证据)
  • 交互效应:log(BF_inclusion) = 10.367(极强证据)
  • NREM 中报告有梦境体验的 epoch,其 hypnodensity 向清醒(W)方向偏移,即这些 epoch 的"清醒概率"显著高于无梦境体验的 NREM epoch

理论意义——从"隐蔽 REM"到"隐蔽清醒"

Nielsen(2000)在其经典综述中提出了 "隐蔽 REM(Covert REM)"假说:NREM 中的梦境可能源于解离的 REM 样过程渗入 NREM 睡眠。本文的 hypnodensity 分析提供了一种更精细的解读:NREM 中的梦境可能不特异性地反映"隐蔽 REM",而是更一般地反映 “隐蔽清醒(Covert Wake)”——即皮层激活水平的局部升高使大脑处于一种类清醒状态,从而产生意识体验。

这与 Siclari et al.(2017)发现的后部皮层"热区"中 delta 功率降低与梦境的关联一致,也与整合信息理论(IIT)的核心主张相容:意识需要足够的皮层复杂性和分化,而深度同步慢波活动恰恰抑制了这种复杂性。

3.5 EEG 特征对梦境体验的分类预测

数据:仅使用 3 个共有电极(F4, C4, O2),提取唤醒前 30 秒的 EEG 特征。

三组特征

  1. PSD 特征:6 个频段的归一化功率(delta, theta, alpha, sigma, beta, gamma),共 18 个特征
  2. Catch22bb:对宽带(0.5-35 Hz)EEG 计算 catch22 时序特征,共 66 个特征
  3. Catch22bf:对 6 个频段分别计算 catch22 特征,共 396 个特征
catch22 是什么? 由 Lubba et al.(2019)提出的 22 个规范时间序列特征,涵盖线性/非线性自相关、熵、平稳性和波动缩放等性质,计算速度比完整特征库快约 1000 倍,同时保留约 93% 的分类性能。

分类结果(200 次随机训练-测试划分):

睡眠阶段最佳特征集AUC(均值)AUC(5th - 95th)显著性
NREMPSD0.5860.505 - 0.608p < 0.001*
REMCatch22_bf0.7000.663 - 0.731p < 0.001*

*Bonferroni 校正后的 Wilcoxon 秩和检验 vs 置换零分布

解读

  • 所有分类结果均显著优于随机水平
  • NREM 的 AUC = 0.586 看似不高,但仅使用了 3 个电极,且 NREM 梦境的神经信号本身就微弱而异质
  • REM 的 AUC = 0.700 更有说服力,且 catch22(非线性特征)优于 PSD(线性频谱特征)
  • catch22 仅在 REM 中优于 PSD,提示 REM 梦境的神经标记更多编码在时间动态特性而非频谱功率中
  • 对比 Moctezuma et al.(2025)使用 DREAM 数据库的 58 通道高密度 EEG,N2 梦境检测准确率可达 0.94 / AUROC 0.97——数据库的潜力远超 3 电极初步分析所呈现的结果

四、深层意义:梦境作为意识研究的"干净范式"

4.1 为什么梦境是研究意识的最佳窗口?

传统意识研究比较的是截然不同的脑状态(清醒 vs 深睡、清醒 vs 全麻),但这些"状态间"对比涉及神经调节环境、感觉加工和行为反应的全面改变,无法分离哪些神经差异与意识本身相关。

梦境提供了所谓的 "无报告-状态内"范式(no-report within-state paradigm)

  • 状态内对比:在同一睡眠阶段内(如 N2 中),比较报告有梦 vs 无梦的 epoch,全局脑状态近似恒定
  • 无报告:梦境者在体验过程中不执行任何实验任务,无需关注报告本身,消除了注意、元认知和运动计划的混淆
  • 自然发生:梦境是自发产生的意识体验,最小化了实验者施加的人工影响

正如 Koch et al.(2016)和 Boly et al.(2017)所论述的,梦境可能代表了识别完整意识神经关联的最干净方法

4.2 临床启示

梦境每晚都在证明一个事实:意识可以在没有行为反应的情况下存在。这对以下临床场景有直接启示:

  • 无反应觉醒综合征(UWS):约 40% 的植物状态患者可能被误诊,部分患者的脑反应提示存在隐蔽意识(认知-运动解离)
  • 全身麻醉:约 20% 的麻醉患者可能保留某种形式的意识,术中体验在现象学上常类似于梦境
  • 意识检测:在 DREAM 数据库上验证的意识检测方法,可能迁移至这些无法自主沟通的临床情境

五、局限性与未来方向

5.1 当前局限

局限说明
报告依赖性梦境报告必须唤醒被试,受睡眠惯性和快速遗忘影响
认识论模糊"无体验"可能是真正的无意识,也可能是遗忘
信息损失将不同分类方案映射至三级系统时不可避免地丢失细节
分析限制仅 6/20 个数据集符合严格的 EEG 分析标准;仅使用 3 个共有电极
分期噪声自动分期准确率约 0.72,误差可能系统性偏置 hypnodensity 分析
主观-客观不一致部分 epoch 被客观分期标为"清醒",但被试主观报告仍在睡眠中

5.2 未来方向

  1. 高密度 EEG 数据集的纳入:当更多 hdEEG(64-256 通道)数据集加入后,可进行源定位、连接性分析,进一步验证 Siclari et al. 的后部皮层"热区"发现
  2. 深度学习方法:利用数据库训练更先进的意识检测模型,探索能否泛化到麻醉和意识障碍患者
  3. 预注册研究:数据库天然适配"注册报告/注册分析"范式,可先行估计样本量、缩小假设空间
  4. 梦境内容解码:Dream2Image 项目(2025)已开始将 DREAM 数据库 EEG 与 AI 生成的梦境视觉重建结合
  5. 清醒梦研究:数据库包含清醒梦数据集(TWC USA),为研究意识的自我觉知维度提供基础

六、个人思考与总结

6.1 论文重要性

对梦境研究:DREAM 数据库标志着梦境神经科学从"各自为战的小型研究"转向"标准化、可复用、累积性的大规模协作"。505 名被试和 2643 次唤醒构成了比以往任何单一研究都大一个量级的样本。

对意识科学:它为意识的"状态内对比"提供了迄今最大的标准化数据支持。Hypnodensity 分析揭示的"隐蔽清醒"现象挑战了睡眠阶段作为离散状态的传统观念,暗示意识是一个连续维度,而非开关式的二元状态

对临床应用:它搭建了一座桥梁——从基础的梦境意识研究到临床意识检测的转化应用。在 DREAM 数据库上验证的方法,未来可能帮助检测无法自主报告的患者中的隐蔽意识。

6.2 一些值得思考的问题

  • 如果 NREM 中的梦境确实反映了局部的"隐蔽清醒",那么这种清醒是均匀分布于皮层还是集中于特定区域(如 Siclari 所说的后部热区)?
  • Catch22 特征在 REM 中显著优于 PSD,这是否暗示 REM 意识的编码方式根本不同于 NREM?
  • 随着数据库持续扩展,是否有可能构建一个跨睡眠阶段、跨人群的通用意识检测模型?
  • “白梦”(EWR)到底代表什么?是意识体验的记忆编码失败,还是一种低质量的边缘意识状态?

附录:核心参考文献

  1. Wong, W., Herzog, R. et al. “A dream EEG and mentation database.” Nature Communications 16, 7495 (2025). DOI
  2. Siclari, F. et al. “The neural correlates of dreaming.” Nature Neuroscience 20, 872–878 (2017).
  3. Nielsen, T.A. “A review of mentation in REM and NREM sleep: ‘covert’ REM sleep as a possible reconciliation of two opposing models.” Behavioral and Brain Sciences 23, 851–866 (2000).
  4. Koch, C. et al. “Neural correlates of consciousness: progress and problems.” Nature Reviews Neuroscience 17, 307–321 (2016).
  5. Lubba, C.H. et al. “catch22: Canonical time-series characteristics.” Data Mining and Knowledge Discovery 33, 1821–1852 (2019).
  6. Stephansen, J.B. et al. “Neural network analysis of sleep stages enables efficient diagnosis of narcolepsy.” Nature Communications 9, 5229 (2018).
  7. Hudachek, L. & Wamsley, E. “Prospects of open science practices and large-scale collaborations for dream research.” SLEEP 46(12), zsad139 (2023).

💬 如果这篇解读对你有帮助,欢迎点赞、收藏、关注,也欢迎在评论区讨论你对梦境与意识的看法!

本文为论文阅读笔记,仅代表个人理解,如有错误欢迎指正。

Read more

Qwen3-32B开源模型+Clawdbot=高效AI工作流:Web网关配置与Prompt工程结合教程

Qwen3-32B开源模型+Clawdbot=高效AI工作流:Web网关配置与Prompt工程结合教程 1. 为什么需要这个组合:从“能用”到“好用”的关键跃迁 你有没有遇到过这样的情况:好不容易本地跑起了Qwen3-32B,Ollama也顺利加载了模型,可一到实际使用环节就卡壳——API调不通、前端连不上、提示词一发过去,回复要么跑题、要么啰嗦、要么干脆沉默?这不是模型不行,而是缺了一层“智能连接器”。 Clawdbot就是这个连接器。它不替代Qwen3-32B,也不重写Ollama,而是以极轻量的方式,把大模型能力“翻译”成真正可用的对话服务。它像一个懂行的调度员:知道什么时候该把用户问题精准传给Qwen3,什么时候该拦截无效请求,什么时候该用预设模板帮用户补全提示词,甚至能在用户还没打完字时,就悄悄准备好上下文。 更重要的是,它不依赖云服务、不上传数据、不走公网——所有流量都在你自己的内网里闭环流转。8080端口进,18789网关出,中间没有第三方中转,也没有配置复杂的反向代理规则。这种“直连式网关”设计,让部署变得像启动一个本地应用一样简单,

Spring 配置文件加载路径:classpath、file、URL 与 Web 容器路径

Spring 配置文件加载路径:classpath、file、URL 与 Web 容器路径

在 Spring 框架中,ApplicationContext 在启动时需要加载配置文件(如 XML 配置或其他资源文件),而这些配置文件可能位于 不同的位置。 Spring 为此提供了统一的资源加载机制(Resource Loader),使应用程序可以从 类路径、文件系统、网络地址或 Web 容器路径 等不同来源读取配置。 常见的配置加载路径主要包括: * Classpath(类路径) * File System(文件系统路径) * URL(网络资源路径) * ServletContext(Web 容器路径) * classpath*(通配符类路径) 不同路径适用于不同的项目环境和部署方式。 一、Classpath 路径 1.1 什么是Classpath 路径 Classpath 指的是 Java 类路径(ClassPath)中的资源位置。 在 Maven

在Ubuntu 20.04上安装Ollama并部署大型语言模型:含Open WebUI图形界面教程

在Ubuntu 20.04上安装Ollama并部署大型语言模型:含Open WebUI图形界面教程

在Ubuntu 20.04上安装Ollama并部署大型语言模型:含Open WebUI图形界面教程 引言 在人工智能浪潮席卷全球的今天,大型语言模型(LLM)不再是遥不可及的云端技术。借助 Ollama,每一位开发者都能轻松地将强大的模型部署在自己的本地计算机上,实现无缝、私密且可定制的AI体验。本文将带领您一步步在 Ubuntu 20.04 系统上完成 Ollama 的安装与模型部署,并最终搭建美观易用的图形化界面(Open webui)。 Ollama 是什么? Ollama 是一个开源项目,专为在本地运行、管理和部署大型语言模型(如 Llama 3、Mistral、Gemma 等)而设计。 它的核心概念与优势非常清晰: * 简单易用:通过简单的命令行工具,即可完成模型的下载(pull)、运行(run)和管理。一条命令就能启动与模型的对话。 * 丰富的模型库:它提供了官方支持的模型库(Ollama

前端团队协作最佳实践:让团队效率飞起来

前端团队协作最佳实践:让团队效率飞起来 毒舌时刻 团队协作?听起来就像是前端工程师为了显得自己很专业而特意搞的一套复杂流程。你以为随便开几个会就能提高团队效率?别做梦了!到时候你会发现,会议时间比开发时间还多,团队效率反而下降了。 你以为使用Git就能解决所有协作问题?别天真了!Git的冲突解决能让你崩溃,分支管理能让你晕头转向。还有那些所谓的协作工具,看起来高大上,用起来却各种问题。 为什么你需要这个 1. 提高开发效率:良好的团队协作可以减少沟通成本,提高开发效率。 2. 减少错误:团队协作可以帮助你发现和修复代码中的错误,减少生产环境中的问题。 3. 知识共享:团队协作可以促进知识共享,提高团队整体水平。 4. 项目管理:良好的团队协作可以帮助你更好地管理项目,确保项目按时完成。 5. 团队凝聚力:良好的团队协作可以增强团队凝聚力,提高团队成员的工作积极性。 反面教材 // 1. 代码冲突 // 开发者A修改了文件 function getUser(id) { return fetch(`/api/users/${id}