视知觉学习 (visual perceptual learning)
奖励 (reward)
快速眼动睡眠 (REM sleep)
当代大学生们常被“DDL(deadline)”和“考试周”两个词折磨得痛不欲生,在这两个特殊时期,我们常常熬夜,牺牲睡眠时间完成作业、复习功课。但是,这样真的有用吗?美国布朗大学的一项关于视知觉学习的研究表明,我们需要睡眠来保持学习。视知觉学习(visual perceptual learning, VPL)是由于知觉经验而导致的长期视知觉能力上的提升。视知觉学习通常被认为是视觉信息处理和大脑可塑性的体现。现在一般认为视知觉学习包括两个阶段:快速内部阶段和延迟离线阶段,其中睡眠在后者中发挥了重要作用。已有研究表明,在延迟离线阶段,视知觉学习表现会在夜间或白天小睡后得到提升。另一些研究认为,在训练期间提供奖励也能提高视知觉学习表现。由于视知觉学习被定义为一种持久的影响,奖励对视知觉学习的影响是在多天训练的情况下得出来的,无法排除睡眠的影响。目前,睡眠和奖励对视知觉学习的影响是否以及如何相互作用尚未清楚。Tamaki等(2020)采用纹理识别任务(在方法部分进行详细介绍),进行了3个子实验,旨在探究睡眠和奖励对视知觉学习的影响是否有交互作用,如果有,那么在睡眠期间的大脑的震荡是如何对视知觉学习起促进作用的。实验一将被试分为4组考察奖赏与睡眠对于VPL的交互作用。实验二为了验证实验一的结果是否仅仅是因为奖赏组在测试阶段提供的奖赏,因此,在实验二中奖赏在训练期间提供而不在测试阶段提供。实验三使用多导睡眠图研究奖赏与睡眠之间的交互作用的神经机制。被试:47名成人,20名男性,27名女性,年龄为18-25岁。实验设计:2(清醒状态:睡眠、清醒)x 2(奖赏:有、无)被试间设计,因变量为表现提升百分比((第一次训练的SOA(Stimulus Onset Asynchrony,刺激呈现不同性)阈值-第二次训练的SOA阈值)/第一次训练的SOA阈值x100)。实验材料和流程:两个睡眠组在晚上9点进行第一次TDT训练,第二天早上9点进行第二次TDT训练;而另两个清醒组在上午9点开始第一次TDT训练,第二次TDT训练在当天晚上九点。纹理识别任务(Texture Discrimination Task, TDT, 标准VPL任务):首先会在屏幕中心呈现1000 ms的注视点,然后呈现13 ms的纹理显示屏,纹理显示屏以许多的水平横线为背景,在屏幕中间有一个特殊字母,在屏幕左下处有一个三条特殊方向的斜线,被试的任务有两个,字母任务要求被试报告屏幕中心字母是“L”还是“T”以确保被试视线的固定,定向任务要求被试判断三条线的方向。在纹理显示屏消失后,呈现一个持续时间不同的黑屏,接着是100 ms的掩蔽刺激(由随机旋转的V形图案组成)。纹理刺激和掩蔽刺激的空白间隔称为SOA。该实验共选取了8个时间段作为SOA,分别为:400 ms、180 ms、160 ms、140 ms、120 ms、100 ms、80 ms和60 ms。在被试做出反应后,所有组的字母任务和定向任务都会得到听觉反馈。此外,两个奖励组在定向任务回答正确后会获得一滴水滴作为奖励(如图1)。(1)在VPL中延迟离线阶段的表现提升上,睡眠组的成绩显著高于清醒组,奖励组的成绩显著高于无奖励组。睡眠与奖赏之间存在显著的交互作用,睡眠组间存在显著的简单奖励效应,而清醒组不存在。这表明,奖赏与睡眠之间的显著交互作用源于睡眠组与清醒组奖赏效应的差异。(2)第一次训练的SOA阈值上,睡眠和奖励都无显著的主效应,也没有交互作用。这说明了奖赏效应在第一次训练中没有出现,只出现在睡眠起作用的离线表现提升中(如图2)。图2 (A)表现提升百分比(M±SE)(B)4组在训练初期的SOA阈值(M±SE)注:****P < 0.001,***P < 0.005,+P < 0.10研究二 验证实验一的结果是否仅仅是因为奖赏组在测试阶段提供的奖赏被试:40名成人,16名男性,24名女性,年龄在18-25岁之间实验设计:2(清醒状态:睡眠、清醒)x 2(奖赏:有、无)被试间设计,因变量为清醒/睡眠期间表现提升百分比((T1阶段SOA阈值-T2阶段SOA阈值)/T1阶段SOA阈值)x100。实验流程: 被试接受和实验一相同的TDT训练,但实验二并没有第二次训练阶段,而是在第一次训练阶段之后,开展两次测试,一次是在训练后立即进行睡前测试(T1),另一次是在还没有第二次训练后的间隔12个小时的睡眠后测试(T2)。在两次测试期间不给任何一组提供奖励以保证在测试期间的表现评估不受奖励的影响(如图3)。(1)睡眠组表现显著高于清醒组,奖赏和睡眠的交互作用显著,在睡眠组中,奖赏的效应显著,但是在清醒组,奖赏的效应不显著。这与实验一的结果一致,即奖赏对没有睡眠的VPL离线表现提升没有影响。(2)在训练期间和测试T1期间,各组的SOA值差异均不显著(如图4)。图4 (A)表现提升百分比 (B)4组在训练初期的SOA阈值(M±SE)被试:22名成人,10名男性和12名女性,年龄在18-25岁之间。实验设计:单因素被试间设计,自变量为有无奖励(睡眠-奖励,睡眠-无奖励),因变量为睡眠期间表现提升百分比((T1阶段SOA阈值-T2阶段SOA阈值)/T1阶段SOA阈值)x100,快速眼动睡眠持续时间。实验材料:斯坦福嗜睡量表,用来测试被试主观嗜睡程度。实验流程:被试被要求在中午到达实验室。经过一个小时的TDT训练和十分钟的T1测试,被试休息30分钟,同时使用电极进行PSG(多导睡眠图polysomnography,由脑电图、眼电图和肌电图组成)。所有被试在下午2点开始小睡120分钟。被试清醒并且未配备PSG电极后,在下午4:30进行T2测试。在T1和T2开始时,研究者用斯坦福嗜睡量表测量了被试主观嗜睡程度。所有训练和测试的程序和参数与实验二相同。仅在训练阶段给予水滴奖励,T1和T2两次测试不给予水滴奖励(如图5)。(1)两组在T1和T2期间的主观嗜睡程度没有显著差异,这说明了组间不同行为结果和自发大脑震荡不是嗜睡造成的。(2)奖赏的效应显著,奖励组的离线表现提高显著大于无奖励组(如图6A)。(3)睡眠的各个阶段中,只有REM时间存在显著差异,说明奖赏效应发生在REM阶段(如图6B)。图6 (A)表现提高(百分比)(M±SE) (B)REM睡眠持续时间(分)(M±SE)(4)对于前额叶和枕叶区域,奖励对自发振荡的影响有所不同。奖励组中前额区的能量密度比无奖励组的大,而奖励组枕骨区域则比无奖励组小(如图7)。图7 非快速眼动睡眠(A)和快速眼动睡眠(B)期间的自发活动(M±SE)注:实心条表示奖励组(Rwd),阴影条表示无奖励组(no)。黄色条代表前额叶,红色条代表未受过训练的枕骨,蓝色条代表受过训练的枕骨区域。红色括号表示事后分析中的显著奖励效果。在事后分析中,黑色括号显示了在奖励组中训练和未训练的枕骨区域之间的能量密度的显著差异,而灰色括号显示了在非奖励组中训练和未训练的枕骨区域之间的能量密度的显著差异。*P < 0.05,**P < 0.01,***P < 0.005,****P < 0.001。(5)离线表现提高与快速眼动睡眠期间前额叶区域的平均能量密度显著相关(r = 0.850)也和训练区域非快速眼动睡眠阶段的激活相关(r = 0.804),并且在无奖赏组没有显著相关关系(如图8)。图8 奖励组离线表现提升与训练后睡眠期间的自发振荡之间的相关性注:(A)非快速眼动期间,训练的特定位置的视觉处理能量密度 (B)快速眼动期间前额叶能量密度
讨论
(1)该研究表明奖励和睡眠在VPL中有交互作用,训练期间提供的奖励通过睡眠获得了离线表现提高,并且奖赏的调节主要发生在额叶中快速眼动阶段以及训练的枕叶的非快速眼动阶段。
(2)该研究采用TDT研究了奖赏和睡眠对VPL的影响之间的交互作用,然而并非所有类型的学习都需要睡眠来显示离线表现的增益。因此,在其他VPL任务中,训练期间的奖励是否同样有助于提高表现还有待研究。
此外,未来的研究还需要解决以下两个问题:第一,为什么奖赏和视觉处理的交互作用在清醒时并没有发生,直到睡眠时期才开始发生?第二,在训练过程中,奖励如何塑造学习曲线?解决这些问题将有助于更好地了解学习过程的细节,帮助我们更加高效地准备考试周。Tamaki, M., Berard, A. V., Barnes-Diana, T., Siegel, J., Watanabe, T., & Sasaki, Y. (2020). Reward does not facilitate visual perceptual learning until sleep occurs. PNAS, 117(2), 959-968.