与奖赏相关的fMRI解码

环境中潜在的奖赏信息对于指导适应性行为至关重要,理解神经奖赏过程可以对神经精神功能障碍提供新的见解。在过去的10年里,多体素模式分析(MVPA)技术已经被用来研究有关编码预期和经验信息的大脑区域。这些研究已经确定了整个大脑的奖赏信号,包括纹状体,内侧前额叶皮层,眶额叶皮层,背外侧前额叶皮层和顶叶皮层这篇文章讨论了用于解释这些研究结果的一些假设和模型,以及它们与动物电生理学的关系。本文回顾并总结了MVPA奖赏研究的一些重要发现。首先,它除了关注绘制处理奖赏的大脑区域,还提供了对价值和奖赏编码机制的新见解。然后,讨论了最近如何使用多变量成像方法对超出价值的预期奖赏特征进行解码的示例,例如预期结果的标识或获取结果所需的操作。这种复杂和多方面的奖赏表征的研究突出了使用表征方法的关键优势,这种方法能够独特地揭示这些信号,并可能缩小动物和人类研究之间的差距。在临床应用中,MVPA可能会增进我们对神经精神疾病的理解以及新型治疗策略的发展。本文发表在Neuroimage杂志。可添加微信号siyingyxf18983979082获取原文及补充材料)

1.介绍

在避免危险的同时靠近环境中的潜在奖赏对生存至关重要。为了实现这种适应性行为,人类和其他动物的神经系统必须处理和呈现与未来和经验结果相关的奖赏信息。反过来,神经奖赏过程的中断可能导致不良行为,如在神经和精神疾病患者中观察到的行为。
神经科学在利用损伤研究动物的奖赏加工方面有着丰富的历史,如电生理学和最近的光遗传学。相比之下,人类奖赏加工的研究传统上仅限于来自患者的证据,病灶位于限定的大脑区域。随着功能性磁共振成像(fMRI)的发明,这种情况发生了巨大的变化,fMRI为人类研究奖赏的神经机制打开了一扇窗。虽然单变量fMRI研究已经教会了我们很多关于奖赏加工的大脑区域,但它们被限制在神经元活动与体素和个体之间的奖赏过程相对一致的大脑区域。多变量方法出现在fMRI数据的分析中,减轻了这些限制,使我们能够研究大脑区域中不同神经元的表征和个体行为之间的关系。
在过去的十年里,使用MVPA技术的fMRI研究已经解码了来自人脑的各种奖赏相关信号。个别研究检查了与反馈相关的信号,这些信号预测了基于价值的选择(value-based choices),以及如何表示简单游戏结果中的强化信号。其他研究集中在解码被试的主观价值,预测结果的价值,被试在扫描仪内部做出的选择,以及估值和奖赏类型之间的差异。此外,一些研究使用被动观察(passive viewing)方法,来研究奖赏决断过程中的大脑活动,以预测在扫描仪之外做出的基于偏好的选择。例如,2010年Tusche展示了一系列以汽车为背景的图像,同时受试者正在进行一项要求很高的视觉注视任务。然后,将获取的fMRI数据用于预测扫描后消费者做出的假设选择。同样,2011年Levy表明,在被动观察消费类产品图像期间,与偏好相关的fMRI信号可用于预测稍后的实际选择。除了展示基于fMRI信号解码现实世界决策的技术可行性外,这些研究还说明了基于奖赏的解码方法在无法获得明显奖赏判断的行为时,还具有推断选择和估值的潜在应用。
总的来说,MVPA在奖赏领域的研究证实了以前单变量fMRI实验的结果,并成功解码了皮质下区域(如纹状体)以及前额叶和顶叶皮层区域的奖赏相关信息。本文的第2节讨论了MVPA与单个神经元奖励相关的放电过程中常见模型和假设。(注意,不会提供关于fMRI解码方法和多变量分类器的技术方面的一般概述,感兴趣的读者可以参考关于该主题的综合评论文章(Haynes 2015;Misaki 2010; Mourao-Miranda 2005。)。除了绘制与奖赏相关的大脑区域图谱外,许多MVPA的研究已经解决了关于奖赏的神经机制的其他问题,这些问题用传统的成像方法很难解决。这类研究的选择是第3节的重点,其中总结了这些实验的要点。4节讨论了如何使用表征成像方法来解决与奖赏和目标导向的行为有关的问题,这些问题超出了价值的编码范围。

2.与电生理学、模型和假设的关系

2.1单个神经元(neurons)的奖赏编码

神经元群体如何编码有关奖赏的信息?动物中的单细胞神经元记录和多神经元记录 (Single- and multi-unit recordings in animals)记录表明,根据大脑区域的不同,奖赏参数与神经元放电速率之间的关系既简单又同质,或者复杂又异质。例如,黑质和腹侧被盖区的多巴胺能神经元显示出相对同质的编码方式,使得放电率随未预测的奖赏和预测奖赏的刺激而增加。这些信号很可能是使用单变量fMRI在纹状体中观察到的相对同质的值信号。
相比之下,皮层区域神经元的放电显示出与奖赏参数更为异质的关系。在灵长类动物和啮齿类动物的前额叶皮层中观察到了对奖赏大小、概率和价值的增加和减少的反应。遵循这两种原型反应方案的神经元被标记为正值和负值编码神经元。“正”和“负”标签并不表示这些神经元(cell)分别编码奖赏和惩罚的值。它们仅仅指定了斜率的符号,该符号将放电率(firing rates)与奖赏值的增加水平相关联: 正值编码cell随着值的增加而增加它们的放电率,而负值编码cell降低它们的放电率(图1B)。值得注意的是,在前额叶皮层,两种人群的患病率大致相同,并且在皮质区域(例如OFC)内没有明显的大规模正值和负值编码细胞群集。这种不同的编码值有望在单个fMRI体素中平均出感兴趣的信号。
图1.单个PFC神经元中的奖赏编码和有偏采样。
A.结果(例如$金额)与价值,效价和显着性之间的关系。大于0的结果表示奖赏(正价),小于0的结果表示惩罚(负价)。请注意,如果仅考虑正价或负价的结果,则价值和显着性是完美的(正向或负向)相关。
B.示意图描绘了前额叶皮层中正值(绿色)和负值(红色)的编码cell的奖赏值(奖赏大小或概率)与放电率之间的关系。
C.有偏采样模型的示意图,表明正值和负值编码cell的随机分布会导致单个体素中两种cell类型比例的差异。
D.C中描述的cell类型分布差异如何导致单个fMRI体素的轻微反应差异的示意图。红色表示对较小(相对于大)奖赏的fMRI反应较强,绿色表示对较大(相对于小)奖赏的fMRI反应较强。

2.2 价值编码神经元的有偏采样(Biased sampling of value coding neurons)

神经元水平上与奖赏相关的群体反应如何转化为分布式fMRI模式?解释fMRI模式的传统模型是“有偏采样模型”。该模型假设fMRI的信息模式反映了单个fMRI体素对神经元的有偏采样。最简约的机制是cell的随机分布导致单个体素中的正值和负值编码单元的分布不均匀,使得一个体素碰巧被一种cell类型填充得稍微多一点,而另一个体素碰巧被另一种cell类型填充得稍微多一点(图1C)。反过来,这种采样偏差可能导致单个体素与奖赏相关的响应略有不同(图1D)。对于初级视觉皮层以及前额叶皮层中奖赏相关信号,提出了神经选择性细粒度模式编码的信息与fMRI模式之间的关系。然而,尽管支持这种有偏采样的主要视觉皮层的柱状结构已经很好地建立了,但前额叶皮层的详细地形微结构却鲜为人知。解剖学追踪研究表明,前额叶皮层内的局部投影是不规则的,并且局限于特定的簇,这可能指向前额叶皮层的准柱状结构,类似于初级感觉区。
有偏采样模型的拟议机制(其中选择性神经元的相对数量确定体素的响应偏向)很可能被过度简化了。已经提出了一个更复杂的模型,该模型考虑了血管系统的影响,并提出了时空动力学作为fMRI模式的神经生物学来源。该模型假设静脉血管对神经元模式采样的选择性偏向,并对血液动力学反应的时间动态如何影响观察到的fMRI模式做出了预测。换句话说,该模型将fMRI体素及其提供信号的血管系统视为神经元活动的复杂时空过滤器,从而产生了分布模式中包含的信息。该模型更好地解释了为什么模式信息通常对由头部运动引起的体素网格的空间平滑和轻微移动具有鲁棒性。
最后,已经表明潜在fMRI信号中的宏观偏差有助于fMRI模式中包含的信息。然而,即使这种偏差很可能存在,它们对于解码来说也不是必需的,这意味着它们不能解释fMRI模式中包含的全部信息。寻找一种模型来最准确地描述fMRI模式是如何包含神经元信息的,这将继续是许多实验和辩论的重点。

2.3空间选择,空间频率和概括

哪些体素构成了活动模式?最常用的方法包括从
(1)整个大脑(全脑解码);
(2)预定的感兴趣区域(ROI区域,功能或解剖学上定义的)中选择体素;
(3)使用探照灯(searchlight)方法执行局部模式信息的全脑映射。这些体素选择技术可以由或不由特征选择或其他形式的降维来补充,这对于全脑分类或特征数量可能非常大的超高分辨率数据尤其重要。值得注意的是,当使用功能定义的ROI区域时,重要的是使用独立的数据(如单独的功能定位数据即separate functional localizer),或者通过使用相同数据的正交对比。相同的规则也适用于特征选择,特征选择必须仅基于训练数据,不得包含任何关于测试数据的信息。
一个相关的问题是,信息是否冗余地呈现在不同的大脑区域,或者各个区域是否包含关于解码信号的独立信息。以前的一项研究通过测试解码是否可以通过组合两个区域的体素,来改善解决决策环境中的这个问题。在这个例子中,作者发现颞顶接合处(TPJ)包含了关于未来决策的独特信息(也就是说,将TPJ体素添加到另一个区域改善了解码),特别是决策是根据其他人做出的决定。
分类器中包含哪些体素的问题与底层信号的空间频率直接相关,以及分类器是否会推广到从不同对象获得的数据。例如,使用全脑蒙版(即mask)对左手按钮与右手按钮按下进行解码将利用相对均匀的大规模(低频)模式,该模式跨越两个半球的运动皮层。如果归一化足够准确,则该全脑模式可能会在参与者之间泛化,这样,经过训练对人A的左手响应与右手响应进行解码的分类器就可以成功地对人B的响应模式进行解码。可以预期会有类似的大规模模式通过对比与正值和负值结果相关的活动,这会在不同的大脑区域引发相对均一的活动变化,例如腹侧纹状体和腹侧前额叶皮层(vmPFC)为获胜,前扣带回皮层和岛突为失败。空间归一化算法的最新改进,例如基于CIFTI的图像格式,可能会进一步提高分类器在各个主题之间进行归一化的能力。
相比之下,解码视觉光栅的方向细微差异或两个预测奖赏的值,可能主要利用了局部和异构活动模式,这些模式不可能在不同领域推广。这种模式通常是在小的预定义的感兴趣区域内或使用基于探照灯(searchlight)的方法定义的。一般来说,神经元信号的空间频率可以决定从fMRI模式中解码这些信号的程度。实际上,直接从猕猴中对人脸刺激的解码与fMRI响应之间的直接比较表明,基于fMRI的解码很大程度取决于基础神经信号的空间频率。只有强聚集的响应为fMRI解码提供了可靠的基础,而弱聚集的信号很难从fMRI信号中恢复。
上述有偏差的采样模型主要旨在解决以高空间频率为局部模式编码的信息。然而,这并不意味着认知变量(如奖赏)只以局部和异质模式编码,也不意味着这些变量的解码方法不能应用于所有受试者。比如2015年常等人表明,当对不在训练样本中的受试者活动模式进行测试时,全脑分类器能够预测图像的情感内容。同样,2011年Clithero使用跨被试方法从基于局部探照灯(searchlight)的活动模式中解码不同类型的奖赏。这项研究发现,受试者内部和受试者之间的分类器倾向于识别不同的大脑区域,这表明,即使使用局部活动模式,这两种方法都利用了不同类型的信号,推测是在不同的空间频率下表示的。一般来说,跨被试解码可能依赖于整个低频模式,该模式由跨大脑区域而不是在大脑区域内部的信号变化驱动,而被试内分类器可能会利用区域内更微妙的高频信号。
可以凭经验探索编码信息的空间频率。例如,可以使用3D小波变换或带通滤波将活动模式分解为不同的空间频带。将分类器应用于分解后的信号可以揭示哪个空间比例对解码信号的贡献最大。另外,信息的空间尺度可以通过从解码模型转换为编码模型来解决。这提供了其他好处,例如能够提供大脑区域的完整功能说明,并能够以直接的方式推导出最佳解码模型。目前,还没有明确的奖赏编码模型,也没有系统的尝试来测试奖赏相关信息的编码空间尺度。

3.我们从解码奖赏信号中学到了什么?

通常,使用MVPA方法的奖赏研究已在很大程度上证实了单变量fMRI研究的先前结果。下一节重点介绍了使用MVPA方法回答与奖赏处理有关问题的一些研究,这些问题超出了传统单变量分析方法的已知范围和通常可以实现的范围。

3.1强化信号无处不在(Reinforcement signals)

使用MVPA解码奖赏信号的研究带来的最令人震惊的结果之一是发现有关奖赏反馈的信息(即强化信号)广泛分布在整个大脑中。在一项精心设计的研究中,使用简单的匹配小笔和剪刀石头布游戏来识别大脑区域,在该区域中,多体素活动模式区分了trial的获胜与失败。作者发现,关于比赛结果的信息几乎可以从所有皮质和皮质下区域解码。重要的是,与使用单变量方法进行分析相比,使用MVPA识别的大脑区域数量和空间范围明显更大。在执行强化学习任务的神经外科患者中使用颅内记录获得了类似的结果。在这里,大部分大脑区域的电极显示出对奖赏和惩罚的反应,而同一区域内的单个电极对相同结果显示出积极或消极的反应,这表明在区域内跨电极平均信号会稀释该信号。总之,这些发现说明了解码方法比单变量方法具有更高的敏感性:它们可以识别重叠的神经元群体用相反的编码方案编码同一事件的区域。

3.2奖赏预测性刺激的感觉和关联信息是可分离的

由于多变量方法的敏感性增强,因此将关联信息与预测刺激的感觉特征区分开来非常重要。例如,如果两种不同的视觉刺激预测小的和大的奖赏结果,我们如何知道(不需要预先假设这些信息在大脑中的什么位置出现)被训练来区分这些刺激的解码器是否使用关于预测值的信息,而不是刺激的视觉特征?分离关联信息和感知信号的一种方法是使用不同的刺激集,这些刺激集预测相同的奖赏结果,但具有正交或甚至反相关的感觉特征。一组刺激用于训练解码模型,另一组刺激用于测试其准确性。遵循这一逻辑,我们以前在巴甫洛夫学习任务(Pavlovian learning task)中使用彩色(绿色或红色)和旋转(逆时针或顺时针)点云作为奖赏预测刺激。顺时针旋转的红点和逆时针旋转的绿点预测小奖赏,而逆时针旋转的红点和顺时针旋转的绿点预测大奖赏(图2A)。为了直接将关联信息与感官信息进行比较,我们在绿色与红色的逆时针旋转点(预测小奖赏与大奖赏)上训练了基于探照灯(searchlight)的分类器,并在红色与绿色的顺时针旋转点(预测小奖赏与大奖赏)上进行了测试(图2B)。这种交叉分类过程在包括OFC和vmPFC在内的几个脑区实现了价值信息的偶然准确性(图2C)。相反,打乱测试数据集中的标签(不是值),以使感官特征(颜色或旋转方向)重叠在训练数据和测试数据中 (图2B,底部),从而在测试数据中获得了较高的偶然解码精度(视觉皮层)(图2C)。

图2.解码值与感官信息无关。

A.预测性刺激(彩色旋转点)与奖赏大小之间的关联。顺时针方向;逆时针方向。

B.分类器训练和测试解码值(顶部)和感官信息(底部)的示例。

C.使用探照灯(searchlight)解码方法来识别包含活动模式的大脑区域,这些活动模式具有关于预测奖赏值(黄色)和感官特征(蓝色)的重要信息。 dmPFC,背膜前额叶皮层; PC,楔前叶; VC,视觉皮层; vmPFC,腹膜前额叶皮层。该图经Kahnt等人的许可进行了修改。

分离关联信息和感官信息的另一种方法是通过测量受试者进行奖赏学习前后的刺激诱发反应。这提供了观察除了测试奖赏学习除施加关联信息外,是否还会改变感觉刺激信息的神经表示可能性。在最近的一项研究中,从两个感知类别(薄荷味和柑橘味)中选择了四种不同的气味作为奖赏预测性刺激。在每个感知类别的一个示例与奖励相关联之前和之后,测量气味诱发的fMRI活动,而另一对与无奖励相关联。我们发现关联学习不会改变OFC中刺激身份的表示,也不会改变嗅觉(即梨状piriform)皮层中感知类别的解码。相反,价值信息(独立于感官刺激信息)在vmPFC中作为关联学习的功能而出现。
如果您对任务态fMRI及脑影像数据处理感兴趣,欢迎浏览思影科技课程及服务(可添加微信号siyingyxf或18983979082进行咨询):

第七届任务态fMRI专题班(重庆,1.14-19)

第八届任务态功能磁共振数据处理班(南京,3.2-7)

第一届任务态功能磁共振提高班(南京,3.9-14)

目镜式功能磁共振刺激系统介绍

第三十七届磁共振脑影像基础班(重庆,1.23-28)

第二十届磁共振脑网络数据处理班(重庆,2月27-3月4日)

第十六届DTI数据处理班(重庆,3.5-10)

第十四届脑影像机器学习班(重庆,3.12-17)

第三十六届脑影像基础班(南京,2021.1.6-11)

第三十八届脑影像基础班(南京,2.23-28)

第十九届磁共振脑网络班(南京,1.18-23)

第十五届DTI数据处理班(南京,12.26-31)

第十一届磁共振脑影像结构班(南京,1.12-17)

思影科技功能磁共振(fMRI)数据处理业务
思影科技弥散加权成像(DWI/dMRI)数据处理
思影科技脑结构磁共振成像数据处理业务(T1)
思影科技啮齿类动物(大小鼠)神经影像数据处理业务
思影数据处理业务三:ASL数据处理
思影科技脑影像机器学习数据处理业务介绍

3.3价值和显著性的表征重叠

价值和显著性是描述激励刺激的关键特征。价值随着奖赏的幅度和概率而增加,随着惩罚的幅度和概率而减少(1A)。相比之下,显著性随着奖赏和惩罚的幅度和概率的增加而增加。因此,如果在给定的实验中只使用奖赏或惩罚,价值和显著性是完全()相关的,这表明与价值相关的神经信号可能类似地与显著性相关,反之亦然。如果对价值和显著性的神经反应是异质的,使得不同神经元群体的活性随着价值的增加而增加和减少,这一点尤其重要(图1C)。为了分离价值和显著性的神经表征,我们使用了一个包含大小奖惩的巴甫洛夫任务(Pavlovian task)。 OFC和上顶叶皮层的fMRI活动模式与价值相关。相反,显著性与前扣带皮层和下顶叶皮层的活动模式相关,延伸到TPJ。然而,显著性信号也出现在顶叶皮层更高的区域,与该区域的价值信号重叠。这些结果表明,价值和显著性可以由同一大脑区域内的异质神经元群体编码,强调了实验分离两个变量和使用多变量方法分析这些数据的重要性。
上面描述的实验设计使我们能够分离出经常混淆的另一对变量:价值和效价。效价是指愉悦(积极)和厌恶(消极)结果之间的绝对差异,而价值是指积极或消极结果之间的逐渐差异,它与结果的大小或概率成比例(图1A)。由于奖赏和惩罚在效价和价值上都不同,因此比较积极和消极结果(例如胜利和失败)的研究在这两个变量之间崩溃了。通过在大型处罚与小型处罚之间训练基于价值的分类器,并在小型奖赏与大型奖赏所引发的响应模式上对其进行测试,我们表明,OFC信号不仅受价值驱动,而且在一个通用的神经尺度上编码奖赏和惩罚的渐进值。这一发现与灵长类动物的记录研究相吻合,灵长类动物的研究表明,OFC中的单个神经元在相同的范围内编码奖赏和惩罚。它还扩展了先前的单变量fMRI研究结果,表明在OFC中编码奖赏的正值和惩罚的负值的体素重叠。

3.4奖赏期望(Reward expectation)重新激活结果模式

OFC可以说是处理奖赏的关键皮层区域,对奖赏的传递和可靠预测结果的事件做出反应。与此相一致,许多MVPA研究已经从OFC和相邻vmPFC的活动模式中解码出与价值相关的信息。但是,这没有解决OFC编码奖赏期望的机制,以及预测信号如何与实际结果相关联。使用上面描述的巴甫洛夫式学习任务(Pavlovian learning task)(图2),我们先前已经证明相似的活动模式可以编码预期和经验结果价值。我们对分类器进行了训练,该分类器分别训练与预期奖励结果大小相对应的活动模式,在对应于小结果或大结果的活动模式进行了测试。交叉分类的准确性显着高于OFC中的偶然性,这表明预测事件导致OFC中实际结果的重新激活(或神经模拟)。这种预期的重新激活可用于评估预期结果并促进决策。此外,神经模式相似性与学习的行为量度相关,表明预测事件和结果之间的模式相似性可以作为关联学习的神经标记。后续实验表明,这种OFC模式相似性是在学习过程中出现的。这些发现与OFC在工作记忆中保持与奖赏有关的信息提议相兼容,以实现灵活的更新并确保重要的结果获得行为优先。最近的一项灵长类动物电生理学研究证实了这些想法,表明OFC神经元维持从选择到奖赏传递的奖赏信息。

4.解码奖赏的当前主题(Current topics in decoding reward)

本节的研究重点在于MVPA方法潜在地提出有关奖赏表征性质的更详细问题。具体来说,它回顾了一些研究,这些研究使用MVPA来展示奖赏信号如何采取通用价值的形式,以及这些一般价值信号如何与高度特定的奖赏表征形成对比,这些奖赏表征同时编码与价值不一定相关的预期结果中的多个特征。

4.1解码一般的奖赏信号

决策(神经经济学)在神经科学研究的中心思想是,可以在一个通用价值尺度(common value scale)上比较不同的选择方案。该信号被认为在vmPFC和相邻的OFC中表示。多项单变量fMRI研究表明,在该区域,重叠体素中的fMRI信号与不同奖赏的价值相关。但是,不同奖赏的重叠反应(如通过组级联结分析确定的)可能由不同受试者的反应或同一受试者内的反应驱动,这些反应源自空间重叠但独特且分散的神经元种群,这些种群独特地编码了价值的每种刺激。因此,单变量fMRI的结果尚不清楚,如通用价值假设(common currency hypothesis)所假设的,相同的活动模式是否与不同奖励的价值相关。
MVPA技术特别适用于测试给定区域是否对不同变量进行编码,这些区域使用相似或截然不同的编码模式但在空间上重叠。具体来说,被试内交叉分类提供了一种方式来解决这个问题以及与常见编码机制相关的类似问题。在这个框架中,分类器根据一个奖赏的价值进行训练,然后根据不同奖赏的价值进行测试。显著的解码准确性表明不同奖赏的价值由重叠的活动模式表示。近年来,MVPA的几项研究使用了这种方法的不同版本,以测试vmPFC中通用价值尺度的想法。例如,2013年McNamee等人展示了一系列不同产品的照片,这些产品来自三个奖赏类别(食物、金钱和非消耗性物品),而被试正在投标购买这些物品(图3ab)。这些出价用于将每个类别中的项目分成主观价值高和低的组。对一个分类器进行了高价值和低价值项目类别的活动模式训练,并在另一类别中对高价值和低价值项目进行了测试。在vmPFC中使用通用价值信号的想法,在该区域发现了重要的跨类别价值解码(图3C)。多项研究使用不同的奖赏类别在内侧PFC中复制了类别无关的价值信号,以及类似的方法已经被用来表明感知和推断的情绪状态在这一领域具有共同的表征。这些研究的共同点是,它们在一个类别中使用具有不同主观价值水平的不同奖赏身份(different reward identities),以定义价值编码活动模式。然后在来自不同类别的一组单独奖赏身份上测试该模式,为与类别无关的价值编码提供证据(category-independent value codes)。
图3.解码与类别无关的奖赏信号。
A.实验任务的示意图。被试有80%的机会获得来自三个奖赏类别(食物,金钱和小饰品)的刺激,并以0到4欧元之间的整数支付意愿(WTP)进行响应。对于多变量分析,在每个试验的投标时间点提取神经数据样本(以5 s的偏移量考虑血液动力学延迟)
B.每个奖赏类别的WTP投标分布。 C.矢状视图显示了vmPFC中多变量类别独立的值表示。BOLD,血氧水平; vmPFC,腹内侧前额叶皮层。该图经McNamee等人的许可进行了修改。
一个密切相关的问题是vmPFC是否代表独立于奖赏身份(而非类别)的奖赏价值。为了测试这一点,价值编码模式必须基于同一奖赏身份中的不同价值级别进行定义,然后在不同奖赏身份中的不同价值级别上进行测试。为了测试奖赏身份中定义的共同价值代码,我们使用了具有两种不同但同样令人愉快的食物气味(例如巧克力蛋糕和比萨)作为奖赏结果。食物的气味是有力的奖赏,在一定范围内,气味的价值(令人愉悦)可以通过改变气味的浓度来调节。因此,我们构建了每种气味的高值和低值版本,从而产生了两因素设计:奖赏值x奖赏同一性(图4AB)。四种选择的食物气味用作无条件刺激(US),并与视觉条件刺激相关(CS,图4C)。在观察CS和US之间配对的同时对受试者进行了扫描。为了测试通用值代码,我们训练了一个分类器,该分类器基于预测一种食物气味的高值和低值版本(例如巧克力蛋糕),并测试分类器预测第二种食物气味的高值与低值版本(例如披萨)。这种关联值的交叉解码只有在vmPFC中才有可能,表明该区域代表了通用尺度上不同预期回报的价值。
用于检查神经编码及相关问题的一类特别有用的方法是表征相似性分析(RSA)。这些方法将在fMRI活动模式方面将一组刺激的相似性结构与同一刺激组在感知(或动机)空间中的相似性结构进行比较。RSA类型的分析在研究高级视觉区域中的对象编码方面已经非常富有成效,并且最近被应用于研究奖赏处理。

4.2解码特定的奖赏信号

除了代表一般价值信号外,还可以在一个通用范围内比较不同结果,大脑需要获得特定奖励结果的价值表示。根据生物体或环境状态的变化,这些信号对于计算和独立更新不同结果的值是必不可少的。这样,特定于结果的奖赏表示对于目标导向的行为至关重要,并且可以为上述一般价值信号的计算建立基础。
通过使用前一节中描述的实验,我们测试了这种特定身份的奖赏价值表征(图4)。我们训练了一个分类器来区分由刺激诱发的价值相关活动模式 [高价对低价巧克力蛋糕]对[高价对低价披萨],图4DE)。对应于这两个奖赏身份的价值相关活动模式可以在外侧OFC中可靠地分离(图4F),这表明在该区域中,单独的神经元群体可以代表不同预期结果的价值。这些结果补充了早期工作的发现,表明奖赏类别相关值在横向/中央OFC中表示,而平行报告则在后OFC中表示预测的奖赏身份。啮齿动物和灵长类OFC中充分记录了奖赏身份和身份特定值的编码,补充了OFC中病变的证据会损害能力,并基于特定的结果身份做出选择。在灵长类纹状体中也发现了类似的特定奖赏信号,在这些信号中,单独的神经元群体对社交和流体性奖赏做出了响应。然而,如第2节所述,使用MVPA研究尚未在人的纹状体中报道特定于结果的反应,这可能与MVPA对以非常高的空间频率编码的信息相对不敏感有关。
关联信息的编码不仅可以特定于结果值和身份,还可以包含特定刺激--结果对的唯一编码。也就是说,刺激--结果关联涉及相同的结果同一性,但不同的预测刺激可以由独特的活动模式来表示。为了验证这个想法,2013年克莱恩-弗吕格使用fMRI进行适应性和比较试验,其中预测特定结果的特定刺激之前是相同刺激,或者是预测相同或不同奖赏身份的不同刺激。使用这种方法,作者证明了侧/中央OFC编码特定的刺激--结果关联,这样奖赏身份表征与他们特定的预测刺激联系在一起。尽管fMRI自适应是在逐个体素的基础上进行的,因此不被认为是一种“多变量”方法,但这种技术能够分析异质和分布式信号,类似于MVPA。
类似地,刺激结果表示可能是特定的,因此包含有关必须执行以获得特定奖赏的特定操作,响应或任务的信息。实际上,MVPA研究已经确定了由vmPFC和纹状体中的奖赏预测性刺激引起的这种特定于反应的信号。此外,其他研究发现了奖赏相关区域的特定行为价值信号,并且顶叶皮层中的奖赏信号已经被证明是特定于受试者为了获得奖赏而必须执行的任务的。此外,其他研究发现了奖赏相关区域的特定行为价值信号,并且顶叶皮层中的奖赏信号已经被证明是特定于受试者为了获得奖赏而必须执行的任务的。这些结果与早期在啮齿动物纹状体中发现的特定刺激--反应和反应--结果关联相似,以及发现纹状体中的奖赏预测误差信号对特定动作是特定的。
总之,上述研究表明,奖赏信息的神经编码不限于价值,而是包含了关于预期结果的身份、预测刺激或获得奖赏所需行动的特定信息。这与奖赏编码区(如OFC)的活动模式编码了许多特征的想法是一致的,这些特征共同构成了任务环境的认知图。在单个区域内,这种多重奖赏相关信息很可能以分布式方式编码,这突出了能够测试分布式信息的多变量成像方法的需求。未来的研究应该揭示描述奖赏预测的额外特征和变量。这将是特别真实的,因为该领域超越了使用金钱和奖赏的图片,而是开始结合更具生物学意义的奖赏形式,应用于更自然的环境中。
图4.解码特定于结果的奖赏信号。
A.涉及两种强度不同的食物气味(例如巧克力蛋糕和比萨饼)的任务设计示意图。
B.香气等级在高强度和低强度版本的气味之间有所不同,但在气味标识之间没有差异。
C.每种气味都与两个视觉刺激有关。
D.使用探照灯searchlight方法,将刺激诱发的活动模式在每个气味和刺激集中的高强度和低强度版本之间进行对比,从而得出与结果相关的价值活动模式。
E.对支持向量机进行训练,使其在与值I相关的两种气味的相关价值活动模式之间分离,然后对值II的数据进行测试。
F.与两个气味结果相对应的与价值相关的活动模式是可分离的大脑区域。 OFC,眶额皮质; HIP,海马体。该图经霍华德等人许可修改。(2015)。
总结:
多变量解码技术提供了新颖且令人兴奋的方式来分析fMRI数据,并且它们大大扩展了可以解决问题的范围。人类奖赏学习和决策的研究得益于这一进步。使用MVPA方法进行奖赏研究的主要收获是,在大脑的许多区域,奖赏信息的编码不仅限于价值。具体而言,奖赏预测信号,尤其是在前额叶皮层中,包含有关(原则上)无价值特征的信息,例如结果的身份,所需的动作,以及可能有更多的信息,例如奖赏传递的空间,程序和时间方面。这种编码的复杂性凸显了使用具有表征性方法来分析fMRI数据的重要性,这些方法独特地能够访问这些信号。此外,将表征性方法与计算模型相结合得出有关计算过程的预测,将使我们能够解码瞬时变化的变量,例如多元误差信号,置信度估计以及学习期间值编码的变化。此外,MVPA方法的进步可用于探索信息处理的更多动态方面,例如,通过检查基于模式的功能连接性,解码可以基于功能连接图,并且解码后的信号可以随时间在大脑区域之间关联。 MVPA方法的进一步发展将扩大可解决的问题范围,并提高研究人类奖赏过程时可达到的细节水平。
与感觉和运动皮层进行MVPA研究相反,前额叶皮层中的平均解码准确度通常仅比概率高百分之几。这就提出了一个问题,即这些基于模式的信号虽然有意义,但在多大程度上有意义。解码精度表明信息的下限,其大小受许多因素的影响,包括训练数据的数量和额叶皮层部分信噪比通常较低。此外,在神经元水平上,额叶皮层的认知表现通常可能弱于脑后部的感觉信号。使用交叉分类进一步降低了解码的准确性,因为只有采集的一半fMRI数据可以用于训练,并且由于不同刺激引起的相同表示在大脑中的编码可能有所不同。由于这些原因,准确度,尤其是额叶皮质的认知信号,不应被视为“可预测性”的量度,而应主要作为某种信号存在的证据。
将动物电生理学与人类神经影像学研究之间的发现联系起来对于神经科学研究至关重要。多变量成像方法使我们能够检查与奖赏相关的信息,这些信息编码在神经元集合的分布式活动中。使用7 T扫描仪提高神经影像数据的空间分辨率将进一步增加MVPA可访问的空间频率范围。这使人类可获得的精确度接近于单个unit研究的精确度,从而有助于缩小动物模型和人类研究之间的差距。这种联系对于临床研究特别重要,因为它有助于将动物疾病模型的发现转化为人类患者群体。反过来,从人类研究中获得的其他或意料之外的发现可能会为动物研究提供信息,这些动物研究可以用来回答有关突触和细胞机制的更多机制问题。
使用表征性方法分析来自适当控制实验的fMRI数据,可能会继续推进我们支持对奖赏相关行为和学习的神经系统理解。特别是,通过提高MVPA的精确度,我们可能能够在临床领域缩小动物模型和人类研究之间的差距,测试更详细的假设并产生新的假设,以促进更好地理解神经精神障碍和开发新的治疗策略。
(0)

相关推荐