Nature neuroscience:如何提高EEG/MEG研究可重复性

人脑成像组织(The Organization for Human Brain Mapping,OHBM)一直积极倡导实例化神经成像数据采集、分析、报告、共享数据和分析代码,以实现科学问题的可重复性。关于这个问题,作者在这篇文章里总结了OHBM对于脑磁图(MEG)和脑电(EEG)的建议。讨论了指导方针的理论基础,包含了许多领域内正在积极讨论的问题。强调了未来如何最大限度地共享和利用EEG和MEG数据的机遇和挑战,还讨论了这部指南要如何发展才能不断满足神经生理学的新需求。本文发表在Nature neuroscience杂志。可添加微信号siyingyxf18983979082获取原文)
OHBM COBIDAS MEEG报告
神经成像界和其它领域一样一直致力于提高科学发现的可重现率。而OHBM组织则一直通过数据分析共享的方式与其它组织达成共识。并在此基础上制定了COBIDAS报告(Committees on Best Practices in Data Analysis and Sharing :https://www.humanbrainmapping.org/i4a/pages/index.cfm?pageid=3728),提出了标准科学语言促进数据和分析方法的有效共享。这个报告对于以下四类人群非常有用:
(i)准备发文章的研究人员
(ii)编辑和审稿人
(iii)神经影像方向的老师们
(iv)对某个神经成像技术精通而想要了解其它方向的研究者
在此,作者重点在COBIDAS MEEG报告里面强调一些主要问题和建议。以更好地了解参数、设计和分析对于研究的再现性的影响。其它很多问题也能在这里找到解答。(见框1和2,以及表格1到3)。这些建议都代表了确保MEG和EEG(MEEG)研究可重复性的报告的最低要求,而报告的完整细节可以在COBIDAS中查找。这些建议部分是存在争议的。术语上经过大量的讨论以求形成共识便于更好地数据共享。并且遵循了国际临床神经生理学联合会制定的临床指南的命名,以求结合研究与实践,具有非常高的实践价值。因为没有一个放之四海而皆准的最佳分析流程或者最佳统计方法,最好的办法就是详尽地报告分析与统计过程以提供重现的可能性。
MEEG社区一直是积极主动提出好的做法与报告,出版指南也是由来已久并经多次修订。很多指南里面的建议在MEEG软硬件和方法日新月异的今天依然非常有参考价值。OHBM COBIDAS MEEG报告在遵循有效传统的基础上也在三个方面与以往的指导方针有所不同。
首先,它将重点放在特别有助于重现性和数据共享的实践上;
其次,COBIDAS作者强烈建议读者在准备科学材料的时候参考文档3。21世纪的脑电类文献呈现爆炸式的增长(图1a)。动态的指导方针很重要,因为采集和分析方法已经有了许多更新,新技术的实施也需要在保持一套连贯的建议的同时进行整合。例如,便携式脑电图设备、在室温下工作的便携式脑磁图设备和脑-计算机接口这些新兴技术尚未被考虑(图1b和图1c)。随着它们变得更加广泛地使用,使用它们的最佳实践规范才会进一步开发。指南也没有考虑有悠久历史的侵入式电极。
第三,COBIDAS MEEG指南的目标人群比以前的指南要广泛和多得多,不像以前的指南传统上是针对于某种特定成像模式(EEG或MEG)、特定分析方法(事件相关电位(ERP)、频谱、来源等)或特定的实践(研究或临床)。
图1. MEEG新兴研究领域文献总数综述
(A) 不同年份EEG和MEG文献数量(B)新兴EEG研究的文献数目(C)新兴MEG研究文献数

术语和报告建议

为了促进可重复性,必须有一套通用的术语。有些术语在不同的成像中用法可能略有不同。描述任务参数和数据采集的术语被列举在框1中。作者建议脑电研究人员使用“run”而非“block”,”run”在MEEG中可以互换使用,而在PET和MRI中显然不同。此外,作者还建议文章里面应该明确报告数据的处理是在传感器处理还在源位置处理。这非常重要,因为某些分析方法可能不适合在传感器空间中使用。虽然在文献中已经报告了其他数据空间,例如独立分量空间,但是这些仅仅是这里提到的更一般类别的数学子空间。
还有一个特定的MEEG术语来描述基于MRI的研究中不存在的数据中的特征。作者建议遵守IFCN准则,遵循惯例和通用命名(方框2)。
(编者注:IFCN准则:为了建立一个真实可靠的大环境,国际事实核查联盟(IFCN)在2016年制定了一些守则进行推广,比如:承诺遵守非党派性和公平原则,也就是要核查各方意见;承诺确保信息来源标准和透明化。核查人员必须提供证据;承诺资金和组织透明化。公众应该知道项目负责人是谁、资金来自何处;承诺确保查证方法标准和透明化。事实是如何核实的,应该明确清楚;承诺公开、诚实地纠正错误。https://www.ifcncodeofprinciples.poynter.org/)
作者建议在报告EEG结果的时候还要遵守以下守则以避免混淆:
(i)报告传感器空间中的诱发电位数据,应注意报告记录点 (例如,头顶N100),因为响应极性可随原始或后自组织头皮参考电极和底层皮质而变化;
ii)应当明确提到用来衡量事件相关的成分时用的潜伏期窗口。作者还主张在做自发电位或者静息态EEG的报告,尤其是频谱分析,要报告不同频段的边界值。因为文献中可能会存在指定频段不一致而引起的混淆(例如有部分学者定义alpha频段为8-13Hz,而另外一部分学者将alpha频段定义为8-12Hz。指南中作者参考的是IFCN描述典型脑电频段的指南定义的频段,这样也能保持与临床研究一致。也就是说,由于文献不一致,作者对对α和β范围之间的转换进行了轻微的调整,以便指导时频分析的结果描述。
哪些基本的数据采集参数和实验设计属性是必须被报告的?
一些研究人员在报告发现和共享数据的时候,常常会忽略掉相当多的重要参数,这给重现和复制科研结果带来很大的障碍。为了改善这种现象,COBIDAS MEEG报告3里面包含了这些重要参数的附录。表格1提供了一些实验范例、被试和测量的行为基本描述的要点。而这些参数经常会在一些年轻人研究者的手稿里面被忽视,作者在接下来的篇幅里面谈到了这些参数的忽视会给科研结果的复制和元分析带来持续的问题。
问题1:基本硬件,软件和采集参数
许多已发表的论文忽略了基本的数据采集细节:采集系统类型、传感器数量及其空间布局,以及采集类型:连续VS分段、采样率和模拟滤波器带宽(低通和高通)。尤其是后者最常被省略,然而在数据采集期间,所有MEEG记录系统都使用过滤电路(潜在地作为对用户来说不总是显而易见的默认值),其固有地限制了测量的内容。可能存在由呼吸或皮肤电导响应引起的低频伪影,而在较高频段,如果其他伪影没有被过滤掉(因此采样不足),则它们可能会被混叠。相反,在数据采集时不适当地应用滤波器设置可能会无意中过滤掉EEG中感兴趣的效果。如果未报告过滤器特性,则无法评估这些可能性。
问题2:参考电极和阻抗
EEG实质上是测量相对于参考电极的微分电压。接地电极用作减少EEG中的非共模信号(例如,线噪声或电刺激伪影)的方式。因此,必须始终报告参考电极和接地电极的位置。
需要注意的是不建议在数据采集的过程中采用手动连接的耳垂或者乳突电极,因为它们不是中性电极,有可能会导致数据失真,从而让重建头模变得困难。这没办法在后期的重参考和数据分析中进行纠正。此外也要求在记录过程中各电极点的数据质量是要求统一的,所以需要报告无源电极点(passive electrode)的阻抗值(对于有源电极点/ active electrode,这并非是必须的)。最佳的电极阻抗随放大器输入阻抗变化,可以更好地减少噪声的影响。因此要记录实验中的阻抗值(包括测量的平均值和上限在不同时间段上的表现,包括开始、中间和结束),并提供相应脑电系统厂家提供的可接受电极阻抗,这样可以方便读者对数据质量作出自己的判断。
问题3:统计效力
如果采用的方法是零假设检验,作者建议是报告一个先验的统计效力值。然而,在EEG和MEG实验中,确定检测到效应的概率是一个困难的问题,因为它依赖于试次数量和被试数之间的复杂平衡,与实验设计也有关(在参与者23内和参与者之间),取决于所选择的统计方法和感兴趣的MEEG特征,包括它们的位置、方向和与传感器的距离。因此作者建议先定义感兴趣的指标,然后再估计最小效应(minimal effect size)来确定效应量。最小效应是与给定假设相关的最小效应值。研究者应当使用来自独立数据、现有文献以及预实验数据来评估Effect size。后者(预实验数据)不应该为最终样本的一部分。在没有电生理数据的时候可以用行为数据作为所需样本大小的最小估计。同时作者还指出了,在任何情况下,如果样本量较小,计算效果大小和统计效应都有较大的可能出现错误(比如在预实验数据中)。这是因为:(i)许多神经数据(如MEEG)的effect size比行为反应时要小;(ii)一些试次和分段被人为拒绝掉了,减少了可用于统计分析的试次和分段的数目,因此对需要多少试次和被试才能获得应用的效应值施加了下限。因此,传统的做法是尽可能多的增加试次和被试数目。
图2.标准MEEG预处理步骤

如果您对脑电数据处理感兴趣,欢迎浏览思影科技课程及服务可添加微信号siyingyxf18983979082详细了解)

第一届MNE-Python脑电班(南京,12.7-12)
第二十二届脑电数据处理中级班(南京,11.12-17)
第七届脑电信号数据处理提高班(南京,11.18-23)
第十届脑电数据处理入门班(南京,12.1-6)

第二十三届脑电数据处理中级班(重庆,12.16-21)

第十一届脑电数据处理入门班(重庆,1.7-12)

第八届脑电信号数据处理提高班(重庆,1.30-2.4)

第十届近红外脑功能数据处理班(重庆,12.23-28)

思影科技EEG/ERP数据处理业务
思影科技脑电机器学习数据处理业务
BIOSEMI脑电系统介绍
MEEG数据预处理的关键注意事项
作者把对于数据的任何操作和转换都定义为预处理。预处理的顺序会会同时影响到数据的定性属性(如信噪比)和定量属性(如偏移量和频谱信息)(见表2)。数据分析中的参数和算法越复杂,越是需要提供计算中的详细信息,因为任何微小的改变都是有可能导致输出结果的巨大差异的。图2是一个典型的预处理工作流程图,其中每一步的具体建议都可以参考COBIDAS报告。对于特定的分析,处理顺序可能会与图2有所不同,作者在文中建议研究者清楚地说明自己的分析顺序。
MEEG数据处理的关键问题。作者将数据分析过程(区别于预处理)定义为不改变数据的统计和建模过程。应当在多种方法中选择最能解决科学问题的方法,并且提供选择这种分析方法的理由。作者在文中简要提供了COBIDAS MEEG报告中讨论的相关问题。
基于ROI的分析。在MEEG文献中通常会基于特定的电极点或者源层面的ROI(Region-of-interest,感兴趣区)在组间或者条件间(或者两者之间)进行统计分析。这样会产生估计偏差,所以作者提倡要通过前人的文献和结果,得出一个预测作为先验推测,然后进行验证。
源建模
源建模和重建是必须完整报告预处理流程(见图3)。源重建的目的是解释观察到的空间脑电图数据的时空模式。这就是所谓的求逆向解问题,并且解并不惟一。解决此类问题依赖于一定的假设,其中两个重要的假设分别是头部容积传导源建模本身。而这两者都会影响结果的准确性和可靠性,因此必须同时完全地报告建模时采用的正演模型、源模型以及使用的参数和相应的软件。重建的质量也至关重要。而对于脑磁图和脑电图,至少要描述所选方法的预期精度、误差和稳健性。针对导联较少的情况,重采样可以提供更多的信息,但是利用较少导联的数据(少于128导)进行重建时要合理重建,并且谨慎解释。不同的源建模方式对特定的应用场景是有益的,因此报告所采用的源重建模型相当重要。
图 3源建模方法的图解
大样本建模统计.在近期的研究中出现越来越多的在被试与组层面上,对于整个数据量在三维空间上进行分层的混合建模分析,这种方式的分析变得越来越常见,而以前的指导方针并未提及。与tomographic成像不同的是,MEEG在处理的过程中会丢弃数据(坏的导联或者坏段),而报告如何丢弃数据非常重要。在进行多次比较时需要进行多重比较校验。使用随机场理论时,要注意数据的平滑性。使用后验的阈值可以更加好的控制family-wise的1型错误。
编者注:随机场(Random field)定义如下:在概率论中, 由样本空间Ω = {0, 1, …, G − 1}n取样构成的随机变量Xi所组成的S = {X1, …, Xn}。若对所有的ω∈Ω下式均成立,则称π为一个随机场。π(ω) > 0 一些已有的随机场如:马尔可夫随机场(MRF), 吉布斯随机场 (GRF), 条件随机场 (CRF), 和高斯随机场
多元统计推断.多元统计(例如多元方差,线性差别)通常需要在时间与空间或者频段上进行多次比较,这会伴随着多重比较的问题。多次比较时没有进行适当的矫正依然是此类数据分析容易出现的遗漏。
多元模式分布.多元模式译码为了规避“过拟合”的现象,通常会使用嵌套交叉验证的方式,即:对独立的数据子集估计参数,进行分类然后评估性能。这个过程中的数据的分割合理性非常重要,有些方法可能会出现严重的偏差估计。
连通分析.术语“connectivity(连接)”是一个可以指代多少方法的总括性术语,因而在文献中可能会存在混淆。而在MEEG中往往指检测两个通道或者两个源层面的耦合。作者建议学者们应当明确说明计算的是功能连接/结构连接抑或是有向连接/无向连接并且详细阐述自己所使用的方法(比如格兰杰因果,局部相关和或者DCM)
编者注:关于DCM模型(dynamic causal modelling,动态因果模型)的知识,可以参见思影的另外一篇文献解读(直接点击即可浏览):

电生理源成像:脑动力学的无创窗口

表3列出了关于连接分析的不同方法及其所需的重要参数,由于这些参数对结果的输出影响巨大,报告这些参数非常重要。连接的分析是在头表还是在源层面(例如,相关,相位耦合,振幅耦合,相干,熵,DCM以及格兰杰因果),分析前的假设等都需要详细报告。而对于基于交叉频率耦合(cross-frequency coupling  CFC的分析,则需要明确说明耦合类型。
此外,对于通过MEG和EEG测量连通性的可靠性和有效性,作者的观点是:虽然依赖统计的可以在通道层面进行计算(这对于生物标记物非常有用),但是这些不是真正的神经连接,不能由此推因果,神经上的连接只能在考虑了容积传导效应的前提下,通过精确或者假设精确的生物建模获得。
结果报告和展示
作者在这部分介绍结果展示时了一些更加容易被忽略的问题
问题1、图表.描述神经生理学波形的图中,对数据属性要有变异值(例如,置信区间),同时要有清晰的标度。而对于MEEG,由于其是以地形为特征的,作者建议显示所有的通道和频谱。
问题2、在频段名称前使用生命周期前缀(如婴儿alpha波).术语使用的不一致而影响特定皮层节律判断的存在巨大的歧义和混淆。例如有名的前额alpha波在闭眼时增强,而在睁眼时会大大减弱,它还会随着人的发育和年龄而改变峰值频率:婴儿(3-4月龄)—4Hz;12月龄—6Hz;36月龄—8Hz,而在6-12岁以后到达成年人的10Hz,并且在57岁后随着年龄的增长而降低。因此指定频段和分布及其反应在研究老化中非常重要。为了减少混淆,应当避免使用“baby alpha(婴儿alpha波)”这种说法。目前大量文献中存在着这种使用一个频段名不同频段的问题,给元分析提高了难度。
问题3、不准确的统计分析.对于组间和条件间的差异,必须报告统计值(如:f值、t值、贝叶斯因子)。报告模型假设(如线性模型中的残差和高斯分布)及效应量(科恩D,百分比)。报告可解释的模型方差和数据拟合度以及从模型中导出的参数也非常有用。对于预测模型,可以报告精度,r方和RMSE(root-mean-square error,均方根误差),还有机会水平。进行二分类的时候还应当报告ROC曲线下面积。不管结果是否显著,都要报告使用的模型和预期的结果,以便读者进行评估。也方便与类似的研究进行比较和复现。
COBIDAS的演变,数据共享与脑影像研究的未来
遵循COBIDAS提出的标准可以有效地提高数据分析的有效性和可重复性,而随着MEEG分析方法越来越复杂,越来越多的方法细节需要被报道。COBIDAS也会随需求不断被更新。
作者鼓励MEEG研究群体能够分享自己的原始数据和分析的脚本,这将利于结果的重现和复制,从而促进研究和培训的开展。当然,这必须要在征得被试同意的前提下进行。
结论
第一份COBIDAS MEEG报告是在神经影像界长期广泛的协作和咨询下完成的。作者始终致力于数据收集、分析和共享,以提高科学的可重复性和可复制性。这些准则不仅是为准备手稿而制定的,而且也为从事编辑和审查工作的科学家以及为未来科学家的教育和研究培训而制定的。就像COBIDAS MRI报告一样,作者将COBIDAS MEEG报告视为一个好的标准,是为了跟上该领域不断变化的研究方法发展的步伐。OHBM将继续努力定义脑成像的最佳实践准则,并欢迎所有人参与和贡献这一努力。对于众多初入脑电、脑磁图的研究者们,研究这份报告标准将非常有利于提高他们的实验严谨性和研究结果的可信度。
(0)

相关推荐