空间独立成分分析(ICA)已被证明是将fMRI数据盲源分离为3D空间脑图和1D时间进程的有力工具。在单个被试水平上,ICA越来越多地被用于伪迹去除,因为它能够将神经相关信号从不同的噪声源中分离出来。虽然fMRI数据同时包含结构化噪声和随机噪声,但在基于ICA的去噪环境中,噪声仅指结构化噪声,因为ICA分解的目的是将数据分解为非高斯源。因此,噪声成分(N-IC)被定义为表征噪声/伪迹效应的成分(时间序列和相关联的空间脑图)。无论是ICA还是任何其他线性分解技术,都要求结构化噪声可以用线性方式来描述。虽然这看起来可能是一个重要的限制,但事实是,即使是非线性效应也可以近似地由线性效应的叠加来描述。ICA分解中表示的信息用于检测N-IC(噪声成分),并以各种可能的方式减少伪迹对分析的负面影响:(i)使用来自空间脑图的信息从进一步分析中移除某些体素;(ii)使用来自时间序列的信息来识别需要注意的某些时间点(例如,在图像丢失的情况下,可以将受影响的扫描排除在进一步分析之外,或者可以将时间点的强度值调整为体积的平均强度);(iii)从原始数据中回归出与N-ICs相关的时间进程(将空间脑图与其相关的时间序列相结合,以形成对数据中噪声的估计,并从原始数据中减去它)。(iv)重建S-IC(信号成分)的数据(将空间脑图与其相关的时间序列结合起来,并将其相加)。在后两种方法之间,从数据中回归噪声是更佳的方法,因为与重建方法不同,它不对感兴趣的信号做任何假设,因此可以与 “零假设”检验相结合,例如经典的GLM分析。这种方法还允许后续识别数据中的较弱的成分,这些成分位于用于单数据集ICA分解的数据的随机部分,但可以从组水平ICA中识别。在所采用的去噪方法下将成分独立出来,最大的挑战是N-IC的识别。利用信号成分(S-IC)和噪声成分(N-IC)在空间、时间和(时间)频谱特征等方面不同的特征,目前已经提出了几种方法来实现这一目的。例如,一些方法使用任务范式时间信息对IC进行分类。然而,这种方法只能在样本和IC时间进程之间几乎没有时间序列相关性的情况下才能正确地对噪声成分进行分类。因此,在IC成分中捕捉到刺激相关的头部运动效应是具有挑战性的。在没有关于感兴趣信号的先验信息的静息状态fMRI(rfMRI)数据中,基于ICA的降噪方法特别有用。Thomas等人提出了一种在单回波数据上使用ICA降噪的方法,这种方法使用检查时间序列的傅里叶分解的无监督算法来识别(随机或结构化)噪声成分。Perlbarg等人使用人工定义的感兴趣区(ROI)来定义fMRI数据中结构化噪声的典型时间进程,这些时间进程被用作BOLD信号的回归变量,而Rummel等人提出了一种全自动的基于时间进程的滤波程序来检测ICA中的伪迹。Kundu等人提出的多回波法根据TE-依赖将与运动、心脏跳动和其他滋扰效应相关的BOLD功能网络成分与非BOLD功能网络成分区分开来。这是一种稳健的方法,但该技术需要多回波采集序列,并且不能应用于典型的常规单回波fMRI数据。此外,多回波fMRI数据目前可实现的空间和时间分辨率也存在局限性,因为对于给定的TR,提高分辨率会与信噪比之间存在一定的矛盾。相反,其他方法主要依赖于空间信息。Calhoun等人使用脑图谱来帮助IC分类,而Sui等人使用纯空间标准对从不包含时域信息的系数约束ICA获得的IC进行自动分类。在利用空间和时间信息的方法中,一些方法侧重于特定类别的伪迹。例如,Perlbarg等人和Beall 等人提出的方法专注于识别生理噪声(心脏和呼吸波动)。前者(CORSICA)使用空间和时间模式将IC分类为噪声和信号,而后者使用时间ICA从rfMRI数据中对这些波动进行估计,并生成适用于其他静止状态数据的空间权重矩阵。由Pruim等人开发的ICA-AROMA侧重于使用四个空间和时间特征来识别和移除由于头部运动引起的伪迹。从互补的角度来看,Storti等人利用空间和时间信息,目的是识别信号成分(RSNs),而不是伪迹。最后,另一套方法旨在识别和移除更广泛的伪迹。De Martino等人在高维空间中表示每个IC,并使用支持向量机将IC分类为6类(1种信号和5种噪声)。Tohka等人使用空间和时间标准的组合通过全局决策树对信号和四类噪声进行分类。SOCK自动从每个IC提取四个特征,并根据五个条件识别伪迹。Sochat等人采用基于200多个特征(单个IC和时间进程的空间、时间和功率谱信息)的稀疏逻辑回归和弹性网络正则化方法来自动识别伪迹,这些方法均表现出高精度。这些技术已整合到GIFT工具箱(http://mialab.mrn.org/software/gift/)。FIX由Salimi-Khorshidi和他的同事开发,从每个IC中提取180多个特征,并使用分类器(即k近邻、支持向量机和决策树)的分层融合将IC分类为信号或噪声(http://fsl.fmrib.ox.ac.uk/fsl/fslwiki/FIX)。尽管这些方法中有许多是完全自动化的,但部件分类的金标准仍然是成分的视觉检查。人工分类通常用于测试新开发的方法的有效性和/或创建用于监督算法的训练数据集。此外,给定数据集的小样本量或不寻常特征可能需要完全手动标记才能有效去除伪迹。最后,强烈建议在新数据集上应用这些方法中的任何一种时,能够仔细检查自动分类的输出。人工标签的操作除了耗时外,还需要专业知识。关于IC分类的普遍共识将为培训、测试和检查基于ICA的清除程序提供更客观的标准。这就增加了对成分分类指南的需求。在描述静息状态网络(RSNs)时,信号成分的空间和时间模式在文献中有很好的记载。它们既有组水平的描述,也有单被试水平的。然而,如果一个成分与通常呈现的RSNs不匹配,这并不一定意味着它应该被归类为噪声。根据所使用的ICA维度,当成分可能仅包含共同定义的RSNs的一部分(可能是“子网络”)。基于ICA的伪迹去除的目的是保留尽可能多的信号,同时去除结构化噪声以清理数据。其原因是,对于rfMRI的许多应用,人们可能更关心保持良好信号而不是去除不良信号,特别是如果残留伪迹的影响可以在其他地方得到改善,例如,通过在网络建模中使用偏相关,其中从完全相关转移到偏相关将解决“共线性”混淆的问题。因此,一条经验法则是,除非明显是伪迹,否则不要轻易删除一个成分。这突出了识别信号和噪声成分的一般规则和特征的价值,而不是必须要求单被试RSNs与已知(通常是组级派生)RSNs具有很高的空间匹配。两个主要的噪声类别是与被试相关的噪声(运动/生理效应)或与数据采集相关的噪声(MR物理伪迹)。因此,对基本生理学和磁共振物理学的理解对于正确解释是很重要的。在文献中很难找到伪迹可能范围的详细描述,很少有论文报道伪迹相关成分的描述或实例。Rummel等人描述了他们的评分者采用的一套规则,Kelly等人提出了基于一些定量措施和等级规则的程序。然而,这些论文中的示例通常与感兴趣的特定数据集相关。这些论文大多没有详细描述视觉检测N-IC(噪声成分)所采用的具体策略。这篇论文的目的是提供实际的指导和实用的指南,并用实例丰富它们,帮助识别单被试ICA中的噪声成分,用于手动清理、训练有监督的算法或检查(无)有监督的算法的结果。首先,作者提供了在对成分进行分类时要评估哪些功能的一般指导原则,以及成分的最佳可视化策略。其次,给出了各种数据集(3T数据,包括英国生物库成像研究和人类连接组项目的示例,以及7T数据)的实际示例,以提供广泛的示例。最后,讨论了一些影响IC的因素,并给出了一些特别具有挑战性的应用实例。本文发表在Neuroimage杂志。(可添加微信号siyingyxf或18983979082获取原文)使用三条互补信息可以将成分分为信号(S-IC)或噪声(N-IC),分别是IC空间脑图、其时间序列及其功率谱密度(时间序列的傅里叶变换的幅度)。大多数指南和自动化方法都评估这些信息,但它们在要考虑的空间脑图、时间序列和功率谱的特征在数量和类型上有所不同。作者在这里概括介绍了对IC进行分类时可以直观评估的主要功能(表1)。
信号成分的空间脑图应该包含数量较少的相对较大的团块(clusters),而较小且分散的团块的存在表明存在噪声成分。请务必记住,空间平滑会影响此功能:如果在数据预处理过程中未应用或很少应用平滑,则空间脑图将包含更多的较小分散的团块,而不一定意味着它们包含更多噪波。灰质(GM)中的团块(及其峰值)的定位暗示了该成分与神经相关的起源,而主要位于白质(WM)、脑脊液(CSF)和血管(特别是动脉)中的团块,通常与生理噪音(呼吸、脉动)有关。靠近大脑边缘的团块提示存在与运动相关的伪迹(特别是如果团块在视野(field-of-view, FOV)边缘附近有环形或新月形或条纹)或非灰质(空气)组织界面区域的易感性伪迹(在典型的回波平面成像中主要是眶前回和颞极)。诸如仅在单个切片或交替切片中可见的正/负条纹或团块、或在相位编码方向上行进的条纹等非生理图案的存在通常与MRI序列(例如,EPI敏感性或多频段加速)或硬件伪迹(例如,RF干扰)、或采集与头部运动的交互(例如,交替切片采集)相关。关于时间特征,在时间序列中要寻找的主要特征是存在突然跳跃的信号,很可能暗示着快速运动。此外,振荡模式不应在整个时间进程中发生显著变化。BOLD信号的特点是低频波动,最大功率在0.01-0.1 Hz之间。虽然有效信号存在于较高频率,但与BOLD相关的信号成分的主要指标之一是存在主要的低频功率,在功率谱中作为低频峰值可见,但在时间序列(至少对于TR较短的数据)中也作为常规低频振荡存在。然而,由于标准BOLD EPI的TR较长(~2至3s),心动周期和呼吸周期(分别为~1 Hz和~0.3 Hz)引起的生理噪声常常混叠到这个低频范围。因此,心脏和呼吸噪音也将出现低频波动,并可能被误认为是与神经活动相关的BOLD信号。为此,基于ICA的分类性能通常可以通过使用更快的TR来增强。关于可视化成分的工具,没有单一的建议。理想的要求是能够在不同的阈值下同时可视化空间脑图以及相应的时间序列和功率谱。例如,Melview(http://fsl.fmrib.ox.ac.uk/fsl/fslwiki/Melview )提供了这样的功能,它现在被嵌入到FSLeyes;Connectome Workbench是另一个有效的查看器,它允许显示ICA成分的皮层表面图,并且HCP为每个数据集提供标准的视图设置,以可视化ICA成分(http://www.humanconnectome.org/software/Connectome-workBench.html)。其他可用的可视化软件包是GIFT(http://mialab.mrn.org/software/GIFT),它提供空间和频率内容的完整视图,以及自动分类机器学习工具(journals.plos.org/plosone/article?id=10.1371/journal.pone.0095493),最后是AFNI (https://afni.nimh.nih.gov/afni/) ,它除了空间和时间可视化外,还包括GM和WM的概率。更改阈值:在查看空间脑图时,从z脑图的默认阈值开始(通常在2-3左右)并查看团块的数量和维度,这通常很有用。设置较高的阈值可以帮助识别空间脑图的峰值,以帮助确认它们是否在GM中。当降低阈值时,如果是RSNs的一部分,较小的团块将变得更大,并遵循GM解剖学;有时还会出现对侧团块或通常属于该RSNs的另一个团块。相反,作为噪声成分一部分的团块可能维持较小的局部斑点,或者以不与GM重叠的空间模式扩展。更改平面:查看不同的平面,以确保团块在所有视图中都处于GM功能区(团块可能在一个平面上看起来像信号,但在其他平面上看起来不像信号)。例如,随动脉和静脉变化的生理性N-IC(噪声成分)。改变平面也可以帮助检测MRI相关的伪迹,例如交替切片中信号的存在。以不同的模态为基础。成分通常叠加显示在平均EPI图像上。这对于评估敏感性伪迹和其他特定于EPI采集的伪迹很有用。然而,只要有可能,将IC覆盖在高分辨率结构图像(例如T1w或T2w)上有助于查看解剖细节,特别是小脑和基底神经节,以及GM重叠,在某些情况下,还可以看到主要动脉/静脉,以便更好地评估与GM的空间重叠。结构图像需要与fMRI数据精确对齐(包括EPI失真校正)才能发挥作用。既查看正向团块也要查看负向团块。ICA空间脑图的方向通常显示强正向团块,但有时主团块显示为负区域,和/或IC同时包含强负向和正向值。主要观察负信号IC并不意味着这些应该被视为噪声,因为符号翻转不会影响分析或成分的空间独立性。如果负向模式显示为基于其他特征的信号成分,则出于去除伪迹的目的,应将其保留在数据中。将时间序列与头动对齐参数进行比较。如果在时间序列中看到的尖峰对应于在预处理阶段生成的头动对准参数中看到的突然旋转/平移,则该成分很可能包含与运动相关的噪声。平滑数据或成分。具有高空间和时间分辨率以及足够数量的时间点的数据可能不会从预处理中的空间平滑中受益。这一点尤其适用于较长的扫描。另一方面,非平滑成分可能具有比平滑成分更多噪声的模式,因此后者可能更容易分类,因为它们更类似于组-ICA RSNs。因此,对于总体信号强度较小的数据集(例如,短时间序列),可能需要在运行ICA之前对数据进行空间平滑,以便ICA能够很好地工作。如果没有应用预平滑,则可以通过仅出于显示/识别目的而在空间上平滑(在由ICA处理生成之后)的IC的附加版本来帮助可视化(潜在的噪声)IC。查看皮层空间中的成分:在volum空间的时间序列上运行ICA后,可以在皮层空间中可视化成分。这可以通过对CIFTI 灰度坐标(grayordinate)中的数据上执行时间多元回归,使用ICA成分时间进程作为时间回归变量,从而找到相应的皮层空间成分空间脑图。在此空间中,信号成分将比噪声成分更一致地映射到表面上,即使它们在体积上看起来更相似。为了最有效地识别全部伪迹,在体积空间中运行ICA可能是最佳的,就像在HCP中执行的那样,因为体积空间既包括灰质体素也包括非灰质体素,这有助于分解算法更好地分离成分。HCP的手动分类在训练FIX时使用了表面可视化,从而在训练FIX性能方面产生了特别高的性能比率。在FIX训练之后,在体积空间中运行ICA和FIX来衡弃新数据集,然后在体积和CIFTI的时间序列数据的版本中回归噪声IC时间序列。预测高比例的噪声成分。如果用于ICA分解的算法根据所解释的方差大小对成分进行排序,那么许多初始成分通常不包含信号。通常情况下,噪声成分会比信号多得多(>70%)。设置优先级。手动IC分类在很多情况下并不简单,需要应用if-then规则。在从fMRI数据中去除噪声的背景下,当手动标记IC时,主要目的通常是保存尽可能多的感兴趣的神经信号。因此,按照“在被证明有罪之前无罪”的标准,除非明显是伪迹否则不剔除。Kelly等人的分类程序主要基于对空间脑图的检查。如果是可以的IC,并且可能包含至少90%的噪声,可以使用其他次要标准来评估时间序列和功率谱,以帮助做出最终决定。虽然作者同意空间脑图是区分S-IC(信号成分)和N-IC(噪声成分)的主要信息,但强烈建议始终检查时间序列和功率谱。
- 空间脑图首先需要是可信的,即位于GM、远离主静脉、WM或CSF(没有明显的与噪声有关的特征;
- 功率谱应主要显示低频功率(或至少低频成分应大于高频成分)。
2.3 常见噪声成分示例
为了fMRI数据清理和/或训练监督自动算法的目的,不一定需要将噪声成分细分为子类别,而只需要区分S-IC(不去除)和N-IC(去除)。然而,了解特定伪迹的特征是有用的,可以识别很明显的伪迹,并且当分类不直接时,还可以概括出适用的规则。本节中显示的示例成分来自在3T(http://www.ukbiobank.ac.uk/science-3/和http://biobank.ctsu.ox.ac.uk/crystal/refer.cgi?id=1977)采集的英国生物库成像研究的数据。采集参数:TR/TE=735/39ms,分辨率2.4×2.4×2.4 mm,体积490,多频段加速因子为8;预处理:运动校正、B0校正、脑提取、无平滑、无强度归一化和截取100s的高通时域滤波。这些数据的质量是“前沿”的,但在一般的3T机器上也可以进行采集。信号。如表1所示,干净的信号成分具有位于GM中的空间模式、低频功率谱并且在时间序列中没有突然跳跃。如图1。
图1.信号。显示默认网络(DMN)的示例信号成分。时间序列(左图)不包含突然跳跃,功率谱(右图)主要是低频。观察平面的改变和使用结构图像(例如高分辨率T1w)作为底板可以帮助评估团块是否定位在GM(右图)中。阈值z=2.3。运动。这种类型的伪迹通常看起来像一个环绕大脑边缘的环,或者是靠近视野边缘的条纹(如果它相当紧的话)。这些区域中的体素根据被试头部的运动或在大脑/视野的内部或在外部,因此时间序列可能遵循重新排列参数的趋势,并且在时间序列和头部运动轮廓中都应该可以看到突然跳跃或逐渐漂移。如图2。
图2.运动伪迹。空间脑图显示了大脑边缘的典型环形,时间序列包含对应于头部突然移动的突然跳跃,如运动校正调整参数(在橙色圆圈中突出显示)所示。静脉(如矢状窦)。来自静脉的信号通常是低频的,因此时间序列和功率谱有时可能与来自信号成分的非常相似。这些伪迹成分通常可以从空间脑图上检测到,这需要对静脉的解剖学有一定的了解。特别值得一提的是,在ICs中最常被检测到的生理噪声的主要静脉是矢状窦。如图3所示,血管可以在矢状面上变得更明显,改变阈值有助于确认峰值实际上位于脑组织外部;使用结构图像作为底板也会有所帮助。颈内动脉内常可见的其他静脉有直窦和横窦。重要的是要记住,对于单个数据集,可能有多个IC包含来自静脉的信号(例如,矢状窦可能被分成几个IC)。静脉也会在皮质表面形成特有的“染色”图案,倾向于在脑回顶部形成条纹。
图3.静脉(如矢状窦)。血管在矢状面上最明显,有一幅结构图像作为底图(右上角)。在平滑的ICA成分上也可以看到类似的模式(在此数据集中,对IC脑图应用了半高宽=9.4 mm的平滑,仅用于可视化目的)(右下角)。
动脉(大脑前动脉、大脑中动脉和大脑后动脉)。虽然在这种情况下需要一些关于脑血管解剖学的知识,但包含来自动脉的BOLD信号的成分也有一个独特的高频频谱。这个峰与其他频谱的区别程度取决于TR。如前提到的,心脏搏动通常在1 Hz左右,将在2-3s左右的TR的较低频率上被混叠,使得这一成分不太容易区分。同样在这种情况下,阈值的改变、使用来自结构扫描的附加解剖信息以及沿感兴趣血管方向的平面改变是检测这种组件的有用方式。一个特别有趣的例子是贯穿脑岛的大脑中分支(大脑中动脉的分支)。这是一个很好的例子,在这种情况下,仅仅对空间脑图的判断可能会产生误导,需要仔细检查,以借助时间和频谱特征区分脑岛的GM信号和生理噪声。见图4。但是,将神经相关信号从生理噪声中分离出来并不总是可能的。如果是这种情况,则应保留该成分。
图4.动脉。大脑中分支靠近脑岛,因此作为底板的结构图像可以帮助定位血管。更改阈值(在本例中从z=2.3更改为z=3)有助于确认峰值不在GM中。这种类型的成分还具有独特的功率谱(如右图所示)。脑脊液波动。脑脊液的波动主要是由心脏和呼吸周期引起的。心动周期和呼吸周期的频率分别约为1 Hz和0.3 Hz;因此,在这种情况下,相应的信号也被混叠成标准TR的较低频率。含有脑脊液信号的ICs的空间模式将重叠在脑室和皮质脑脊液上,尽管有时很难区分来自动脉的信号。见图5。
图5.脑脊液波动。空间分布与第三、第四脑室、枕大池和侧脑室导水管重叠(阈值z=2.3)。当以较高的阈值(右上角,z=3)叠加到结构图像上查看不同平面时,以及在对IC脑图(右下角)进行平滑之后,这一点会看得最清楚。室管膜下(和延髓)静脉的波动。虽然通常被定义为“白质”成分,但它们主要是由室管膜下静脉引起的。它们与所谓的经髓静脉有原始的联系,这解释了在附近的WM中看到的团块,特别是在平滑的数据上(图6)。如果覆盖在高分辨率结构图像或具有良好组织对比度的任何模态(例如,来自扩散MRI的分数各向异性图)上,则可以最好地检测到这些成分。在7T数据集中没有发现任何这种明显的成分。
图6.室管膜下(和延髓)静脉的波动。空间模式与WM-CSF边界重叠,更好地定位在结构图像上(右上角)。对IC脑图进行平滑处理后,团块将更多地延伸到WM(右下角)。易感性伪迹。这类与采集相关的伪迹通常最好从空间脑图中检测出来,因为相关的时间进程可能主要是低频的,即看起来像S-IC(信号成分)。考虑到此伪迹与梯度回波脉冲序列的使用有关,最好使用平均EPI图像作为底板,并查看IC团块与EPI图像中信号下降区域的重叠,当增加阈值时,峰值将位于该区域。未平滑、无阈值的易感性相关成分的图像可能会紧密混合高正值和负值。见图7。
图7.易感性伪迹。定位于EPI上的信号下降区域,主要是由于非灰质(空气)组织界面。使用更高的阈值(在这种情况下从z=2.3到z=4)使得可以验证峰值是否在信号下降区域(右)。多频段加速。使用多频段加速时会出现另一个与序列相关的伪迹。多个切片的同时获取反映在一些IC内的典型空间模式中,其中团块通常没有与GM重叠的清晰的神经相关模式,存在于稀疏和均匀间隔的切片中。这些效应通常在无阈值的空间脑图上最为清晰可见。切片间距取决于切片总数和多频段因子:例如,使用多频段加速因子4获取的包含64个切片的体积将每16个切片提供一个与多频段相关的伪迹。因此,这些伪迹在矢状面或冠状面以条纹的形式更加明显,或者在轴向灯箱视图中以“棋盘”效应的形式更明显。这种伪迹不一定是采集/重建所固有的,但可以是多切片采集与头部运动的相互作用。因此,根据头部运动的特点,相关的时间过程可以是低频的,也可以显示出强烈的峰值。见图8。
图8.多频段伪迹。在空间脑图中,团块在切片上以规则的方式可见(“棋盘”效应),在本例中为每8个切片(z方向64个切片,多频段系数8)。这反映在矢状面和冠状面(右图)的条纹中。时间序列中的峰值表明与头部运动之间存在交互作用(在运动校正重新对齐参数中可见,在橙色圆圈中高亮显示)。
核磁共振相关的伪迹。其他伪迹可能与MRI硬件或采集有关。由于成像过程的复杂性,它们可能很难完全识别和理解。有许多不同的可能阶段,在这些阶段,即使与单个成分的预期性能稍有偏差,也可能导致测量结果的巨大差异。最常见的情况是出现正负z值的交替条纹,如图9所示。
图9.与MRI相关的伪迹。空间模式在正值和负值之间交替(在右侧以圆圈突出显示),而高频频谱(右下)和时间序列(左下)在生理上没有意义。未分类的噪声。如果正在评估的成分不属于上述任何类别,但具有噪声成分的一个或多个典型特征(参见表1),那么将简单地将其称为“未分类噪声”,并将其计入N-IC,其贡献将从数据中删除。见图10。请注意,这种情况与“未知”(即“好坏参半”)成分不同。
图10.未分类的噪声。在此示例中,该成分具有低频谱,具有不太平滑的时间序列、少量的时间跳跃/不连续以及非常分散的空间模式。无论是降低阈值(在本例中从z=2.3到z=1,右上角)还是增加阈值(在本例中,从z=2.3到z=4,右下角)都不会显示任何可能具有神经起源的GM团块。
如果您对功能磁共振数据处理感兴趣,欢迎浏览思影科技课程及服务(可添加微信号siyingyxf或18983979082咨询):
第四十一届磁共振脑影像基础班(重庆,5.9-14)
第十三届脑影像结构班(重庆,6.8-13)
第十五届脑影像机器学习班(南京,4.18-23)
第四十届磁共振脑影像基础班(南京,4.24-29)
第二十届脑网络数据处理班(上海,5.12-17)
第一届脑网络数据处理提高班(上海,5.22-26)
第十七届DTI数据处理班(上海,4.25-30)
第十八届DTI数据处理班(上海,7.2-7)
第三届DWI数据处理提高班(南京,5.17-22)
第八届小动物脑影像数据处理班(上海,5.6-11)
第四十二届磁共振脑影像基础班(上海,6.5-10)
数据处理业务介绍:
在上面给出的噪声分量的示例类别中,由于它们与已知的RSNs相似,其中一些经常被错误分类为信号。矢状窦还是视皮层?因为在这两种情况下,功率谱主要是低频的,所以考虑空间脑图,特别是矢状图是很重要的。这将表明,矢状窦IC通常有一个模式,沿着血管一直延伸到大脑顶部(见图3),但并不总是这样,而视觉相关的IC将定位在枕叶GM。通过改变阈值,伪迹在大脑外部显示其最大峰值,而RSNs在GM内部显示峰值,通常是双侧的。动脉还是脑岛?在这种情况下,功率谱可以帮助判断,因为来自动脉的BOLD信号具有独特的高频频谱(见图4,右图)。团块的存在也对应于其他动脉,也有助于将IC归类为噪声。与前一种情况一样,更改阈值会显示GM外部(噪声)或内部(信号)的峰值。易感性还是腹内侧前额皮质?前额叶腹内侧皮质是一个经常受到易感性伪迹影响的区域,因为它靠近气腔。在这种情况下,不容易通过查看团块相对于GM的位置来区分信号和噪声,而是查看团块(和/或其峰值)相对于设置为底板的EPI图像中的信号丢失区域(参见图7)。识别眶额叶易感性成分的另一种方法是检查时间序列是否遵循头动校正参数的趋势,因为头部点头改变了EPI图像中的丢失模式。最后,在多回波fMRI数据中,会有一个与不同回波中的不同信号丢失相关的眶额叶成分,该成分在空间上类似于信号,但具有与TEs序列相关的规律性的时间模式。其他区域也可能受到易感性伪迹影响,因此需要仔细检查的区域是杏仁核和海马体。深层的GM结构。基底节、丘脑和下丘脑非常靠近脑脊液,因此这些结构的信号和噪声很难分离。对于空间脑图,提高阈值以检查峰值的位置是很重要的。皮质下GM结构中的信号峰值在结构内部,而不是在脑室或GM和CSF之间的交界处,这些峰值通常是双侧的(除非出现在明显偏侧的S-IC(信号成分)中)。小脑。在许多情况下,小脑成分在静脉中占相当大的空间容量。在其他情况下,还有一些成分包含视觉区域和小脑区域,这些区域靠近鼻窦汇合处。类似于在皮层下结构存在模糊IC的情况下可以做的事情,提高阈值将有助于识别其峰值的位置。对于S-IC,这些峰将位于GM,特别是“视觉-小脑”成分,要么位于枕叶,要么位于小脑顶部(很少两者都有)。在N-IC的情况下,峰将在静脉中。通常,特别是在较短和较低的空间分辨率数据集中,一个成分跨越小脑灰质并向附近的静脉扩散;一般来说,这些成分是“好的和坏的”信号的混合体,不应该从数据中删除。在无法明确将N-IC(噪声成分)和S-IC(信号成分)分出的情况下,成分通常被标记为“未知”,在去除阶段对这些成分的一般建议是将它们保存在数据中,以避免丢失有效信号。但是,重要的是要注意,未知成分可能会从不同的场景中生成。首先,IC可以包含可由其特定特征识别的信号源和噪声源的混合。有时可以清楚地识别信号和噪声,如图11所示(DMN与矢状窦相结合),其他时候该成分可能包含信号和噪声的典型特征,但它们不能清楚地归因于单个RSNs或上述特定伪迹(例如,GM和非GM团块的空间模式,低频和高频峰值,图12)。在这两种情况下,由于有一些信号的比重存在,那么这些成分通常应该保存在数据中。如果该成分的类似的信号部分位于研究的关键区域,并且位于较难进行成像的大脑区域(例如基底节、脑干、小脑),则情况尤其如此。见图11和12。
图11.未知成分。在本例中,该成分清楚地包含一些与神经相关的信号(DMN),但也包含一些伪迹,可能来自血管,特别是在矢状面(右图)可见。时间序列大多是低频的,但也有一个高频峰值。
图12.未知。与前一个示例不同的是,没有明显的信号和噪声存在。空间模式主要局限于GM,但不能明显归因于RSNs,存在正/负模式,但仅在不平滑的脑图上存在,并且功率谱包含低频和高频峰值。在这些情况下,尤其要仔细检查不同的平面和平滑的数据,以及结构图像(右侧)的底板,是帮助确定组件不属于其他类别的良好做法。
这一“未知”类别也有助于改善人工标注标签时专业知识的限制。减少与分类过程相关的不确定性的一种方法是涉及多个评分者。多盲或者多评分分类是一种更正式、更定量的方法。该程序对评分者内部和之间的可变性进行了定量测量,可用于校准标签方法,并培训新的评分者。然而,最终分类通常是通过多位专家的共识达成的,特别是关于未知成分(当评分者不同意或不能达成一致时,该成分被标记为未知)。例如,Rummel等人的研究有三名评分者,在独立评分后就N-IC和S-IC分类达成一致。同样,在Storti等人的研究中两名专家对各成分进行了评估,组内产生了不同意见,并通过参考第三方意见解决了这些分歧。HCP数据也采用了类似的方法。最后,在分类时由同一操作员进行第二次非盲分类可以进一步加强评分者之间的一致性,并且在手动分类的同时评分者也获得了专业知识。到目前为止所描述的IC分类指南不需要任何额外的计算,而仅依赖于视觉检查。这很耗时,而且可能会显得相当主观。除了多个环节和多个评分者的标签或共识策略外,使用一些更定量的措施和/或自动方法可以帮助分类。Kelly等人向评分者提供了关于阈值体素位于大脑外围、非外围CSF、WM或GM内的比例的统计数据,以便于确定多大百分比的阈值以上体素位于功能相关的GM团块中。这些值有助于数据集中IC之间的相对比较,但没有适用于每个数据集和应用的特定值。另一种方法是计算空间模式与某些模板成分的相似度,无论是对于RSNs还是对于噪声。这可能是利于分类的措施,但与更标准的已知RSNs相比,ICA分解可能会以不同的方式拆分成分,因此可能用处不大。为了帮助识别运动相关的N-IC,可以从时间进程中计算出一些定量指标。例如,Vergara等人使用DVARS方法找到头部位置变化的均方根超过3个标准差的尖峰回归变量。其他选择是计算平均帧向位移的偏差或时间进程与重新对齐参数之间的时间相关性。通过傅立叶变换计算出高于给定频率的总功率与低于该频率的功率之比,有助于更好地表征频率成分。在Salimi-Khorshidi等人的研究中使用几个不同的频率阈值(每个新特征一个)计算了几个定量特征:0.1、0.15、0.2和0.25 Hz(这些特征用于自动训练的FIX分类器)。同样,Allen等人也计算了低频与高频功率比为0.10 Hz以下频谱功率积分与0.15至0.25 Hz之间的功率积分之比。他们还计算了第二个矩阵,即动态范围,即右侧频率峰值处的最大和最小功率之间的差值。De Martino等人提出了在多维空间中表征成分的定量指标。成分的”IC指纹”可以可视化为极图(polar diagram),并用作帮助评分员进行分类的工具。另一种选择是使用无监督自动化方法或具有默认训练数据集的监督自动化方法来获得成分的初始分类或检测一种特定类型的伪迹,然后通过检查分类器/手动不匹配的错误来迭代地手工细化分类。事实上,这种方法对于训练HCP数据集非常有帮助,因为它能够获取许多“转录(transcription)”错误。到目前为止提出的大多数指南也可以扩展到对从组水平ICA中提取的成分进行分类。尽管已经表明,当在单被试水平上首次执行有效的噪声去除时,伪迹成分的数量减少,但如果被试间存在一定的空间一致性,则数据中留下的噪声,无论是来自混合/未知成分还是在单被试ICA分解的残差中,都可能出现在组水平。为了为以后的分析步骤选择感兴趣的RSNs,通常需要组水平的分类。此外,在进行网络分析时,如果使用全相关来生成网络,则在计算相关矩阵之前,应在“高层级”去除阶段将组水平噪声成分的贡献从数据中去除。如果使用偏相关,则在估计偏相关时应包括不好的成分,因为偏相关考虑了它们的贡献。组水平ICA与单被试ICA相比,其优势在于空间脑图的噪声更小,RSNs更清晰可识别。数据被配准到标准空间,并且GM/WM/CSF的空间先验可用于评估与这些组织的重叠。另一方面,有用的时间序列功率谱不能立即从初级组水平ICA输出中获得。评估组水平IC的功率谱的一种方法是为每个被试导出每个成分的功率谱,并在被试间对这些功率谱进行平均以获得每个成分的平均谱。在运行组水平ICA时,确保图像在不同被试之间对齐也是非常重要的。HCP使用CIFTI灰质标准坐标空间和基于区域特征的配准来实现较优的脑区对准。有趣的是,在210名被试的d=137的ICA分解中,发现相对较少的血管伪迹成分(1条静脉、1条动脉搏动、1条线圈伪迹,在840个run中只有1个出现)。这可能归功于ICA+FIX的自动个体运行噪声去除的出色性能,在将体积数据投射到表面时,噪声体素的时间序列被抑制,以及图像对准的质量很高,它消除了可能看起来是噪声的成分,但实际上是由于被试间的RSNs未对准而引起的。3. 影响ICs的因素:数据质量、数据类型和预处理来自不同扫描仪和序列的数据可能需要不同的预处理选项,并且可能受益于分析流程中的一些变化,以实现单被试IC的最佳可视化和分类。通常,在高质量数据(即,利用较高场强和/或加速序列生成的高空间和时间分辨率数据)中可以改进IC分类。更高的时间分辨率(短TR)允许ICA更好地分离不同的频率,部分原因是减少了混叠,因为最高可识别频率是1/(2xTR)( Nyquist频率),并且较高频率的贡献将在较低频率中以伪迹的形式表现出来。由于具有较高的自由度,获取多个时间点使得ICA能够更好地分离成分。然而,增加时间点的数量(更高的时间分辨率或更长的扫描)的结果是生成更多的IC(自动估计的),其手动评估可能非常耗时和困难,部分原因是共同定义的RSNs可能被分成多个子网络,因此更难识别。成分数量较多的一个原因是噪声过拟合,可以通过限制成分的最大数量(例如,将250设置为HCP预处理的最大数量)来降低噪声。这类数据的较长的run最好在不进行空间平滑的情况下进行分解和手动或自动分类。尽管需要在增加维度与手动分类的难度之间进行权衡,但这个操作手册中提供的一般规则可以应用于不同的维度。此外,特定的伪迹可能与序列或扫描仪相关,尽管它们已经在EPI图像中可见,但在特定的IC中获取助于识别它们。例如,由眼睛脂肪引起的信号在某些情况下可能在EPI图像中表现为小脑或颞叶中的两个高信号病灶。这是脂肪抑制不完善/缺失的结果,有时可以在IC中看到。有时其他与MRI相关的伪迹包括重影、信号丢失和RF干扰可以作为IC获取到。基于ICA去伪迹也被用于多回波数据。在Kundu等人开发的多回声独立成分分析(ME-ICA)方法中,在跨空间和TE的空间连接数据之后,或者在创建针对功能对比度进行优化的新的单个最佳组合的每个体素的时间序列之后,使用独立成分分析(ICA)对至少具有3个不同回波时间的多回波数据进行分解。基于S-IC(信号成分)表现出依赖于TE的信号变化,而N-IC不表现出这种变化的思想,成分根据两个汇总性矩阵自动分类。到目前为止所描述的空间脑图和时间序列的特征与由单回波数据生成的IC的特征相似。因此,虽然ME-ICA是用于检测噪声成分的无监督算法,但是这项研究提供的指南也可以应用于此,以检查ME-ICA的分类或执行多回波数据的手动清理。基于ICA的伪迹去除也可用于清理任务态fMRI数据。将结构化噪声去除应用于任务数据不那么重要,因为感兴趣的任务相关信号是先验假设的,因此不会太频繁地随机地与许多类型的结构化噪声相关。此外,删除多个自由度(即成分)可能会降低一阶分析的统计能力,特别是在GLM设计矩阵非常复杂的情况下。然而,上面描述的识别噪声成分的一般指南仍然适用于任务态fMRI (TASK-fMRI)数据。请注意,包含信号的成分将包括可能看起来不像RSNs的特定任务相关成分。关于预处理阶段,ICA是去除fMRI数据中许多噪声源的强大工具,可能不需要额外的清理工具。然而,当数据被一种或多种伪迹特别破坏时,ICA算法可能难以分离成分,从而产生大量无法清晰识别的成分或信号和噪声的混合。在这种情况下,根据伪迹的类型,执行多阶段清理是更好的做法,包括对标准流程的附加预处理或后处理步骤,或者甚至运行两次ICA。通常,可以改善ICA分解的操作应该在它之前运行。另一方面,一些可以改进清理数据的操作(例如,在扫描过程中获得的生理信号的回归),通常不能完全去除感兴趣的伪迹,应该在之后运行ICA。这一建议的基本原理是,在运行ICA之前不能完全去除特定类型的伪迹,可能导致该伪迹不能完全去除,而且由于太弱而不能出现在不同的IC中。如果基于ICA的清理已成功去除伪迹,则附加清理步骤在任何情况下都不应损坏数据。尽管有这些基于ICA清理改进数据质量的可能性,但这不排除数据被一个或多个伪迹破坏而无法使用的可能性。另一个重要的考虑是,空间ICA(无论对于标准或多回波EPI)在数学上不能看到全脑混淆(global confounds)。幸运的是,大多数噪声源在空间上是特定的,例如运动伪迹、扫描仪伪迹或与静脉/动脉相关的伪迹。与大脑灌注压变化相关的伪迹(例如,呼吸频率/深度的变化导致二氧化碳变化、心率变化,甚至打哈欠)可能导致全脑所有信号成分(尽管主要集中在灰质)出现明显的波动。这种全脑波动对标准功能连接等单变量大脑分析方法构成了严重挑战,因为它导致了连接中的全脑正偏差,并使得一些作者坚持使用全脑信号回归来消除这些偏差。不幸的是,这种方法不能区分全脑噪声和全脑信号,并且会扭曲功能连通性的测量。更好的方法是使用偏相关等多元分析方法。到目前为止出现的伪迹一般都存在于健康被试和患者身上。然而,这些伪迹的比例可以根据人群的类型、它们的可变性(例如,由于或多或少的脑萎缩而导致的或多或少的CSF成分)以及它们的依从性(例如,或多或少的运动相关成分)而改变。下面介绍几种IC分类方面独具挑战性的一些项目类别。改变的神经大脑活动。BOLD信号和衍生IC的改变的一个来源是改变的神经活动。例如,在Soddu等人的评论中描述了在意识障碍(闭锁、最低意识状态、植物性昏迷)患者中区分静息状态活动和颈内动脉活动的难度。在这些患者中,大脑功能通常会降低(有时甚至局限于单个半球),伴随而来的结构改变可能会使rfMRI活动的检测进一步复杂化。这导致有时不能以自动方式检测到RSNs,而只能通过视觉检查来检测。同样,Demertzi等人发现,与健康对照组相比,处于最低意识状态、植物状态/无反应觉醒综合征和昏迷的患者可识别的RSNs中神经元成分数量减少,功能连接性降低。在麻醉过程中,RSNs也会发生改变,这是诱发意识改变的一种条件。Guldenmund等人观察到,随着反应性的丧失,从ICs中检测到RSNs的能力显著下降,在可检测到的RSNs中,额叶皮质的总大脑连通性明显下降。癫痫患者代表了另一个神经活动改变的病例。Rodionov等人的研究成果表明,脑电相关功能磁共振成像数据上的ICA能够将局灶性癫痫患者的癫痫活动区域(发作间期癫痫样放电,IED)作为一类独立的ICs来揭示。对于成分分类,他们使用自动IC分类方法来检测标准噪声源,然后视觉检查其余IC,以识别与IED相关的新类别的成分。在8名受试者中,有7名与IED相关的IC与先前案例研究的GLM结果相匹配,而一些未解释的IC(即不满足空间和时间匹配标准)的时间进程与IED衍生的GLM回归显著相关,这表明这些IC可以描述在头皮脑电图上不明显的异常。急性血管病变。BOLD信号的其他改变可能是由血流动力学/血管水平的改变引起的。需要特别关注的一个实例人群是发生过急性血管事件(例如中风)的患者。病理的血管性质会干扰BOLD信号,因为急性缺血性病变能够改变血管张力以及心脏和呼吸周期。此外,当在急性期进行扫描时,由于依从性降低,患者可能会移动更多。这里介绍的ICs分类指南仍然适用。然而,由于病理的异质性和缺血性病变的局部性,ICs的数量、类型和特征在不同的被试间可能更具变异性。在最近的一项研究中,Carone等人成功地将基于ICA的伪迹去除应用于一组缺血性腔隙性卒中患者,但这需要两个独立的评分者创建一组特定于研究的手动标记成分(评分者间一致性为95%)。新生儿和儿童。来自新生儿和儿童的数据给数据清理带来了巨大的挑战。与健康成人相比,图像对比度是不同的,也是可变的,结构和功能属性也是如此。由于尚未为这些不同的人群定义标准化的清理方案,因此有必要仔细评估和调整数据清理程序,以确保数据集得到适当处理。如果有高层级的头部运动那么相当大比例的数据可能无法使用。高层级的运动通常会导致ICA分解由运动成分主导,这可能会给清理和分析带来问题。清理可能需要结合数据拒绝、积极的运动参数回归和基于ICA的去噪。动物。在啮齿动物和灵长类动物的静息状态活动下,也可以使用ICA清理。例如,Zerbi等人对小鼠的数据进行了基于ICA的去噪。在他们的工作中,他们提供了许多ICA组水平的信号(进一步分为单侧和双侧)和噪声成分(运动、血管、未指明的噪声)的例子,有助于单被试的分类。这表明,除了这些动物大脑的解剖学差异,以及BOLD信号与心脏和呼吸周期的不同交互作用外,这里提出的指南还适用于其他物种。
图13. “无罪直到被证明有罪”原则流程图。首先,评估从ICA分解得到的所有三条信息(空间脑图、时间序列和功率谱)的重要性,尽管这些信息具有一定的层次性。第二,目标是保留尽可能多的信号,而不是去除不能清楚地识别为伪迹的成分。虽然这是一个没有绝对事实的手动过程,而且IC可能会随不同的人群、采集和处理而不同,但作者认为,对S-IC和N-IC的一般/典型特征达成共识是有用的,有助于为更可靠和可重复性的手动清理、培训监督算法或检查(非)监督算法的结果提供普遍参考。本文提供了从ICA结果中视觉识别噪声成分的指导方针和实用策略。文章将文献中已有的知识和指导方针与来自作者直接经验的实用策略和视觉例子结合起来。图13总结了这里描述的主要指导原则,如果不是特别确定是噪声则不要去除,使用ICA降噪的目的是保留尽可能多的信号,同时去除结构化噪声,以改进功能磁共振成像分析。