PNAS:浅前馈神经网络识别fMRI功能连接指纹图谱

尽管个体受试者可以通过静息态功能MRI(rsfMRI)数据计算的相关矩阵进行高精度识别,但随着扫描时间的减少,识别性能显著下降。循环神经网络可以在短持续时间(72 s)的数据段中获得较高的精度,但其被设计为使用不存在于相关矩阵中的时间特征。在这里,我们表明,浅前馈神经网络,仅仅依靠rsfMRI 相关矩阵的信息,以20s的短数据段,就可以实现先进的识别精度(≥99.5%)
1.简述
使用长时间(>12分钟)基于静息态功能MRI (rsfMRI)数据计算的相关系数矩阵进行功能连接体指纹图谱识别可以获得较高的准确性(≥98%),但获得数据时时间减少到72秒时精度大大降低(~68%)。循环神经网络(RNN)——能以短期(72秒)数据达到高精度(98.5%),反映了他们捕获时空特性的能力。然而,研究表明,即使对fMRI数据的时间顺序进行排列,RNN也能达到较高的性能,这表明时间特征对识别不是至关重要的。本文介绍了两种无需循环连接就能获得较高识别精度的浅层前馈神经网络。此外,我们利用这些网络估计所需的最小数据规模,以高平均精度(99.5%)从rsfMRI数据的短片段中稳健地识别受试者。由于识别的准确性反映了从功能连接体中有效提取信息的能力,对实现高性能的方法和最小数据大小的进一步了解可以指导开发扩展方法来检测功能连接中的其他差异,比如与疾病相关的变化。
考虑的两个网络如图1A,1B所示。相关神经网络(CorrNN)的输入包括相关系数矩阵C的上三角元素,C是从包括M个ROIs的z标准化时间序列(长度N)的数据矩阵X估计得到的。为识别L个个体,网络结构包括一个有L单元的全连接分类层,一个批归一化层,一个softmax层。基于规范的神经网络(normNN)使用z标准化数据X作为输入,第一阶段是一个全连接层,将数据投射到K个隐藏单元,这些单元使用MXK加权矩阵W来形成NXK介入矩阵Y=XW。第二阶段,为每个隐藏层计算所有时间维度的L2范数来组成在N时间点集合上的相似性的总结性度量。结果向量包含来自于相关矩阵C的K个特征。第k个特征与W的第k列向量方向上的方差成正比。如果这些向量是随机定向的,并被约束为单位范数,那么特征代表了“花生”形状表面的方向方差的随机抽样。该网络的后续阶段为批处理归一层、具有L隐单元的全连通分类层、第二批处理归一层和softmax层。
图1A,1B分别是CorrNN,NormNN模型结构。C,D是相应的ROI对识别精度的重要性。E,F是平均识别精确性作为ROI数量与时间点数的函数。
2.结果
我们使用来自人类连接体项目(HCP)的数据评估了两个网络的性能。第1天获得的两个rsfMRI扫描被用于训练,而第2天获得的两个扫描被用于验证和测试
M = 379 ROI, 每段N = 100时间点 (72-s持续时间),和K = 256隐藏单位, corrNN和normNN模型平均分类准确性分别为99.8%和99.6%
这些精度高于RNN模型报道的94.3%-98.5%。相比之下,每段100时间点使用相似性相关系数的平均分类精度为79.4%,高于参考文献ref.1报道的68%平均精确性,ref.1使用的数据来自一个不同的数据集。
我们使用贪心搜索算法来评估ROI相对于模型精度的重要性。对corrNN和normNN的重要性图分别显示在Fig. 1C和D的顶部行。在前60个ROI中,22区(背外侧前额叶皮层)的ROI最多,17区(顶叶下皮层)、14区(颞外侧皮层)、16区(顶叶上前皮层;对于CorrNN)、21(额下皮层)和3(背流视觉皮层)次之,其中大脑区域的定义见文献7。
我们使用最优ROI来评价15 ~ 60个ROI和5 ~ 1000个时间点的CorrNN和NormNN的性能,分别如图1 E和F所示。随着ROI数量的减少,实现更高精度所需的时间点数量增加。定义99.5%作为平均精度高的门槛,我们观察到,对CorrNN超过该阈值只有M = 60 ROI和N = 100时间点,对NormNN,为40 ROI和200个时间点,分别对应于M X N = 6000或8000数据点。
为了进一步探究ROI和时间点的依赖关系,我们考虑了数据点总数被限制为等于或接近6,000或10,000的组合(图2图例)。对于CorrNN,有两个组合(暗红色方块)有6000个数据点,所有五个组合(暗红色方块)有10000个点,都获得了较高的平均精度。
相比于CorrNN的二次相关(见图2图例),对于NormNN,参数的数目表现出线性依赖于ROI(M)的数目。为了更好地比较模型,通过乘以2的幂来增加K,两个模型参数的数量相等,Keq也作为可能的选择。图2B中,我们展示了1)超过99.5%阈值K≥256的最小值或2)未达到阈值时的最大精确度K≤Keq,得到的NormNN精确度。分别用6000和10000个数据点对2个和4个组合获得了较高的平均精度。
从直方图中可以看出,较高的平均CorrNN和NormNN精度对应着稳健的识别性能,大多数试验显示出100%的预测精度。这些精度都是通过全局信号回归(GSR)得到的,且显著高于未进行GSR的两种CorrNN (delta bar= 0.60;t10 = 5.00;p = 0.0005)和NormNN (delta bar =0.78;t10 = 3.93;P = 0.0028),其中delta bar表示精度的平均差异。在没有GSR的情况下,只有两种CorrNN组合和两种NormNN组合的准确率大于99.5%。
使用从前100名受试者中确定的ROI,我们评估了第二组100名受试者在图2所示的组合中的表现。对于先前识别的6000点的高性能组合和4个10000点的组合,保持了较高的平均CorrNN精度(99.5%),而对于第二个数据集,其余的组合(379,27)的精度略低(99.28%)。因此,同一组ROI可以跨独立数据集提供可比较的高水平性能。
对于两组受试者,CorrNN预测误差的平均数量(跨受试者)与受试者运动的平均帧位移(FD)测量没有显著相关。当使用FD测量的过滤版本(SI附录,扩展方法)时,相关性更高,但没有达到显著性,第一组和第二组受试者值分别为r = 0.19 (p = 0.06)和r = 0.13 (p = 0.19)。当在可以实现的高CorrNN精度的背景下观察时,这些结果表明,主体运动对性能的任何影响都是相当微弱的。
对于NormNN,我们发现第一层训练权重随机分布的特性后,L2范数操作代表一个大约均匀采样的方向方差表面C。的确,高性能也可以通过用一组随机高斯权重替换第一层来实现。所有数据集特征的普遍性集表现出对数量单位K的依赖。例如, 使用第一组研究对象,使用第一层权重训练, 与K = 256(100,100)结合的性能与从第一个100例的99.82%下降到第二个100例的98.79%。使用第一组训练的权重增加到1024个单位,第一组和第二组的精度分别为99.91%和99.63%。
当对第一层使用随机权值时,可以获得相应的精度水平(99.81%和99.65%)。因此,当有更多的特征来表征方向方差时,NormNN特征的泛化性就会增加。
图2 ROI(M)和跨长度(N) 数字组合(M, N)的 CorrNN (A)和(B) NormNN识别精度, 6000(蓝色曲线)或10000(黑色曲线)数据点,除了组合(379,16),(300,34)和(379,27),分别有6064,10200和10233数据点。
3.讨论
我们已经证明,浅层前馈模型可以仅基于rsfMRI相关矩阵中的信息来识别受试者,在6000到10000个数据点的情况下,稳健地实现高精度(99.5%)。相比之下,参考文献3中提出的卷积RNN在23600个数据点上达到了98.5%的准确率。在两种前馈模型的比较中,NormNN可以在较少的模型参数下获得较高的精度,而CorrNN使用的相关系数特征比NormNN的方向方差特征更能直接解释,可以为以后的工作提供更好的基础。
与之前的观察结果一致,使用ROI的一个子集,包括位于额顶区和外侧颞区,可以实现高性能。同样的ROI可以跨独立数据集实现高性能,这表明这些区域的功能边界和连接性的个体变异性的预测值可以跨数据集进行概括。而跨度长度短至27点(19.5 s;CorrNN(379,27))可以提供高性能,它们需要大量的模型参数。相比之下,具有更少ROI但增加跨度长度(例如,(100,100))的组合可以在参数减少一到两个数量级的情况下获得高性能。对于NormNN,通过使用第一层的随机权值,可以进一步减少可训练参数的数量。
与之前的研究一样,当前的研究利用了HCP数据集,其中的数据是连续两天获得的。尽管由于警惕性的时间波动等因素,功能连通性可能在短时间尺度(即几分钟到几小时)发生重大变化,我们的结果表明,即使存在这些因素,也可以在1天的时间间隔内获得高性能。未来还需要进行大规模的研究,以评估在较长的时间间隔(即数周到数年)内是否能够获得较高的识别精度。
前馈网络在区分数据相对较少的个体方面的有效性表明,类似的未来方法可能有潜力更充分地利用rsfMRI数据中包含的信息来更好地识别疾病相关的差异。
(0)

相关推荐