静息态功能连接(rs-fMRI)磁共振成像能够对即将发展为阿尔兹海默症(AD)患者的早期损伤进行检测。这种损伤可以用来对AD患者出现临床症状前就进行筛查。我们构建了一个模型,可以根据静息态 (rs)-fMRI 数据预测大脑年龄,并评估 AD 的遗传决定因素以及 β-淀粉样蛋白 (Aβ) 病理是否会加速大脑衰老。使用来自多个地点的1340 名18-94 岁之间认知未受损参与者的数据,结果表明从 rs-fMRI 构建的模型的拓扑特性可以预测整个生命周期的年龄。基于预测模型在临床前 AD 的应用表明,常染色体显性 AD 症状的个体前阶段存在功能性脑衰老的加速。这种关联在具有显著 Aβ 病理的个体中更强。本文发表在NATURE COMMUNICATIONS杂志。(可添加微信号siyingyxf或18983979082获取原文及补充材料,另思影提供免费文献下载服务,如需要也可添加此微信号入群,原文也会在群里发布)。 思影曾做过多期关于脑龄研究的文章解读,可点击下文结合阅读:
基于原始影像数据的深度学习模型预测脑龄可获得可靠的遗传生物标志物
AJP:精神分裂症患者大脑加速老化的纵向识别研究
基于全球14468名被试MRI数据特征预测脑龄和疾病的深度学习模型
神经影像研究驱动的脑龄估计作为脑疾病和健康状况识别的生物学标记
随着年龄的增长,大脑会发生重大变化。目前还不完全了解神经退行性疾病如何影响同样受正常衰老影响的大脑区域和网络。然而,越来越多的证据表明,易受年龄影响的神经系统也易受阿尔茨海默病(AD)和其他神经退行性疾病的影响。近年来大规模神经影像数据集促进了机器学习技术的应用,并促进了模型的开发,这些模型可以预测已知 2-10 岁的大脑结构和功能的行为和特征随着年龄的变化。我们探究了脑年龄是否可能是神经退行性疾病的相关生物标志物,因为疾病可能导致正常衰老轨迹的偏差,并且可以研究影响这些偏差的因素。例如,使用结构磁共振成像(MRI)数据的大脑年龄预测模型显示,AD痴呆患者的大脑加速老化。类似的现象在其他患有轻度认知障碍(MCI)并进展为痴呆症的患者身上已经很明显。预测的生物年龄和实际年龄之间的这种个体间差异与生活方式和遗传决定因素有关。然而,目前尚不清楚大脑加速老化是否先于认知能力下降,以及是否能在AD的临床前阶段检测到。AD痴呆的特征是进行性认知下降,足以影响日常生活活动。先前的研究表明,AD患者的大脑变化特征可以在症状出现前二三十年得到证实。通常,该序列始于大脑β-淀粉样蛋白(Aβ)的积累,随后是过度磷酸化tau(神经原纤维缠结)的沉积、脑代谢改变以及其他先于认知和功能症状的神经退行性病变。静息态连接性MRI测量(rs-fMRI)显示的功能性脑改变与正电子发射断层扫描(PET)测量的Aβ和tau几乎同步可检测,因此在结构MRI可检测到在萎缩的几年前就明显可见。这种功能和生物学变化的结合似乎延伸到AD从临床前到痴呆期的整个发展过程中。这些发现表明,MRI测量静息态下的功能连通性可能比结构成像更敏感,可用于检测临床前AD患者的大脑变化。AD痴呆症状临床上只有在大脑发生明显不可逆的巨大变化后才会出现。因此,至少在理论上,一个更有希望的方法是防止这种变化。然而,预防AD需要更好地了解AD的临床前阶段。在该病临床上处于无症状阶段的个体的鉴别是一项挑战,因为在患者的一生中,谁将发展为痴呆症几乎是未知的。解决这个问题的一种方法是研究常染色体显性AD(ADAD),ADAD是一组罕见的由淀粉样前体蛋白(APP)、早老素1(PSEN1)或早老素2(PSEN2)基因突变引起的AD基因变体,所有这些基因都与Aβ的产生有关。由于这些突变是完全渗透性的,因此疾病进展是可预测的,使ADAD成为研究AD临床前(即症状前)阶段的理想因素。虽然不可能确定谁会因散发性AD(sAD)而发展为痴呆症,但已知一些因素会增加其发展的风险。其中最突出的是编码载脂蛋白E的多态性APOE位点的ε4等位基因,已知该等位基因参与Aβ清除。更广泛地说,sAD痴呆症的家族史也与痴呆症发病率增加2到4倍有关。大脑表现出Aβ病变的个体也会随着时间的推移经历大脑变化和相关的认知衰退。因此,如果无症状个体有Aβ病理,则可将其归类为处于疾病的临床前阶段。同样,如果他们携带APOEε4等位基因或其他已知的遗传风险因素和/或如果他们有很强的痴呆症家族史,他们患痴呆症的风险也会增加。在这里,我们测试了处于ADAD(常染色体显性AD)临床前阶段的个体,或处于临床前sAD风险的个体,是否在其遗传风险或Aβ状态预测的症状出现之前显示出大脑加速老化。我们研究了1624名年龄在18岁至94岁之间的认知正常的参与者,在不同的研究和中心进行了招募和扫描。基于此提出了静息态磁共振成像预测脑龄的方法。我们基于网络集成与分割的方法,称为图度量,来表示大脑功能图并构建了一个神经网络。简单地说,我们最初在一组18到90岁的认知未受损个体上训练了这个模型。然后,我们在另一个研究/地点的另一组认知未受损个体(年龄从19岁到79岁)中验证了其泛化性。在这些验证之后,我们测试了临床前ADAD患者与年龄匹配的亲属相比是否表现出加速的功能性脑老化,而这些亲属没有因果突变。重要的是,后一类参与者均未参与脑年龄模型的开发或验证。在这些人中,我们还进一步测试了Aβ病理学是否是大脑年龄的预测因子。最后,在一组有sAD父母或其他强烈家族史的无症状个体中,我们测试了APOEε4和/或aβ病理是否与预测的功能性脑年龄相关。我们的研究结果表明,首先,ADAD(常染色体显性AD)突变的症状前携带者有加速大脑功能老化的证据。重要的是,这一发现在已经积累了显著的Aβ病理的个体中更为明显,如PET成像所示。在 sAD 风险升高的队列中,APOE ε4 状态和 Aβ 病理学的 PET 诊断均与明显加速的脑衰老无关,但接近其父母发病年龄的个体倾向于表现出加速的脑衰老。第三个独立队列中的二次分析包括一小部分被诊断患有 sAD 痴呆或 MCI 的个体(ADNI 队列),证实了与认知正常的老年人相比,患者功能性脑衰老如预期加速,表明患有 sAD 的受损个体认知功能性脑衰老加速,因此验证了我们的模型对偶发性 AD 相关过程的敏感性。我们的结论是,具有强遗传决定因素的无症状患者表现出与加速脑老化相关的脑功能改变的特征模式。因此,AD的生物学发展以一种在症状出现之前就可以检测到的高级脑老化模式为特征,至少在具有导致AD和显著Aβ病理学的罕见基因突变的个体中是如此。显性遗传性阿尔茨海默病网络数据集--DIAN。DIAN是一项多中心纵向研究,该研究纳入了18岁及以上的个体,这些个体的亲本携带导致ADAD(常染色体显性AD)的基因突变。他们都接受了临床和认知评估、基因测试和成像(磁共振成像[MRI]和正电子发射断层扫描[PET])。本研究使用了DIAN数据(2009年1月至2016年5月)中存档的认知未受损突变携带者和非携带者的数据。所有入选个体的临床痴呆评分(CDR)为0基线标准,包括280名年龄在18岁至69岁之间的认知未受损个体(突变携带者和非携带者)的基线数据,这些个体的结构MRI和rs-fMRI数据可用。阿尔茨海默病实验或新疗法的症状前评估-PREVENT-AD数据。PREVENT-AD(道格拉斯心理健康大学研究所,蒙特勒尔)是一个单中心纵向队列。简言之,在2011年9月至2017年11月期间,共有399名具有sAD家族史的认知未受损老年人(至少有一位父母或多个兄弟姐妹)被纳入研究。纳入标准包括:(i)60岁或以上;55–59对于症状出现时与亲属年龄相差不到15岁的个体,(ii)认知正常,(iii)无重大神经或精神疾病史。正常认知被定义为CDR为0,蒙特利尔认知评估(MoCA)≥24在少数结果不明确的情况下(本样本中3名参与者的CDR为0.5,1名参与者的MoCA为23),参与者通过更广泛的神经心理学测试组进行进一步评估,该测试组由神经心理学家和内科医生仔细审查,以确保正常认知。参与者每年接受临床和认知检查、血液测试和MRI检查。2017年2月至2019年7月期间,对一部分参与者进行了PET扫描。本研究包括了353名年龄在55-84岁的参与者,他们的基线结构MRI和rs功能磁共振成像可用。剑桥老龄与神经科学中心--CamCAN。剑桥老龄与神经科学中心(Cam-CAN)。是一个大型合作研究项目,于 2010 年 10 月启动,利用流行病学、行为和神经影像学数据来表征认知和大脑结构和功能的年龄相关变化,并揭示支持健康认知衰老的神经认知机制。在目前的研究中,648名年龄在18岁到88岁之间的个体,具有结构MRI和rs功能MRI数据。阿尔茨海默病神经影像学倡议--ADNI。本文准备中使用的ADNI数据来自阿尔茨海默病神经影像学倡议(ADNI)数据库。ADNI成立于2003年,是由首席研究员Michael W.Weiner医学博士领导的公私合作伙伴关系。ADNI的主要目标是测试系列MRI、PET、其他生物标志物以及临床和神经心理学评估是否可以结合起来测量MCI和早期AD的进展。考虑到对临床前AD的关注,本研究纳入了49名具有结构MRI和rs-fMRI数据的认知未受损个体。另外106名(质量控制后100名)MCI或痴呆患者以及结构MRI和rs功能磁共振成像数据被纳入事后分析,以验证认知受损sAD患者的模型。1000功能连接体项目(剑桥网站)--FCP剑桥。1000功能性连接体项目(FCP)是一项大型计划,它从全球招募的认知未受损成年人(33个站点)收集功能数据,并使其公开,以促进大脑功能的发现科学。我们使用了剑桥巴克纳大学的大型数据集,其中包括198名年龄在18岁至30岁之间的受试者,所有受试者均在剑桥网站收集。国际大脑定位联合会--ICBM。数据集作为1000-FCP储存库的一部分公开提供(见上文;详情另见参考文献)。该数据集由86名19至95岁认知正常的老年人组成,他们在同一地点接受了结构MRI和rs功能磁共振成像(加拿大蒙特利尔神经研究所)。为了建立大脑年龄模型,参与者被分为训练集、验证集和测试集。为了从我们的数据中得出“健康”大脑老化的最准确模型,来自不同队列的认知未受损个体被随机分配到训练集中,除非他们的基因状态可用(DIAN、PREVENT-AD和ADNI),在这种情况下,训练集中只包括没有AD遗传易感性的个体;其余数据(包括AD风险增加的个体)分配给测试集。因此,来自DIAN的突变非携带者(~80%的DIAN非携带者,随机选择)与来自FCP剑桥的ADNI APOE4非携带者,以及从CamCAN随机选择的~80%的认知未受损个体一起被分配到训练集中。虽然PREVENTAD队列的sAD风险增加,但该队列中的一些个体(~10%)被分配到训练集中,以使模型暴露于该站点的特征。这些个体是从APOE4非携带者的子样本中随机选择的(两名APOE4携带者因错误而被纳入训练集中除外)。ICBM被用作健康个体的独立样本,以评估脑年龄模型对其他数据集(验证集)的普遍性。最后,测试集包括我们感兴趣的人群(DIAN突变携带者,大多数PREVENT-AD参与者)和其他队列中剩余的无症状个体(剩余约20%的DIAN突变非携带者和CamCAN参与者,以及ADNI APOE4携带者)。为了避免多中心效应,所有功能图像均在实验室(由APB)采用完全相同的方法和处理步骤进行处理。预处理后剩余被试:每个队列中保留的数据百分比见补充表1。补充表1,每个队列中静息态功能磁共振扫描保留的数据百分比
总体而言,266名个体(16名DIAN、60名PREVENT-AD、130名CamCAN、4名ADNI、1名FCP Cambridge和39名ICBM)以及6名ADNI患者(包括在二次分析中)因未达到预处理标准或处理后数据不足而被舍弃。从与Power和Petersen功能图谱相对应的272个区域中提取平均粗体信号,其中添加了边缘系统的关键区域。从所有图像中排除标记为“不确定”的区域,或任何一幅图像中信号较弱或不存在的区域,从而产生238个总区域。对于每个受试者,使用这些区域的BOLD活动时间序列构建238×238 Pearson相关矩阵,然后进行Fisher Z变换。如前所述,使用平均回归(MR)技术进一步缓解了运动相关噪声。简而言之,计算训练数据中每个受试者的相关矩阵上对角线内所有相关值的平均值。在这些跨受试者平均值和相关矩阵每个元素的跨受试者值之间生成线性拟合,从而创建与矩阵每个元素相关联的斜率和截距项。在相关矩阵的每个元素中使用的最终值等于MR模型拟合与原始相关值之间的残差。重要的是,MR模型仅使用训练数据创建。对于每个受试者,基于MATLAB使用大脑连接性工具箱从相关矩阵中提取26个基于其量化全脑连接能力的特征。如果适用,计算加权和未加权指标。选择图度量是因为它们优于直接在矩阵加权边上训练的模型。在未加权度量的情况下,相关矩阵在5%链路密度下进行阈值化,这确保只有前5%的最强相关值被计算为矩阵中的连接。26个度量中只有5个使用二值化矩阵,而在这5个度量中,只有一个保留在最终模型中(即加权模块化系数)。为每个图度量提取一个全局值。在为每个区域输出度量的情况下(例如,子图中心性),log值的中位数用作全局估计。小世界性和恢复力属性未包含在工具箱中,但均显示为年龄的有力指标,按照之前确定的方法进行计算(详情见补充方法)。简单地说,小世界属性计算为相关矩阵的平均聚类系数除以具有相同节点边缘计数的随机网络的平均聚类系数,再除以随机网络的平均效率除以相关矩阵的平均效率。弹性网络G被定义为网络丢失属性P必须删除的相对边数,是网络对目标攻击或随机攻击鲁棒性的度量。这里,弹性计算为对数度分布的斜率。如果受试者的图形度量值超出训练集组平均值5个标准差,则完全从分析中删除。培训组共有15人排除。迭代不同模型的一般过程包括在训练数据中进行5折交叉验证,以及使用独立的外部验证数据集进行第二次验证。在此验证集上预测年龄误差最小的模型作为最终模式的候选模型。一旦确定了最终模型,我们的假设就在测试集上进行了测试。重要的是,测试集由未用于创建、优化或验证模型的未知数据组成。在模型被认为是最终的并准备好进行假设检验后,模型和假设均未被修改。首先,为了减少模型的输入数量,我们搜索最可靠的年龄预测特征。为此,将训练集数据输入到支持向量机(SVM)和回归树集成模型中,以估计哪些图形度量对预测年龄最重要。对于SVM模型,通过减去训练组的平均值并除以标准偏差,对特征(即26个度量)进行标准化。支持向量机采用线性核函数和贝叶斯优化岭正则化实现。对于集成方法,不建议进行特征标准化,因此使用未标准化的26个度量作为输入。fitrensemble函数用于超参数的贝叶斯优化,包括方法(Bag或LSBoost)、学习周期数和学习率。在这两个模型中,实际的年龄是响应向量,参数优化以最小5折交叉验证损失确定。特征选择不是交叉验证的一部分。然后,根据SVM权重和集成模型重要性的顺序(即,对应于最重要模型的最高权重)分别对特征进行排序。集合模型中的重要性是使用predictor重要性函数确定的,该函数等于由于每个预测器上的分裂而导致的均方误差变化的总和除以分支节点的数量。然后使用两个模型的平均排名来确定每个指标的总体重要性。在第二步中,我们的目标是创建一个需要尽可能少的特征数量的精确模型。我们使用训练数据生成神经网络模型,并使用验证集评估其准确性。更具体地说,通过:(i)使用训练集生成不同的模型,每个模型在用作输入和网络复杂性的特征数量上有所不同,以及(ii)将每个模型应用于验证集(独立数据集/站点),以评估哪一个模型具有更好的泛化性,从而优化神经网络(即,避免过度拟合,并在独立集上给出更好的预测)。通过减去训练组的平均值并除以训练组的标准偏差,对训练集和验证集的特征进行标准化。网络模型有5-25个输入特征,增量为5,根据其重要性输入,如前所述(见上文)。通过应用相同的特征增量过程,但以随机顺序输入特征,也测试了空模型。每个特征只输入一次,作为测试的每个神经网络结构的输入,并且在模型迭代过程中输入保持不变;较复杂模型的特征总是包含较简单模型的特征。该网络的体系结构还通过不同数量的隐藏层(1或2)和隐藏层中的单元数量(2、5、7或10)进行了测试。年龄建模的训练数据使用fitnet函数与贝叶斯正则化反向传播。模型精度最终由验证数据上实际和预测年龄之间的均方根误差(rmse)确定,较低的rmse反映较高的精度。因为神经网络单元是用随机值初始化的,所以每次测量模型误差时,rmse都会略有变化。因此,最佳模型由最低的rmse确定,在三次迭代中取平均值。一旦确定了最精确的模型,就将其应用于看不见的数据(测试集)。为了研究临床前AD患者大脑老化的特异性,我们通过从预测的大脑年龄(模型输出)中减去实际年龄,计算了测试集中DIAN和PREVENT-AD参与者的预测年龄差异,如前所述。我们特别感兴趣的是AD相关基因的影响,这些基因要么与ADAD(常染色体显性AD)有关,要么增加sAD的风险。在测试集中,我们比较了(1)突变非携带者和来自DIAN的突变携带者,以及(2)APOE4携带者和非携带者在PREVENT-AD中的预测年龄差异(即PAD)。我们也有兴趣进一步了解Aβ累积对无症状个体功能性脑老化的影响。为此,我们通过比较Aβ阳性和Aβ阴性个体(二分法变量)以及评估PAD和Aβ负荷(连续变量)之间的相关性,评估了DIAN和PREVENT-AD队列中通过PET测量的Aβ沉积对PAD(预测年龄差异)的影响。所有分析均按年龄进行控制。进行探索性分析以评估PAD(预测年龄差异)与估计发病年份(EYO)之间的相关性。最后,我们通过使用一般线性模型将认知未受损的ADNI参与者(测试集中的15名APOE4携带者)与100名患有MCI或痴呆的ADNI参与者的子集进行比较,并控制年龄,验证了我们的模型捕捉了患有认知障碍的sAD患者的晚期脑老化。考虑到对照组的样本量较小,还使用非参数检验(Mann–Whitney)。使用科学统计软件包(SPSS)进行分析,统计显著性设置为p<0.05。
把数据划分为训练集、验证集和测试集。我们收集了1624名18岁至94岁之间认知未受损的参与者的静息态功能磁共振成像数据,这些数据由显性遗传性阿尔茨海默病网络(DIAN)、阿尔茨海默病队列实验或新疗法的症状前评估(PREVENT-AD)、剑桥老龄和神经科学中心(CamCAN)、1000个功能性连接体项目剑桥站点(FCPCambridge)、阿尔茨海默病神经成像倡议(ADNI)和国际脑成像联盟(ICBM)队列提供,以建立“脑年龄”预测模型(表1)。考虑到我们对AD临床前阶段的关注,轻度认知障碍(MCI)或AD痴呆患者被排除在主要分析之外。在二次分析中,我们使用我们的功能预测模型测试了患有sAD的认知受损个体是否能证明大脑老化加速,该模型仅建立在认知未受损个体的基础上。经过预处理和质量控制后,1340名认知未受损的个体留作分析。这些被分为773人的训练集(涵盖用于构建预测模型的大型多队列数据集)、验证集(来自ICBM的46人的独立寿命数据集,用于测试所开发模型的普遍性并选择最终模型)和一个多队列测试集(125名DIAN突变携带者和29名无突变者,256名被认为具有sAD遗传风险的PREVENT-AD个体,96名来自CamCAN,15名来自ADNI的认知正常个体)。对所有个体采用统一的预处理流程,根据其量化全脑连接性的能力选择26个图论指标,并从每个参与者的相关矩阵中提取(详情见材料和方法)。更多细节如表1和图1所示。
a,研究中包括了涵盖整个生命周期的多个队列。它们被分成训练集和验证集,都用于开发预测脑年龄模型,以及应用我们模型的测试集。b,所有参与者都进行静息态功能磁共振成像并进行统一方法处理。功能连接矩阵是从 Power 图谱中生成的,从中计算特征。特征是我们大脑年龄模型的输入,因此所有可能的特征都是有意义的。c,建立模型的第一步是在我们的训练集中对不同的特征从与老化最相关到最不相关进行排序,使用支持向量机和回归树集成算法确定模型输入的重要性顺序。然后对神经网络进行测试,以确定最佳的大脑年龄模型。对不同的体系结构进行了测试,并选择最适合于验证集的训练集中应用的模型作为最终模型(见图2)d,该模型应用于遗漏的测试集,我们的兴趣度量是预测年龄差异(PAD)。Mut−: 突变非携带者,Mut+:突变携带者,MRI:磁共振成像,PAD:预测年龄差异。首先,为了减少模型的特征输入数量,我们搜索最可靠地预测年龄的特征。为此,在支持向量机(SVM)和回归树集成模型中并行输入训练集数据,以识别具有最高权重的特征。支持向量机和决策树中预测的年龄的均方根误差(rmse)为16.45和16.08。然后,根据SVM权重和集成模型重要性的顺序(即,对应于最重要模型的最高权重)分别对特征进行排序。我们使用两个模型的平均等级来确定每个指标的总体重要性,如图2a所示。特征等级决定了哪些指标将被用作后续神经网络模型的输入,以建立我们的预测性脑年龄模型。在构建了复杂度不断增加的不同神经网络后,我们选择了最佳的神经网络体系结构,这些神经网络的输入特征(5、10、15、20或25个最重要的特征,如前所述)、隐藏层和隐藏层单元的数量各不相同。重要的是,对于每个测试的神经网络架构,每个特征只输入一次作为输入,并且在模型的迭代过程中,输入保持不变,因此更复杂模型的特征始终包括更简单模型的特征。我们使用三次测定的rmse的平均来评估每个模型的性能。不同的神经网络分别应用于训练集和验证集(图2b)。为了测试指标排序的相关性,我们还评估了随机指标时的神经网络在训练数据上的性能(图2b,右)并将其与基于排序指标创建的模型进行比较(图2b,左)。结果表明,当使用SVM权重和集合特征重要性对特征进行排序时,神经网络的性能更好,至少在更简单的模型中是如此。为我们的大脑年龄预测模型选择最佳的神经网络结构,我们使用训练集生成不同的模型,并评估其中哪一个在验证集中具有最佳的泛化性。因此,验证集帮助我们确定最佳的年龄预测和良好的泛化性之间的最佳平衡。一般来说,增加模型复杂性(更多的特性和隐藏层/单元)可以提高训练集中的性能(图2b,左)。然而,正如预期的那样,过多的复杂性导致了过度拟合,训练集的性能得到了改善,从而导致验证集的拟合较差(图2b,中)。在验证集中产生最低rmse的模型(3次迭代的平均rmse=13.89),经过10个输入(10个最重要指标,图2a)和2个隐藏层(第一层5个单元,第二层2个单元)。该特定模型的性能与在训练集中获得的模型相似(3次迭代的平均rmse=13.75)。因此,该模型被应用于剩余的未知数据(测试集),以测试遗传或AD病理是否明显加速了功能性脑老化。子图中心性、聚类/模块化系数和小世界性属性是选定的特征(图2a,10个首要指标)。作为参考,10个选定指标的协方差矩阵作为补充材料提供(补充材料图1)。
补充图1:用作神经网络输入的10个特征之间的皮尔逊相关性。
如您对脑影像机器学习感兴趣,请点击以下链接了解(可添加微信号siyingyxf或18983979082咨询,另思影提供免费文献下载服务,如需要也可添加此微信号入群):
第十九届脑影像机器学习班(上海,11.23-28)
第十届任务态功能磁共振数据处理班(上海,11.2-7)
第四十九届脑影像基础班(上海,11.16-21)
第十届磁共振ASL数据处理班(上海,11.29-12.2)
第二十五届脑网络数据处理班(上海,12.3-8)
第一届脑影像机器学习提高班(上海,12.15-19)
第四届DWI数据处理提高班(上海,12.22-27)
第十届小动物脑影像数据处理班(上海,21.12.28-22.1.2)
北京:
第十六届脑影像结构班(北京,11.11-16)
第五十一届脑影像基础班(北京,11.25-30)
第二十一届DTI数据处理班(北京,12.2-7)
第十一届任务态功能磁共振数据处理班(北京,12.15-20)
第五十二届磁共振脑影像基础班(北京,12.21-26)
第四届脑网络数据处理提高班(南京,11.9-14)
第二届任务态功能磁共振提高班(南京,11.30-12.5)
数据处理业务介绍:
我们展示了每个数据集实际年龄和模型预测的大脑之间的联系(图2c)。正如预期,在训练集中预测年龄和实际年龄相关(R2= 0.53,p< 0.0001; rmse =14.01, mean absolute error [mae] = 11.00;图2c,左),验证集中(R2=0.49, p< 0.0001;rmse =13.84; mae= 11.90; 图 2c 中间)。值得注意的是,神经网络模型优于我们在特征排序步骤中使用的简单模型(SVM的rmse=16.45,决策树的rmse=16.45)。重要的是,模型也可以根据脑功能特征在测试集中预测出实际年龄(R2= 0.36, p< 0.0001; rmse = 13.24; mae= 11.58; 图2c 右)。值得注意的是,将数据限制在 CamCAN 队列分析时也是如此,该队列被视为代表健康年龄的数据集(R2= 0.26; p< 0.001; rmse = 16.70;mae= 14.32)。为了评估临床前AD患者的功能性脑老化特征,并评估遗传决定因素/风险和Aβ病理是否与加速脑老化有关,我们计算了预测的年龄差异或PAD(预测年龄差异)(图1d)。PAD(预测年龄差异)为测试集中每个参与者的预测大脑年龄减去实际年龄。由于可能存在中心点/队列差异,不应单独解释PAD偏离,因此,我们仅在队列内解释组间比较。在测试集中分析DIAN(图3a-d)和PREVENT-AD(图3e,f)(表2)。我们测试了易患 AD 的基因,无论是 ADAD 突变携带者还是更广泛的 sAD 家族风险,是否与加速脑老化有关。为此,我们比较了来自DIAN的突变携带者与非携带者之间的PAD(预测年龄差异),以及来自PREVENT-AD的APOEε4携带者与非携带者之间的PAD。考虑到模型高估年轻年龄和低估老年年龄的趋势,所有后续分析均按年龄顺序进行控制。该模型对突变携带者的预测比他们的实际年龄高(即阳性PAD=8.19岁),而非突变携带者低(即阴性PAD=−3.54年;F=4.88,p=0.03;表3和图3a,b)。总的来说,PREVENT-AD队列中的预测年龄比实际年龄高出了5岁左右(图3e)。但 APOE ε4 状态与 PAD不相关(F<1 ; p=0.49,表 3 and 图 3f)。
a,SVM模型权重(y轴)和决策树特征重要性(x轴)的散点图。模型权重是绝对值,并进行归一化,使1表示最高重要性。数据点旁边的数字表示它们的排名(即,1=SVM和决策树集成模型之间的最高平均排名;橙色点对应前10个特征,蓝色点代表排名较低的特征)。
b,不同神经网络模型的均方根误差,输入根据训练集(左)和验证集(中)的等级排序。在模型的3次迭代中取平均值。用随机排列的输入训练的神经网络作为我们的空模型(右)。x轴表示模型的输入数量(图形度量的数量),而y轴表示网络架构。例如,5表示包含5个单位的1个隐藏层,52表示包含2个隐藏层,第一个包含5个单位,第二个包含2个单位。深色(蓝色)表示精度较高,而浅色(黄色)表示精度较低。识别在验证集(最低rmse)中提供更好泛化性的模型的红方块包含2个隐藏层,分别为5和2个单元,并使用排名最高的10个特征作为输入。在随机排列的输入(空模型,灰色平方)上训练的相同神经网络提供较低的精度。C,跨数据集的大脑年龄模型性能。在训练(n=773)、验证(n=46)和测试(n=521)集合中表示按时间顺序排列的年龄(x轴)和神经网络预测的年龄(y轴)之间的相关性。统计值(c)由Pearson相关性(双侧检验,无调整)得出。源数据作为源数据文件提供。
SVM:支持向量机,rmse:均方根误差,mae:平均绝对误差。
表2,DIAN和PREVENT-AD测试集数据特征。
表3,模型根据 DIAN 和 PREVENT-AD 队列中存在的基因突变/风险和 Aβ 病理的预测(仅测试集)
鉴于 Aβ 沉积在导致 AD 痴呆的级联事件中的重要性,我们研究了 Aβ 负荷(burden)是否与功能性脑老化有关。我们评估了通过 PET 测量的 Aβ 沉积对 DIAN 和 PREVENT-AD 队列中 PAD (预测年龄差异)的影响。在DIAN和PREVENT-AD中分别使用11C-PIB和18F-NAV4694获得β-PET,并根据各自的处理确定每个队列的Aβ负荷(有关Aβ测量的详细信息,请参见方法部分)。通过比较Aβ阳性和Aβ阴性个体,我们评估了Aβ负荷对功能性脑老化的影响。我们还通过评估PAD和Aβ负荷之间的偏相关,探讨了Aβ作为连续变量可能产生的影响。所有分析均按年龄进行控制。在DIAN,我们发现了Aβ对PAD(预测年龄差异)的分级效应。与非携带者组相比,在Aβ阳性突变携带者中观察到更高的PAD(F=6.9,p=0.02; 图3c)。然而,Aβ阴性携带者的PAD仅略高于非携带者(F=2.73,p=0.10;图3c)。DIAN Aβ阳性和Aβ阴性突变携带者之间没有显着差异(F=1.93,p=0.17;图3c,表3)。Pearson 相关性表明,脑老化加速与整个 DIAN 队列中纤维状 Aβ 负荷增加有关(r140=0.18,p=0.04;图 3d),当分析仅限于突变携带者时,这一发现不再显著( r111= 0.14,p= 0.14)。
图3,DIAN和PREVENT-AD的年龄预测差异。DIAN受试者年龄与预测年龄的密度图(n=154)。(a),常染色体显性突变携带者(n=125)与非携带者(n=29)相比,大脑年龄被高估;(b),突变携带者的高估部分归因于Aβ,突变非携带者(n=29)和Aβ突变携带者(n=39)之间仅存在差异(Aβ− 突变携带者[n=75]与其他组无差异);(c),以及整个队列(n=154)中Aβ负荷与预测年龄差异之间的相关性;(d),浅色(黄色)代表DIAN突变非携带者,深色(橙色)代表DIAN突变携带者。PREVENT-AD(n=256)试验组受试者年龄与预测年龄的密度图;(d),在有散发性阿尔茨海默病风险的个体中,无论APOEε4基因型如何,大脑年龄都被高估(e),浅色代表PREVENT-AD APOEε4非载体(n=147),深色(深橙色)代表PREVENT-AD APOEε4载体(n=108)。对于b、c和f,显示了四分位范围(第25个百分位、中位数和第75个百分位)、细线(表示上、下四分位最小值之外变化的线)和单个点。对于 d,阴影(灰色)区域表示置信区间 (95%)。统计值来自一般线性模型 (b, c, f) 或部分 Pearson 相关性。在PREVENT-AD中,在64名接受AβPET成像(仅测试集)的患者中,50名为Aβ阴性,14名为Aβ阳性(表3)。无论是从Aβ阳性率(F<1;p=0.33)还是Aβ负荷(r=0.12;p=0.35)来看,PAD与Aβ无关。将PET和静息态功能磁共振成像评估之间的延迟作为一个协变量,得出了类似的结果(F<1;使用Aβ状态,p=0.36;使用r=0.12;对于与Aβ负荷的部分相关性,p=0.37)。在补充分析中,我们探讨了 PAD 与估计的症状发作年数 (EYO) 之间的相关性。EYO 已被广泛用作 DIAN 中疾病进展的估计,并且它与具有散发性 AD 父母史的个体的淀粉样蛋白病理有关。该指数计算为出现症状时父母年龄与参与者实际年龄之间的差异,估计每个人与症状出现的接近程度(详见补充方法)。在 PREVENT-AD 中发现 EYO 和 PAD 之间存在弱但正相关(r=0.13,p=0.05),因此 PAD (预测年龄差异)较高的个体往往也更接近他们的预期发病年龄。在 DIAN 突变携带者(r=-0.13,p=0.16)或非携带者(r=-0.23,p=0.23)中没有发现这种关联。最后,我们进行了额外的进一步分析,以测试有sAD症状的个体(MCI和痴呆)是否比有sAD风险的无症状个体(APOEε4携带者)具有更高的PAD(预测年龄差异)。该分析并非最初计划的,仅在ADNI数据集的一小部分样本中进行(来自测试集的15名无症状APOEε4携带者和100名有症状的个体)。研究结果确实表明,与有sAD风险的无症状个体相比,认知障碍个体的PAD有所增加(使用参数,F=2.85,p=0.047,或非参数Mann-Whitney-U=965,p=0.04)。有人提出,概念上生物老化的变化可以解释人们老化方式的个体差异。结合更大更可用的数据集,机器学习方法可以提高我们对大脑功能的理解,以及我们根据大脑特性预测健康轨迹的能力。先前的大脑老化模型主要是由大脑结构的特征决定的。研究发现,MCI和AD痴呆患者的大脑结构加速老化。然而,功能性脑异常通常在AD的结构变化之前就可检测到,后者通常更接近临床症状的表达。在这里,我们开发了一个模型,可以明显预测整个成人成长期间(18-94岁)的大脑年龄。该模型依赖于由rs-fMRI构建的图的拓扑性质,并证明了利用网络整合和分离的全局度量从rs-fMRI预测脑年龄的可行性。将我们的预测功能模型应用于DIAN队列中的ADAD(常染色体显性AD),我们观察到临床前ADAD患者的大脑老化明显加快。这种关联在有PET诊断表明Aβ沉积的个体中尤其明显。在sAD风险升高的个体(预防AD队列)中,APOEε4和Aβ均与加速大脑老化无关。然而,接近预期症状出现年龄的无症状个体往往表现出大脑加速老化。后一个观察结果得到了以下观察结果的证实:与无症状危险个体相比,有症状的sAD个体表现出加速的大脑老化(ADNI队列,二次分析)。我们在来自不同队列和地点的参与者中开发了预测模型,并在独立的单中心数据集中验证了其可泛化性。当优化模型(外部)可泛化性时,无疑会降低(内部)准确性,但这一外部验证步骤是这项工作的主要优势。虽然规模不大,但验证集代表了一个完全独立的数据集,涵盖了整个成年阶段。虽然我们不能排除较大的多中心验证队列可能导致选择稍微不同的网络体系结构的可能性,但我们注意到我们的模型的rmse在验证和测试集之间非常相似。重要的是,训练和验证过程中从未使用过测试集。此外,在假设得到检验后,模型没有进一步修改,即:假设只使用(训练和验证工作中)看起来是最优的模型测试一次。这种方法确保了我们关于症状前AD大脑老化的结果与模型的构建方式无关。为了评估大脑中的信息整合,我们在应用大脑特征的同时依赖于整体大脑功能。这种方法提供了一个大脑功能的整体视图,之前已经证明,大脑功能会随着年龄的增长和AD而变化。图论的优点是它量化和简化了动态系统的许多“运动部分”,因为每个连接都是由它与所有其他连接的关系来定义的。我们还使用特征选择作为简化最终模型的中间步骤。我们认为,我们使用图论和特征选择的方法是朝着复杂模型可解释性的正确方向迈出的一步。我们发现,与随机选择的特征相比,这些算法选择的最重要的10个特征在我们最终的神经网络模型中提供了更低的误差。值得注意的是,使用单个功能连接作为输入的模型也是可能的,但此类模型已被证明需要多个45或100个功能连接,其相互关系尚未定义。与结构预测模型相比,以往的基于rs-fMRI数据的建模方法具有更高的误差。这些观察结果可能部分归因于rs功能磁共振成像数据的已知特征。与结构数据相比,此类数据通常噪音更大,经历的动态变化更大,并且可能对多中心效应更敏感。尽管存在这些困难,我们还是试图从rs功能磁共振成像中得出我们的大脑年龄模型,因为这种模式似乎更适合于AD临床前阶段的研究。大量文献表明,连接中断出现在sAD和“正常”衰老过程的早期。此外,与之前的研究相比,在多个队列中训练、验证和测试我们的预测模型也增加了我们模型的误差。然而,从逻辑上讲,包含来自不同中心的数据应该可以提高模型的泛化性,这是将模型应用于来自不同队列的新数据时的一个关键优势。最后也是重要的是,大脑年龄模型往往高估年轻人的年龄,而低估老年人的年龄。而一些研究人员在他们的模型中应用了年龄偏差校正程序,我们展示了未经调整的模型,并在我们的PAD分析中使用了实际年龄作为干扰变量,而不是在PAD计算之前应用这种校正。总之,虽然我们认识到我们的模型的误差高于大多数以前的大脑年龄模型,但它是从rs功能磁共振成像数据得出的,没有应用年龄偏差校正来测试模型的准确性,我们认为它比以前的模型更具普遍性。关键的是,它似乎对这类感兴趣的问题也很敏感。将我们的模型应用于AD,我们发现显性遗传性AD的临床前阶段个体大脑功能加速老化。ADAD被广泛认为是由aβ产生过多引起的疾病,对ADAD的研究表明,突变携带者中的生物标记物,如CSF-aβ,早在症状出现前25年就开始发生变化。随后通过PET成像测量到纤维状Aβ沉积的累积,以及脑脊液中tau浓度的变化和脑萎缩。后来的变化包括葡萄糖代谢减退、间歇性记忆衰退和整体认知能力下降。然而,在这种疾病中使用rs功能磁共振成像的研究相对较少,并且考虑了整个ADAD谱系。其中有研究比较无症状突变携带者和非携带者,其中有研究比较了无症状突变携带者和非携带者,发现无症状携带者的默认模式网络功能连接减少。这一发现与sAD的文献一致,表明rs功能磁共振成像的变化是该疾病最早的生物标志物之一。我们的rs-fMRI预测模型表明ADAD症状前突变携带者(DIAN)的功能性脑年龄比他们的实际年龄高出约10年(基于非携带者的发现)。仅这一观察就表明ADAD的症状前阶段伴随着大脑加速老化。Aβ负荷对加速大脑老化的相对重要性尚不清楚。当仅限于DIAN突变携带者时,未发现Aβ负荷之间存在关联,而PET成像检测到的原纤维Aβ携带者中突变携带者和非携带者之间的差异更大。因此,观察到携带者大脑加速老化可能并不完全归因于Aβ的积累。虽然Aβ通常被假设为AD神经病理学级联反应的起点,但tau被认为毒性更大,因此可能与加速老化更密切相关。ADAD中的突变基因也可能对大脑产生终身影响,而这种影响并不完全依赖于Aβ的积累。ADAD中的突变基因也可能对大脑产生终身影响,而这种影响并不完全依赖于Aβ的积累。与此观点一致,先前对来自哥伦比亚队列的 PSEN1 突变携带者的研究显示,在出现脑 Aβ 斑块积聚的证据之前,脑功能发生了早期变化。最后,我们不能排除某些 Aβ 阴性个体实际上是 Aβ 蓄积的可能性,或者存在无法通过 PET 检测到的其他形式的 Aβ。似乎很清楚的是,AD基因突变会影响临床前ADAD患者的大脑功能特性。推动大脑加速老化的确切机制还需要进一步研究。在调查具有sAD家族史(预防-AD)个体的PAD特征时,我们没有发现载脂蛋白Eε4携带者和非携带者之间的差异,也没有发现与aβ负荷的相关性。这些发现并不一定与大量文献相矛盾,这些文献表明载脂蛋白Eε4状态、Aβ和rs功能磁共振成像之间存在关联。相反,它们似乎表明我们正在捕获不同的发现。虽然先前的研究测试了这两个因素对rs-fMRI指标的直接影响,但我们测试了这些AD风险因素与rs-fMRI得出的生物老化指标之间的关联。虽然我们没有发现Aβ与PAD之间存在关联,但我们确实观察到EYO(估计发病年份)与PAD(预测年龄差异)之间存在关联,因此,与其他人相比,更接近父母发病年龄的预防性AD参与者的预测脑年龄更大。在同一队列中,EYO以前曾与模仿AD痴呆特征的大脑变化的功能变化相关联。虽然我们的重点是该疾病的临床前阶段,但我们使用一小部分ADNI患者的rs功能磁共振数据进行了进一步分析。我们发现有症状的sAD(MCI或痴呆)患者与其他无症状但sAD风险增加的患者相比,功能性衰老加速(来自我们测试集中的APOEε4参与者)。这些额外的分析表明,临床sAD患者的功能性脑老化加速,并进一步证实了我们的脑老化模型的有效性。几个局限性应该提到。这些都与模型和用来检验我们假设的队列有关:首先,在模型用于测试我们的假设(我们方法的主要优点)后,我们选择不更新或调整模型,这给我们在构建模型时留下了一些小错误(例如,训练集中包括两个PREVENT-ADAPOEε4载体)。尽管这些疏忽不太可能影响到整个最终结果(APOEε4携带者来自没有基因型数据的其他队列,可能包括在训练集中),然而,它们对模型的完整性构成了很小的威胁。其次,在确定年龄预测图指标时,我们也不能排除共线性的可能影响。然而,支持向量机和决策树在很大程度上是一致的,而且多重共线性不太可能对这两种截然不同的算法产生相同的影响。此外,虽然我们努力提高我们的预测模型的泛化性,但本研究中的大多数参与者都是白人,需要增加年龄和 AD 队列的多样性。在PREVENT-AD队列中,功能性脑年龄也超过了实际年龄,而在其他类似年龄的中心/队列中,情况并非如此。虽然很容易将这些结果解释为参与者家族史的结果,但我们认为这在很大程度上反映了多中心效应。为了尽量减少这种可能的中心点效应,我们利用了来自各种队列和中心点的数据,在完全独立的验证集(新位点)上验证了模型,并对所有数据应用了类似的处理方法。没有采用进一步的调整程序。多中心效应本质上与中心的不同年龄构成有关(或同龄人,见图1),因此,通过多中心点进行协调将消除参与者之间的年龄差异。虽然多中心效应的可能性限制了我们在不同队列之间进行直接比较的能力,但它不能合理地影响我们主要结果的完整性,这是队列内比较的结果。与DIAN的数据相比,从PREVENT-AD数据推断的一个明显限制是,我们无法知道哪些参与者以后会发展为AD痴呆症。在PREVENT-ADAPOEε4携带者(与非携带者相比)中缺乏加速大脑老化的证据可能只反映了一个已知事实,即并非所有APOEε4携带者都会发展为AD痴呆(即,处于疾病的临床前阶段),而一些非携带者会发展为该疾病。在测试集中具有Aβ病理学的预防性AD参与者的子样本也相对较小,这可能会限制推断。
补充图2,使用原始图度量作为输入(A)的支持向量机模型的年龄预测,以及使用ComBat的协调图度量作为输入的支持向量机模型的年龄预测(B)总之,使用 rs-fMRI 特征,我们开发了一个模型,可以预测整个人类寿命的大脑年龄。应用该模型在临床前 AD 的背景下预测脑衰老表明 ADAD 的症状前阶段的特征是功能性脑衰老加速。类似的关系是否适用于临床前 sAD 以及 AD 加速大脑衰老的潜在机制需要进一步评估。
如需原文及补充材料请添加思影科技微信:siyingyxf或18983979082获取,如对思影课程及服务感兴趣也可加此微信号咨询。另思影提供免费文献下载服务,如需要也可添加此微信号入群,原文也会在群里发布,如果我们的解读对您的研究有帮助,请给个转发支持以及右下角点击一下在看,是对思影科技的支持,感谢!
欢迎浏览思影的数据处理业务及课程介绍。(请直接点击下文文字即可浏览思影科技所有的课程,欢迎添加微信号siyingyxf或18983979082进行咨询,所有课程均开放报名,报名后我们会第一时间联系,并保留已报名学员名额):
核磁:
第十九届脑影像机器学习班(上海,11.23-28)
第十届任务态功能磁共振数据处理班(上海,11.2-7)
第四十九届脑影像基础班(上海,11.16-21)
第十届磁共振ASL数据处理班(上海,11.29-12.2)
第二十五届脑网络数据处理班(上海,12.3-8)
第一届脑影像机器学习提高班(上海,12.15-19)
第四届DWI数据处理提高班(上海,12.22-27)
第十届小动物脑影像数据处理班(上海,21.12.28-22.1.2)
北京:
第十六届脑影像结构班(北京,11.11-16)
第五十一届脑影像基础班(北京,11.25-30)
第二十一届DTI数据处理班(北京,12.2-7)
第十一届任务态功能磁共振数据处理班(北京,12.15-20)
第五十二届磁共振脑影像基础班(北京,12.21-26)
第二十届脑影像机器学习班(重庆,12.21-26)
第四届脑网络数据处理提高班(南京,11.9-14)
第二届任务态功能磁共振提高班(南京,11.30-12.5)
脑电及红外、眼动:
北京:
第三十三届脑电中级班(北京,11.3-8)
第十六届近红外脑功能数据处理班(北京,10.28-11.2)
第四届脑电机器学习班(A版本,北京,11.17-22)
第一届R语言统计班(北京,12.8-12)
第二届脑电机器学习数据处理班(B版本,北京,12.28-1.2)
第十一届眼动数据处理班(上海,11.9-14)
第二十一届脑电数据处理入门班(上海,12.9-14)
重庆:
第二十届脑电入门班(重庆,11.8-13)
第十八届近红外脑功能数据处理班(重庆,12.7-12)
南京:
第十七届近红外脑功能班(南京,11.19-24)
数据处理业务介绍:
思影科技近红外脑功能数据处理服务