科研 | Mol. Neurodegener.:通过整合AD的多种蛋白质组鉴定到具有高可信度的候选生物标志物

编译:北越城主,编辑:Emma、江舜尧。

原创微文,欢迎转发转载。

导读

基于淀粉样蛋白级联和tau假说,不同Aβ和tau类型的蛋白质生物标志物已经在脑脊液(CSF)和血液/血浆/血清得到检测。最近,研究人员已经开始对人类样品进行无偏向性蛋白质组分析,以鉴定出新的AD生物标志物。通过整合AD中的多种蛋白质组(包括皮质,CSF和血清)来鉴定具有高可信度的候选生物标志物。通过多重串联质谱标签(TMT)方法,多维的液相色谱(LC)分级分离和高分辨率串联质谱(MS / MS)对蛋白质组进行了超覆盖分析。运用系统生物学方法对所有蛋白质组学数据集中最有前途的AD标签蛋白进行优先级排序。最后,通过酶联免疫吸附剂(ELISA)和TOMAHAQ靶向MS测定法验证了通过MS发现鉴定出的候选生物标记。结果分别从人类皮层,CSF和血清中定量了13,833、5941和4826蛋白。对20例患者进行的超深层CSF分析发现了以前报道的大多数AD生物标志物候选物,但是,其中大多数都没有统计学意义。有趣的是,AD CSF显示出大量线粒体蛋白质的明显减少,而这些线粒体蛋白质只有在我们的超深度分析中才能检测到。4个皮质和4个CSF队列蛋白质组的进一步整合突出显示了6个CSF生物标记,这些标记在至少2个独立的数据集中得到了一致的鉴定。我们还在5xFAD小鼠模型中对CSF进行了分析,以验证淀粉样变性病引起的变化,并在人和小鼠样品中发现一致的线粒体减少。总之,共有37种蛋白质作为潜在的AD信号出现在皮质,CSF和血清中,并且引人注目的是,其中59%是线粒体蛋白,强调了AD中的线粒体功能障碍。选定的生物标志物候选物通过ELISA和TOMAHAQ分析进一步验证。最后,我们通过整合所有蛋白质组学数据集对最有前途的AD标签蛋白(包括SMOC1,TAU,GFAP,SUCLG2,PRDX3和NTN1)进行了优先排序。

论文ID

原名:Integrated analysis of ultra-deep proteomes in cortex,cerebrospinal fluid and serum reveals a mitochondrial signature in Alzheimer’sdisease
译名:通过整合AD的多种蛋白质组(包括皮质、CSF和血清)鉴定到具有高可信度的候选生物标志物
期刊:Molecular Neurodegeneration
IF:9.599
发表时间:2020.07
通讯作者:Junmin Peng
通讯作者单位:美国圣犹大儿童研究医院

实验设计

实验结果

1. 皮质,CSF和血清中超深层AD蛋白质组的全面整合

为了系统地研究与AD发病机制相关的AD生物流体生物标记物,我们对10个独立的AD蛋白质组学数据集进行了全面整合分析,涵盖5个超深层发现数据集和5个深层参考数据集,来自大脑皮层,CSF和血清(表1)。皮质蛋白质组由2个发现队列和2个参考队列组成。CSF蛋白质组由1个发现队列和3个参考队列组成。这5个参考数据集来自2项关于AD的独立生物流体蛋白质组研究。通过以CSF为中心的方式进行综合分析,并为数据集分配从i到x的标签(表1,图1a)。总共,我们分析了365个AD,MCI和健康对照病例(图1a)中的17,541个蛋白(13、216个基因),代表了我们所掌握的最全面的AD蛋白质组学数据。

表1 用于生物标志物分析的人类和小鼠蛋白质组数据库

我们首先检查了来自皮层,CSF和血清的5个发现数据集的蛋白质组数据质量。通过整个蛋白质组学数据集的主成分分析看来,AD和对照样品是可以区分的(图1b)。接下来,我们检查了这些蛋白质组数据集的分析深度。通过我们新建立的管线实现了超深蛋白质组分析,该管线结合了未消耗的生物流体样品处理,多重串联质谱标签标记,广泛的二维液相色谱分离和高分辨率串联质谱(称为TMT-LC / LC-MS /MS)。结果,基于人类蛋白质图集数据库,我们的皮质蛋白质组(来自皮质数据集i和ii的13833种蛋白质)可以覆盖表达的皮质转录组的86%(图1c)。我们的CSF发现蛋白质组(数据集v中的5941个蛋白质)覆盖了参考研究1(数据集vi中的2731个蛋白质)和参考研究2(数据集viii中的2025个蛋白质)的80%和86%,而参考研究1和2仅覆盖了我们的CSF蛋白质组中有37%和29%。同样,我们将血清发现蛋白质组与最近的两项AD血清蛋白质组研究进行了比较。我们的数据集(数据集x中的4826个蛋白质)分别覆盖了两个参考数据集(560和510个蛋白质)的63%和89%,而参考数据集仅覆盖了蛋白质组的7%和9%(图1d)。考虑到两个人类血清数据集的覆盖率较低,因此我们在分析中未使用它们。总之,这些比较证实了我们分析过的蛋白质组的高质量,突出了AD组织/生物流体蛋白质组的深度覆盖。

图1 综合皮层、脑脊液和血清蛋白组数据,用于AD的生物标志物分析

2. 超深层CSF蛋白质组谱分析可确定AD中线粒体蛋白明显减少

由于技术挑战,AD CSF生物标志物已在浅层进行了广泛研究。尽管已经提出了许多生物标志物,但大多数生物标志物在实验室之间无法再现。迫切需要能够支持深度分析的新蛋白质组学技术。为了在超深蛋白质组学环境中探索新型AD生物标志物候选物,我们最近开发了一条新的深度生物流体分析管线,并将其应用于20个CSF样品的分析。总共,我们在11个AD和9个健康对照例中对5941个独特蛋白质进行了定量,错误发现率(FDR)为1%。由于血液污染,删除了三个样本异常值。通过LIMMA R软件包进行DE分析,得到355个DE CSF蛋白(log2Ratio的Z值> 2和FDR <0.05,图2a)。确定了我们的超深CSF蛋白质组先前报告的大多数AD CSF生物标志物候选物(13个中的12个),但是,除SMOC1和TGFB2外,大多数都没有统计学意义,这可能是由于我们的初步研究和/或样本量较小这些蛋白质在AD中的微小变化(图2b)。然而,即使在非常严格的阈值下(Z值> 5和FDR <0.01),我们仍然观察到68种顶级DE蛋白。值得注意的是,在68种顶级DE蛋白中,有67种是线粒体蛋白(图2b,c),其中大多数与其他蛋白紧密相关。已知这些蛋白质在支持能量代谢,线粒体生物发生,活性氧减少和mt DNA修复方面具有功能性作用(图2d)。

这种与AD相关的线粒体蛋白质减少的现象很明显,但是在先前的CSF研究中几乎没有报道。为了了解为什么以前的研究中遗漏了这些蛋白质,我们根据它们的丰度对所有定量蛋白质进行了排名,发现这些顶级的DE线粒体蛋白质以低丰度出现在CSF中,平均丰度等级为2960(图2e)。然后,我们使用不同的蛋白质组覆盖率对DE蛋白进行了系统的研究。如果覆盖范围与500种蛋白质的深度一样浅,则足以检测许多先前报道的AD生物标志物候选物,但会错过所有这些顶级线粒体DE蛋白。虽然这些线粒体蛋白中的一小部分开始以2000-3000种蛋白质的深度出现,但大多数这些蛋白却以至少4000种蛋白质的深度出现。因此,超深度分析是检测AD CSF蛋白质组中这些蛋白质变化的先决条件。总之,我们的CSF蛋白质组学分析涵盖了以前报道的大多数AD CSF生物标志物,并揭示了AD患者中明显的线粒体蛋白减少。

图2 超深层脑脊液蛋白质组分析发现AD中线粒体蛋白明显减少

3. 在独立研究中,脑脊液和皮质蛋白质组的整合发现了AD中一致的脑脊液生物标志物

为了研究与AD病理学相关的CSF蛋白变化,我们系统地整合了来自三个基于MS的独立蛋白质组分析研究的4个皮质队列和4个CSF数据集队列(图3a)。皮质蛋白质组覆盖了脑脊液中定量的大多数蛋白质(图3b)。我们对所有数据集应用了截止值(Z值> 2且FDR <0.2),发现CSF中存在1261 DE蛋白质,皮质中产生245 DE蛋白质。两种蛋白质组都改变了其中的44种(图3b-d),其中大多数显示皮质和CSF均增加(例如TGFB2,IGFBP5和SLC5A3)或皮质增加但CSF降低(例如DPYD和CSF)。S100A4,类似于Aβ42肽的表达模式。有趣的是,在我们的AD大脑皮层研究中,据报道MDK,CTHRC1和Aβ是最显着升高的蛋白质,但在小规模的CSF样本中却没有显着变化(图3c)。将这44种蛋白质以及APP和TAU叠加到STRING蛋白质-蛋白质相互作用数据库中,阐明了与淀粉样蛋白病理学和线粒体功能相关的4种蛋白质相互作用模块,而在这个小列表中没有发现与TAU相关的蛋白质相互作用模块(图3e)。值得注意的是,大多数这些模块蛋白都与淀粉样蛋白水平相关。

图3 皮质和脑脊液蛋白组的综合分析揭示了独立研究中脑脊液生物标志物在AD中的一致性

为了评估实验室中这44种DE蛋白的可靠性和可重复性,我们将CSF蛋白质组与两项独立的基于MS的CSF蛋白质组学研究进行了比较。SMOC1和C1QTNF5出现在所有三项独立研究中。OLFML3,SPON1和SLIT2在本研究和参考研究1(数据vi)中脱颖而出。GPNMB出现在本研究和参考研究2中(数据viii)(图3c,d)。据报道,所有六种蛋白质均与AD发病机理密切相关。虽然在先前的研究中已报道了SMOC1和GPNMB作为推定的CSF生物标志物,但是C1QTNF5,OLFML3,SPON1和SLIT2是新颖的候选物,它们在不同的实验室和管道中均具有可重复性(例如,耗尽的CSF与未消耗的CSF)。值得注意的是,这六种蛋白的表达水平在轻度认知障碍患者的皮质中开始升高,暗示它们有可能作为阿尔茨海默氏病的早期诊断生物标记物(图4a)。此外,我们的CSF蛋白质组图谱分析还发现了低丰度的潜在AD生物标志物,其超出了其他研究的检测范围。例如,CSF中SLC5A3,BBOX1,CAMK4和CAMKK2的丰度等级分别为3039、3040、4191和5787,所有这些都超出了先前报道的研究范围(图3d,4b)。皮质和脑脊液中CAMK4和CAMKK2的水平均降低。最后,在我们的CSF蛋白质组中还发现了HTRA1,它可能是AD的遗传危险因素以及降解ApoE4和APP的酶,是一种新型的DE蛋白(图4b)。总的来说,CSF和皮质蛋白质组的整合揭示了AD中一致的CSF生物标志物候选物。

图4 已报道的和新的AD脑脊液生物标志物候选在皮层和脑脊液蛋白体中的表达水平

4. 人类和小鼠脑脊液蛋白质组的整合确定了AD中线粒体蛋白质的持续减少

在人类和小鼠模型中保守的CSF生物标志物对于AD社区探索与AD相关的分子机制非常有价值。在这里,我们进行了蛋白质组学分析,以鉴定Ax诱导的5xFAD小鼠CSF中蛋白质的变化,其中突变APP和PSEN1过表达以产生高水平的Aβ肽。11个TMT-LC / LC-MS /MS分析(来自5xFAD的6个样品和来自年龄匹配的野生型小鼠的5个样品)可以定量分析1056个小鼠CSF蛋白,其中包含85个DE蛋白(Z值> 2和p值<0.05,图5a,b)。在这85种蛋白质中,有11种被人CSF DE蛋白覆盖(图5c)。惊人地超过这些的50%一致的DEs来自线粒体,这表明AD和5xFAD小鼠中线粒体功能异常高度保守。许多这些线粒体蛋白在AD皮质中发生了改变,其表达模式类似于Aβ42肽(即皮质增加而CSF减少),例如HADHA和CYB5R3(图5c,d)。我们还发现了C4B和SPP1,它们与小鼠CSF顶部DE蛋白之间的AD发病机理密切相关(图5b)。我们在AD皮质中检测到C4B和SPP1的增加,但在我们小的人类CSF队列中却未检测到它们的显着变化(图5e)。总之,对小鼠和人CSF的综合分析阐明了Aβ诱导的小鼠CSF蛋白变化,并揭示了人和小鼠CSF中AD中一致的线粒体疾病。

图5 人与小鼠脑脊液蛋白组的整合确认了在AD中一致的线粒体蛋白减少

5. 脑脊液,血清和皮质蛋白质组的整合表明在AD中线粒体特征一致

与脑脊液生物标志物相比,基于血液的生物标志物在一线诊断中更具前景,并且迫切需要。我们系统地比较了脑脊液,血清和皮质蛋白质组,以调查AD发病机理的特征。对6个AD和5个健康对照例进行了超深层血清分析,定量了4826种独特蛋白。由于血清样品经常被红细胞中的蛋白质污染,因此我们首先通过基于线性回归模型的方法来校正此变量,然后定义396个DE蛋白(Z值> 2,p值<0.05)。与CSF和皮质中的DE蛋白进行比较,可以得出血清和皮质中的94 DE蛋白,血清和CSF中的107 DE蛋白以及三层蛋白质组中的37种蛋白质。令人惊讶的是,这37种蛋白质中有22种是线粒体蛋白质(图6a),突显了线粒体变化是皮质,CSF和血清中最一致的AD信号。

血清中的DE分析确定了顶级DE蛋白(例如GGT1和ANO2)之间的几种AD相关变化(图6b)。例如,一项研究报道了血清GGT浓度与AD风险之间存在线性关系。有趣的是,在人和小鼠脑脊液中AD降低的6种线粒体蛋白中,有4种在AD血清中也降低了(即ALDH6A1,ETFB,SOD2和PRDX3),突出了它们作为AD生物流体特征的稳健性(图6b)。接下来,我们研究了在脑脊液和血清中差异表达的蛋白质。总共107种DE蛋白中有52种是线粒体蛋白,在血清和CSF中均显示AD水平降低(图6c)。我们进一步检查了血清和皮质中的94种DE蛋白质,发现其中大多数蛋白质在皮质中增加而在血清中减少,包括21种线粒体蛋白质(图6d),这让人联想到Aβ肽的分布方式(较高在AD病例中皮层中的含量降低,血清中含量降低。皮质中蛋白质的积累可能至少部分是由于大脑中明显的蛋白质聚集所致。确实,我们之前在AD脑中的聚集蛋白组图谱中确定了线粒体成分的沉积。有趣的是,脑中CTHRC1,GFAP和OLFM3与AD相关的蛋白质组被揭示为AD血清中的顶级DE蛋白(图6d,e)。综合起来,综合分析显示线粒体蛋白的变化是从大脑皮层传递到CSF和血清的最一致的AD信号。

图6 脑脊液、血清和皮质数据集的整合说明了在蛋白质组间AD中一致的线粒体差异特征

6. 通过顺序统计信息整合十个独立数据集的排名,可以优先考虑优先AD蛋白标签

事实证明,多维数据整合对确定核心疾病蛋白和途径具有重要意义。在这里,我们通过结合来自不同AD组织/生物流体和独立研究的数据集来扩展这个想法,以使用顺序统计和基因集富集分析(GSEA)对疾病蛋白质和途径进行排名。集成以三步方式进行。具体来说,发现队列或参考队列是分别组合的。然后将单个组织/生物流体的蛋白质组合并到皮质,CSF或血清数据集中进行排名。最后,将三个等级整合为最终等级(图7a)。SMOC1和tau蛋白排在列表的前2位,与以前的许多AD生物标记研究一致。其他蛋白质(例如GFAP,NTN1,OLFM3,NPTX2,C1QTNF5,C4B和SPP1)也显示为顶级蛋白质,这与我们目前对AD发病机理的理解相符。此外,线粒体蛋白在列表中也排名很高(例如SUCLG2,PRDX3,CPT2,HSD17B10,ALDH6A1,GATM和SOD2)(图7b)。我们通过GSEA对信号通路进行了优先排序,并在深度AD皮质研究中检测到的16条核心通路中确定了10条主要通路(FDR <0.05;图7c)。总共这10个途径可分为4个主要类别,包括线粒体功能,炎症,淀粉样蛋白和tau途径以及突触功能。最后,我们进行了两种替代验证试验,以确认MS的发现。ELISA测定法用于分析7例健康对照和7例AD病例的CSF样品,证实了AD样品中候选生物标志物GPNMB的增加(图8a,b)。由于可用的ELISA试剂盒的局限性,我们还实施了基于TOMAHAQ的靶向MS分析,以验证CSF样品中两种线粒体蛋白(AK2和PCK2)的变化。在这个目标MS中例如,将AK2和PCK2中的胰蛋白酶肽合成为内标,以指导对天然相应肽的定量(图8c)。一致地,证实在CSF AD样品中两种线粒体蛋白均被还原(图8d-f)。我们共同通过系统生物学方法确定了有前途的AD标签的优先级。这些丰富的数据资源将为AD社区将来进行大规模生物标志物验证研究奠定基础。

图7 通过顺序统计将蛋白在单个数据集中的排名进行整合,并对优先AD标签蛋白进行排序

图8 ELISA和TOMAHAQ分析验证MS发现

结论

总而言之,我们通过自己新建立的TMT-LC / LC-MS / MS平台,分别定量了人类皮层,CSF和血清中的13,833、5941和4826蛋白。我们显示了整个AD皮质,CSF和血清中许多线粒体蛋白的明显变化。通过对来自三个独立的深层蛋白质组学研究的10个AD组织和生物流体蛋白质组学数据集进行的一系列综合分析,我们揭示了许多具有高置信度的AD生物标志物候选物,不仅为选择可再现的候选物进行大规模生物标志物验证提供了丰富的数据资源,还用于探索疾病进展过程中蛋白质介导的cortex-CSF-blood联系,以揭示疾病机制和指导新型治疗策略发展的可能。

总结

1. 运用建立的TMT-LC / LC-MS / MS平台,分别定量了人类皮层,CSF和血清中的13,833、5941和4826蛋白;

2.10个独立的AD蛋白质组学数据集的全面整合分析;

3.超深度CSF蛋白质组分析,AD中线粒体蛋白显著下降;

4.CSF,皮质和血清蛋白质组整合分析;

5.两种替代实验验证蛋白质组学分析结果

原文链接: https://pubmed.ncbi.nlm.nih.gov/32711556/
(0)

相关推荐