科研 | Arthritis Rheumatol.:血清蛋白组学揭示类风湿关节炎发展进程的分子特征
编译:柠檬糖,编辑:Tracy、江舜尧。
原创微文,欢迎转发转载。
在大多数已确诊的类风湿关节炎(RA)患者中,我们可以检测到一系列自身抗体,特别是针对已经被瓜氨酸化和氨甲酰化等翻译后修饰的内源性蛋白抗体,在没有症状的早期阶段,抗环瓜氨酸肽抗体(ACPA)被认为是具有诊断意义的一个重要生物标记物。对这些内源性蛋白的抗体检测有助于对早期RA疾病活动度进行预测,这也更好地推动了我们对RA临床前阶段的深入了解,有利于改善RA的预防和治疗策略。为了更准确地寻找反应RA疾病活动的特异性生物标志物,我们通过SOMAscan平台对北美原住民RA患者的一级亲属(FDR)队列进行纵向血清蛋白组学研究,发现RA高危患者血清中存在关键蛋白。在不考虑ACPA的情况下,我们检测关键蛋白的表达可以在临床前对RA进展期患者和高危患者进行区分。同时,相关网络分析表明Toll样受体2(TLR2)的激活,肿瘤坏死因子(TNF)和白介素1(IL1)的产生是RA疾病进展的关键步骤,这一研究结果表明RA临床前阶段血清蛋白的改变发生在RA症状之前,血清蛋白组学研究既可用于对RA患者进行分类,又可用于识别参与RA发展的分子途径。
论文ID
实验设计
1.建立RA患者FDR序列,检测RF和抗CCP抗体。
2.利用SOMAscan平台对RA患者FDR队列进行研究,并对临床前RA患者血清样本进行蛋白组学检测。
3.将差异表达蛋白及ACPA与RA发展进程的相关性进行比较分析。
实验结果
1. RA的发展进程与血清蛋白组学变化显著相关
图1 不同时期RA患者血清蛋白表达
A:差异表达蛋白火山图;B:JAK2、IL36A、ITIH4、PTPN1表达箱线图;C:进展期RA患者血清蛋白动力学表达和RA发病相关IL36A、ITIH4、C1R、PTPN1 随时间的变化
2. RA发病前,RA患者已出现明显的蛋白组学变化
在RA中,ACPA和类风湿因子(RF)通常用于辅助RA诊断。我们的研究目的是探索可能与RA发病机制同步的蛋白组学变化。虽然已经基于流行病学对INA RA患者高危FDR进行研究,但我们认为无论ACPA状态如何,都可以对未患RA的高危FDR进行血清蛋白组学分析来比较RA患者发病前和进展期蛋白的变化。
我们为了确认未受影响的高危患者是否会发展为RA,对进展期RA患者和对照组进行了蛋白组学比较。在这两组样本中鉴定出了669个差异表达蛋白,其中260个蛋白表达上调,409个蛋白表达下调(图2A)。在上调倍数最高的蛋白中,整合素(在本研究中为ITGA2B)可能在介导细胞免疫应答中发挥重要作用,在发病前,组蛋白H3.1 (HIST1H3A)在进展期也高表达(图2B),这表明中性粒细胞胞外陷阱的形成可能介导了免疫反应,增加患病的风险。
通过多维尺度和计算的线性距离绘制样本(见方法)显示了发病前和高危患者样本之间的差异(图2C,2D),没有任何迹象表明这些差异是由于RA即将发生引起的。我们可以看得到,k-均值聚类在进展前(聚类1 80.8%,图S3)和高风险RA患者样本(聚类2,83.7%)中都富集。此外,我们还发现,根据关节炎发病时间的不同,进展者和高危患者之间的差异表达蛋白有60%的重叠(图2E),这表明高危和进展期患者之间蛋白组学差异不仅仅是由RA发病的时间所导致的。
然后,我们利用收缩回归开发了3个模型来区分高危和进展期患者。通过检测17个蛋白(模型1,准确率100%,表S3, S4)的表达,我们区分了进展期患者和ACPA阴性患者,然后我们又通过8个蛋白的表达来区分进展期患者和ACPA阳性患者(模型2,准确率86.9%,表S4, S5)。然后,我们开发了一个由23个蛋白构成的模型,对队列中所有高危进展期患者样本进行分类(100%准确率,n=105,图S4,表S4, S6)。我们使用这个模型检测了一个验证队列(n = 34),其对进展期患者样本的分类准确率为91.2%,曲线下面积(AUC)为0.931(图3A,3B)。在所有3个模型中有2个蛋白重叠,即纤维凝胶蛋白2(FCN2)和钙网蛋白(CALR),这两个蛋白在进展期患者中表达较低(图S5)。先前在SOMAscan平台上的工作表明,在极少的样本中进行多次测量分析结果可能存在差异,但令人欣慰的是,根据Candia等人提供的资源发现前10个差异表达蛋白具有可重复性和稳定性(表S7)。
与ACPA阴性患者相比,ACPA阳性高危患者进展评分相对更高(p<0.001,图3D)。在进展为RA的远期和近期患者样本中,血清进展评分都很高(图3D),这与最初的分析一致。然后我们使用平均表达评分来描述每个蛋白的表达情况(图3E),以及RA患者血清中上调蛋白的表达情况(图3F)。我们对每个标记蛋白和RA发病时间相关性进行研究,发现表达情况存在显著差异(图S6),而使用线性回归分析发现APOA1与关节炎发生的时间显著相关(表S8)。总的来说,这些数据表明即使是在临床疾病发病前几年抽取的样本,也可以使用血清蛋白组学特征识别进展为炎症性关节炎的高危患者。
图2 进展前期和高危RA患者血清蛋白差异表达
A:进展前期和高危RA患者差异表达蛋白火山图;B:ITGA2B、HIST1H3A表达箱线图;C:所有非IA患者MDS图;D:MDS图和箱线图之间的线性距离;E:上调蛋白韦恩图
图3 区分RA进展者与高危患者的23个差异表达蛋白
A:ROC曲线下方的面积;B:95%置信区间;C、D:进展得分;E:每组差异表达蛋白相关热图;F:上调蛋白相关热图
3.网络分析显示TLR2的激活以及TNF和IL-1的产生是RA发病的关键
图4 不同病理时期RA患者血清差异表达蛋白网络
A:RA进展前期上调蛋白富集相关信号通路;B:预测上调蛋白的上游调控因子;C:RA进展前期被激活的信号通路;D:TLR2信号通路及其下游蛋白。
结论
RA发病前的潜在病理机制尚未完全明确,我们试图找出最终发展为RA与未发展为RA的个体血清中差异表达的蛋白,但是在收集样本时所有个体的临床表现均无差异。我们描述了与RA进展期发病相关的几种蛋白随时间的变化,无论ACPA状态如何,我们确定了一种血清蛋白组学特征,它可以将RA进展前与高危RA患者样本进行分类。网络分析确定了在RA进展前被激活的生物途径,这表明先天免疫反应在疾病发生之前就已经被触发。因此,通过对蛋白组数据进行纵向和横向分析,我们发现新的证据来帮助对RA临床前发病机制进行深入的了解。
已有研究表明,临床前RA的时间跨度很长,尽管RA临床前研究中存在着巨大挑战,但这对于理解发病机制、对未来疾病的高危人群进行分类以及确定潜在的预防性干预措施仍然很重要,ACPA的检测已经成为识别RA高危个体的关键生物标记物,而且我们也发现ACPA血清阳性明显增加了RA患病的风险。表位扩散、活动性增强和糖基化都发生在疾病发作前,血清细胞因子也被证明是潜在的临床前生物标记物,然而与健康对照相比,单个细胞因子的特异性较低。因此,我们在识别未来RA发展最高风险个体的能力上仍然有巨大的发展空间。
我们的研究设计有几个重要的优点。首先,我们前期对易患RA的人群进行了招募,这减少对样本进行回溯性研究可能产生的一些无法测量的偏差。其次,我们选择研究的参与者完全是由RA患者亲属来确定,而不是由关节痛等症状。临床医生和研究人员都很清楚,将单个时间点定义为“发病”是困难的。最近我们发现,ACPA血清阳性,特别是在中等滴度时,在长时间后部分会恢复到血清阴性状态。此外,我们也已经证明,RA患者ACPA的糖基化是高危个体发病前的一个关键因素。我们的蛋白组学数据为这些观察提供了一个新的观察角度,着重了解了相关机制发生的可能性,这些机制可以决定最终是否发展为RA个体。
该项研究仍存在一定的局限性。本次研究中的进展者数量相对较少,因为在招募研究对象以跟踪罕见临床状况的发展方面存在一定的困难;其次,该研究主要集中在INA RA患者的FDR上,这其中也包含了未来最有可能发展为RA的个体,这可能限制了研究结果的普遍性,因为这些人既不是FDR,也不是北美原住民,因此,这可能限制了研究结果的普遍性,但是目前已证实世界各地的RA血清阳性存在广泛的共性。
机器学习是一种新兴的工具,用于临床决策和高维数据分析,但使用这种技术生成的模型有局限性——我们的研究也不例外,特别是,机器学习存在过度拟合的问题,其结果可能无法推广。LASSO是一种收缩技术,倾向于减少过拟合,我们使用了适度的方法试图牺牲较低的精度来换取更适度的输出(较高的误差与较少的分析物数量)。SOMAscan有其固有的局限性,包括它只覆盖整个蛋白组的一小部分,虽然我们的生物标志物分类规模不大,但这些结果必须在一个不相关的队列中进行复制,以调查其普遍性。为了将血清蛋白组作为临床工具,我们需要一种测定分析物的替代方法,以确保高通量和低成本。
基于适体的蛋白组学代表了一种分析生物样本中蛋白的先进技术。这项技术利用单链寡核苷酸与高亲和力的靶标结合,同时对数百个蛋白进行定量分析;此外,它具有高度的特异性和重复性,比基于抗体的检测具有更明显的优势。我们的数据集代表了临床前RA蛋白组的首次高维半监督分析。我们还通过了一组差异表达蛋白对临床前RA与未患RA的健康高危个体进行分类,这些差异在发病前几年就很明显了,这表明它们可能为检测高危人群提供重要的新工具。在我们的模型中,与ACPA阴性个体(模型1)相比,进展者和APCA阳性个体(模型2)中包含的总蛋白更少,这表明,与ACPA阴性蛋白(区分蛋白数目较多,准确度较高)相比,ACPA阳性更难从进展期RA患者中区分出来,研究结果表明,血清是鉴别高危患者进一步发展为RA的有效工具。
众所周知,免疫耐受丧失、T细胞和B细胞之间表位扩散以及致病免疫球蛋白的修饰是RA发病前相互关联但又截然不同的病理生理特征,目前对引起这些免疫反应紊乱的原因知之甚少。网络分析表明RA临床前典型的炎症通路已被激活,这可能触发了一个关键的先天免疫反应,即通过激活TLR促进促炎细胞因子的产生,如肿瘤坏死因子(TNF)和白介素1(IL-1)。TLR作为一种先天的模式识别受体,通过识别病原相关模式分子,激活免疫系统。尽管TLR的激活和TNF通路分析表明,整合素(ITGA2B)上调可能是TLR2下游信号导致的结果,该蛋白作为凝血产物的受体,与血小板活化有关,反映了血栓形成前和促炎的状态。我们的数据表明,理解先天免疫在RA发展中的作用仍然是一个重要的研究领域。
总而言之,我们确定的蛋白生物标志物可有效预测RA发病的可能性。考虑到对RA发病前血清学变化的了解,我们有可能将其与其他生物标记物进行特异性结合,以提高我们对临床前RA的理解。我们的研究结果也为一些导致RA发展的潜在病理生理途径提供了新的见解,并指出干预措施可能会通过直接影响这些途径来降低未来疾病发展的风险。
https://pubmed.ncbi.nlm.nih.gov/32770634/