科研 | Gut:基于血浆和血清代谢组学的多变量预测模型对慢性胰腺炎患者和非胰腺疾病控制患者的鉴别和验证
编译:微科盟红烧大肥鸥,编辑:微科盟Tracy、江舜尧。
微科盟原创微文,欢迎转发转载。
慢性胰腺炎(CP)是一种纤维炎性综合征,会导致器官功能障碍,慢性疼痛,胰腺癌风险增加和高发病率。目前的诊断是根据症状和特殊但不灵敏的影像学特征而来,而缺乏特异性的生物标志物,阻碍了早期诊断和治疗。我们根据TRIPOD指南进行了一项针对个体预后进行了多变量预测的3型研究,在乙二胺四乙酸(EDTA)血浆上使用气相色谱-质谱和液相色谱-串联质谱法鉴定了区分CP与对照(n = 160)的特征化合物,并在独立队列中进行了验证。我们用朴素贝叶斯算法识别六个本体类别的8种代谢物,经过算法训练和最佳截断点的计算后,根据代谢特征进行分类,检测到CP的曲线下面积(AUC)为0.85((95% CI为0.79-0.91)。两个独立队列中的外部验证(n = 502)与EDTA血浆(AUC 0.85(95% CI 0.81-0.89))和血清(AUC 0.87(95% CI 0.81-0.95))中的非胰腺对照相比,CP的检测准确度相似。这是首次在大型前瞻性队列中确定并独立验证血浆和血清中的代谢组学特征以用于CP诊断的研究,结果可以为CP的第一次常规实验室测试提供依据。
论文ID
实验设计
实验结果
1.研究队列和患者特征
表1显示了所有队列的临床特征。由于CP的性质,所有研究在男女参与者之间的都是不平衡的,男性比女性多得多。
2.CP患者和非胰腺对照样品中的代谢组学分析
我们采用经过严格的质量控制体系来保证代谢组学数据的可靠性,然后对血浆样品中505种已知代谢物和115种未知代谢物,血清样品中498种已知代谢物和118种未知代谢物进行统计分析,我们在血浆和血清样本中均可检测到大部分代谢物,它们在本体类上的分布如图1所示。
图1 在鉴定和第一次验证研究中分析了代谢物在本体类别上的分布和类别内的数量
3.通过多元统计数据区分CP和对照患者
我们调查了CP和对照组的代谢谱是否可以在无监督的多变量统计方法中区分开,并对所有血浆样本数据进行主成分分析。
我们在主成分(PC)1和2中获得了最佳的分组分离,它们分别占数据集整体方差的12%和7%(图2A)。这两组显示出主要的重叠,但CP患者的样本有降低PC1得分的趋势,这对于一个由于不同生活方式、药物和合并症而具有高度个体差异性的异质队列来说是需要引起注意的。在第二次验证研究中获得的PCA中,除了CP和对照组之外,肝硬化患者被添加为第三诊断组(图2B)。在PC1和PC2中我们再次观察到组之间的最佳分离,值得注意的是,我们观察到控制组与其他两组几乎完全分开,而慢性阻塞性肺病患者的PC2得分往往高于肝硬化患者,导致这两组患者之间存在明显的分离。
虽然在验证队列中执行PCA并不常见,但在这种情况下表明代谢轮廓和CP与对照组患者的分布在鉴定研究和第一个验证研究中非常相似,证明这两项研究虽然独立进行,但实际上是可相互比较的。第二次验证研究的主成分分析很好地概述了肝硬化患者的代谢特征与CP患者和对照组的代谢特征之间的关系。
图2 多变量分析
(A)鉴定研究和第一个验证研究集(EDTA血浆)的主成分分析(PCA)得分图。通过绘制主成分(PC)1和主成分2,观察到对照组(灰色)和CP组(琥珀色)的最佳分离。这些PC加在一起,占数据集中观测到的总变异的19%。(B)第二验证研究集(血清)的PCA计分曲线图。对照组(灰色)、慢性胰腺炎组(琥珀色)以及肝硬化组(蓝色)在PC1和PC2之间有明显的分离。虽然慢性胰腺炎和肝硬化组之间有一些重叠,但对照组与其他两组存在明显分离。这些PC加在一起,占数据集中总变异的34%。CP,慢性胰腺炎;EDTA,乙二胺四乙酸。
4.生物标志物的发现
在多变量方法中观察到的分离趋势表明,我们可以对生物标记物进行标记从而区分慢性阻塞性肺疾病和对照患者。
由于朴素贝叶斯算法和应用于识别研究的生物医学专业知识,本研究确定了8种代谢物(表2)。AUC值为0.85%特异性为0.86,灵敏度为0.71(表3);ROC曲线参见图3A。我们使用预测评分的最佳计算截断值0.479,与AUC为0.85 (95%CI 0.79-0.91)的对照患者相比,在标记的生物标志物中检测到的CP可在补充材料中查看。
图3 用于检测慢性胰腺炎的生物标志物标签的性能
受试者的工作特征和曲线下面积(AUC)可区分慢性胰腺炎和对照组生物标志物信号。(A)鉴定研究(EDTA血浆)(B)第一验证研究(EDTA血浆)(C)第二验证研究(血清)。EDTA,乙二胺四乙酸。
表2 用于生物标志物标签的代谢物列表
5.生物标记物在独立验证队列中的验证
我们在第一次验证研究中对生物标记物标签进行了测试,该研究包括来自348名患者的乙二胺四乙酸(EDTA)血浆样本。我们从鉴定研究中转移代谢物的临界值和系数值,并对诊断性能进行评估。CP(与对照组相比)的AUC为0.85(95%CI 0.81~0.89),这相当于特异度为0.66,敏感度为0.84(表3)。两项研究中AUC的CI几乎相同,表明生物标记物的性能足够强大,可以成功转移到第一项验证研究中,ROC曲线如图3B所示。
在第一次验证研究中获得了稳定的表现后,我们测试了CP生物标记物签名在不同背景下是否有效,并进行了第二次验证研究,包括162名个体的代谢组学数据。在这个队列中,我们使用血清样本和肝硬化患者作为额外的对照。
我们再次将截断值和代谢物系数从鉴定研究转移到第二验证研究,并对诊断性能进行评估,CP组与对照组的AUC为0.87(95%CI 0.81~0.95)。此CI与AUC CI在识别研究中显示出相当大的重叠,表明在第二次验证中表现成功,其中,特异性为0.89,敏感性为0.78(表3),ROC曲线如图3C所示。因此生物标记物的标记足够稳定,可以与血清样本一起工作。当算法应用于肝硬化样本时,结果与CP组更类似于血液供体组。
表3 生物标志物标签的性能特征
6.三个研究队列中生物标志物小组的多变量统计分析
对对三个数据集的单独分析显示在两个基于血浆的研究中,CP患者所选择的8种代谢物与对照组相比均有显著改变(p<0.05;FDR<0.2),其中6个也在基于血清的研究中,小组代谢物的方差分析结果(倍数变化)如表4所示。值得注意的是,在所有研究中,折叠变化在相同的范围内,其中一个显著的特点是,在第一次验证研究中,小组代谢物的p值非常小。由于本研究的样本量较大,两组间浓度水平变化较小的代谢物的统计学意义也较高;此外,PCA结果显示,第二次验证研究中的组的同质性比第一次验证研究中的组低,导致Manova中的p值较高。
预测分数的计算揭示了小组代谢物的相对重要性,其中β-胡萝卜素和隐黄素的影响最大(表4)。方框图显示了不同研究中小组代谢物水平的个体间变异性(图4A-H)。它们解释了类胡萝卜素被算法选为最重要代谢物的原因,因为它们在不同的组之间区分得最好;然而,单一代谢产物不能区分CP和对照组,只有生物标志物小组的计算才能得出足够准确的诊断。
表4 特征代谢物(CP与对照)的统计分析结果(线性模型)
图4 在三个研究中,由生物标志物标签得出各个代谢物水平的箱形图
CP,慢性胰腺炎。
7.胰腺功能不全的影响
由于β-胡萝卜素和隐黄素的鉴定暗示消化不良/吸收不良的病理生理机制,因此我们分析了胰腺外分泌功能不全(PEI)和补充酶(胰腺酶替代疗法,PERT)是否对血浆类胡萝卜素水平有影响。我们观察到PERT在PEI中未显示类胡萝卜素血浆水平的显着增加;然而,当比较来自患有和不患有胰腺功能不全的鉴定和第一验证队列的CP患者时,我们观察到生物标志物标记得分值的显着增加,表明了该代谢生物标志物标记与疾病阶段的相关性。为了检查HA微生物群落结构的变化以及HA对微生物相互作用的影响,我们利用稀疏反演协方差估计进行了生态学关联(SPIEC-EASI)来推断HA和CR中的两个微生物生态网络。通常,在两个生态网络中正相关大于负相关(图3A,B),同一属的两个OTU之间呈正相关,而不同属的两个OTU之间既有正相关也有负相关。
讨论
在按照TRIPOD指南进行的概念验证生物标志物研究中,我们首先发现,8种代谢物组成的标签可在血清和EDTA中以可接受的准确度区分CP和对照,这些代谢物有六个不同的本体类别。
医学指南中没有推荐的血液生物标记物用于CP的诊断,而一些蛋白质或miRNAs被认为有可能担当这一角色,但在更大的队列中的验证研究仍然缺乏。这些生物标记物通过质谱分析证实可以诊断,但诊断的准确性大多未知。利用自发和药物诱导的CP啮齿类动物的研究表明,胰腺代谢物发生了显著的改变,包括能量产生、合成代谢、脂类合成和ROS排毒途径等;由于体积小且具有异质性,基于核磁共振波谱的人体研究中我们发现尿中柠檬酸和腺苷水平发生了变化,这促使我们进行了一项更适合生物标志物开发的研究设计试验。
在本研究中发现的标签具有稳健性,我们使用了具有充分特征的大型患者队列,并进行了适当的培训和外部验证。EDTA-血浆和血清样品产生的结果的可比性凸显了所用测定方法的有效性,尽管血液代谢组在个体间和个体间变异性很高。这一特征在所介绍的三项子研究中产生了可接受的诊断准确性,AUC在0.85-0.87之间变化。值得注意的是,我们在第一个验证性研究中报告了在敏感性和特异性方面有相当大的差异,这一发现的相关性需要在进一步的研究中加以探讨。
在更仔细的检查中我们发现所确认的代谢物符合CP的病理生理学概念。据报道,CP患者的脂溶性维生素、抗氧化剂和微量元素水平低于对照组。β-胡萝卜素和隐黄素(外源性化合物)缺乏是否继发于吸收不良尚不清楚,我们在鉴定队列中也未发现PEI或PERT与β-胡萝卜素水平之间存在关联。但是,由于先前关于PEI和营养标志物之间关系的研究不一致,因此需要谨慎解释这些数据。这是描述β-胡萝卜素水平降低作为CP诊断指标的第一项研究。
在确定急性胰腺炎的代谢生物标志物的研究中,我们发现甘露糖和其他碳水化合物在基于GC-MS的方法中发生了显著变化。虽然xiao等人在研究中没有发现急性胰腺炎反复发作后进一步增加的现象,但这突显了胰腺在健康和疾病期间糖代谢中的作用。
神经酰胺和其他与鞘磷脂代谢相关的成分与小鼠的鞘磷脂诱导的胰腺炎的代谢组改变有关,并且是代谢组信号的一个标志,该标志对胰腺癌的检测高度敏感,而在我们的CP受试者中发现的低吸收的长链饱和山毛酸水平的降低可能与神经酰胺合成酶2的神经酰胺途径直接相关。据我们所知,目前还没有公开发表的研究将两者联系在一起。
吲哚-3-乙酸属于尿毒症毒素类,是大肠微生物区系中色氨酸的副产物,它的生物利用度取决于肠道微生物群,并与芳烃受体的表达有关,进而调节胰腺纤维化。即使在非临床表现的CP中,微生物组的组成对胰腺酶的分泌也很敏感;同样,另一种尿毒症毒素-马尿酸的血浆水平对与饮食,药物和疾病有关的肠道微生物组的变化敏感。
N-乙酰胞苷是转录后的mRNA修饰,可诱导更有效的翻译,并与慢性炎症患者的炎症小体相关白介素(IL)1β产生有关,而炎性体活化与胰腺愈合和纤维化有关。
总体而言,标签包括至少有可能参与与CP发病机制有关的多种过程的代谢物,因此,可以通过算法的其他组件来补偿单个患者中单个生物标记的失败。这一发现进一步证明了,生物标志物分数随着胰腺功能不全的存在而增加,胰腺功能不全是疾病阶段的替代物。
美国一家联盟在最近的一项研究使用了一种62-plex Luminex试验来确定诊断CP的潜在生物标记物。在41例对照组、20例复发性急性胰腺炎(RAP)和40例CP患者的血液样本中,研究人员发现GM-CSF、IFNb、瘦素、PDGFB和抵抗素可以区分CP和对照组(AUC 0.86),抵抗素、SCF、MIP-1a和IL-17F可以区分RAP和CP(AUC 0.77),而对这些数据的独立验证尚待解决。
我们研究的一个潜在弱点是由于疾病异质性和连续招募,CP患者和对照组在年龄、性别和BMI方面不匹配。CP主要在有营养不良风险的中年男性中被诊断出。非胰腺对照组(如日间手术患者或献血者)默认组成不同的队列。因此,性别、BMI和年龄没有包括在预测模型中,因为我们的目标是避免这样一个陷阱,即仅年龄的变化就足以将正分类改变为负分类,或反之亦然。
无法排除不同群体之间代谢特征差异是由于这些特征造成的。尽管如此,Manova的统计数据在年龄、性别和BMI方面进行了修正,并仍然显示出两组之间所有选定代谢物的显著差异。这支持了我们的假设,即这种代谢特征能够识别CP患者,而不考虑性别、年龄和BMI。
我们发现,用来区分CP和对照组的代谢特征在应用于肝硬化样本时的区分性较差。这种相似性可能是由于纤维化的激活和酗酒,这是两种疾病的共同特征。幸运的是,不得不区分肝硬化和慢性胰腺炎并不常见。然而在第二个验证性研究中,控制组与CP几乎完全分离,在这个队列中,对照组由健康的献血者组成,解释了显著的改善。
这一代谢特征的一个潜在临床用途是识别病程早期的CP患者,有不明原因的腹部症状和胰腺病史的患者,但(目前)还没有明确的CP(可能的CP)的形态学迹象,或者RAP患者有发展CP的风险。到目前为止,国际共识的诊断标准对这些群体的定义还很模糊。因此,为了生物标记物的开发,我们招募了确诊为CP的患者。呈现的代谢特征在上述情况下是否足够敏感,需要在长期随访的试验中进一步测试,最好包括通过慢性胰腺炎预后评分进行疾病分期。代谢生物标记物是否能够区分CP和肝硬化,这两种疾病是否具有共同的病因(酒精),也需要在未来的试验中解决。
总之,我们已经确认并验证了一个基于LC-MS/MS的人类血液代谢组特征,它成功地区分了健康人和CP患者。这一生物标志物是否对CP的早期诊断有临床价值,或者是否可以用于监测疾病进展,还需要进一步的前瞻性研究。