科研 | Gut:宏基因组揭示了Lachnoclostridium可以作为结直肠腺瘤和结肠癌诊断的生物标志物(国人作品)
编译:陈佩佩,编辑:小菌菌、江舜尧。
早期发现结肠腺瘤和结肠癌有助于成功治疗并显著降低结直肠癌 (CRC) 的发病率。在CRC发展前期的腺瘤阶段,需要早期诊断判定未来是否会发展为CRC。腺瘤,尤其是非进展期腺瘤的分子标记物非常有限。
本文确定了新的粪便细菌标志物诊断腺瘤。该研究包括来自亚洲的1012例受试者(274例CRC,353例腺瘤和385例对照)。宏基因组分析鉴定来自lachnoclustridium sp.、具核梭杆菌(Fn)和哈氏梭菌(Ch)的m3基因(lachnoclustrum sp.的一个新的基因标记,标记为m3),在腺瘤中显著富集。
结果显示:粪便m3基因和Fn从正常到腺瘤到CRC显著增加。在区分腺瘤和对照时,粪便m3可能比Fn表现更好,而Fn在诊断CRC时表现更好。特异性为78.5%时,m3和Fn对腺瘤的敏感性分别为48.3%和33.8%,对CRC的敏感性分别为62.1%和77.8%。在使用粪便免疫化学试验检测的一个亚组中(FIT;n = 642),m3在检测腺瘤方面的表现优于 FIT(m3对非晚期和晚期腺瘤的灵敏度分别为44.2%和50.8%(特异性 = 79.6%),FIT为0%和16.1%(特异性= 98.5%))。与 FIT联用可将m3对晚期腺瘤的敏感性提高至56.8%。m3与Fn、Ch、Bacteroidesclarus和FIT联合诊断CRC的效果最好(特异性=81.2%,敏感性= 93.8%)。本研究为大肠腺瘤的非侵入性诊断确定了一种新的细菌标志物m3。
论文ID
原名:A novel faecal Lachnoclostridium marker for thenon-invasive diagnosis of colorectal adenoma and cancer
译名:粪便中Lachnoclostridium菌可以作为结直肠腺瘤和结肠癌的非侵入性诊断的生物标志物
期刊:Gut
IF:17.943
发表时间:2019.11
通讯作者:于君
作者单位:香港中文大学深圳研究院李嘉诚健康科学研究所
实验设计
结果
1、从lachnoclostridium种属中鉴定m3是结直肠腺瘤的潜在生物标志物
研究者分析了589个亚洲受试者(184个CRC, 185个腺瘤和220个对照受试者)的内部宏基因组学数据的丰度,来判断先前鉴定的CRC的20个细菌基因标记是否也可以作为腺瘤的生物标记。其中,标记为m3的基因,在先前的研究中并不能归属于任何已知物种。但是发现与对照受试者相比,m3和两个之前已验证的CRC标志物(Fn和Ch)一样,在结直肠癌和腺瘤患者中显著富集(图1A)。在NCBI资源库中,1935 nt m3序列进行搜索,鉴定为lachnoclustridium sp.。2016年7月GenBank中保存有基因组序列的新种YL32(登录号:CP015399)。m3和lachnoclustridiumsp.YL32 共享97% (1883/1935) DNA序列相似性(图1B)。m3 DNA 包含一个 1638 nt 的开放阅读框 (nt298c1935),编码一个推定的 545 aa 蛋白,与II类RTase(GenBank 登录号:WP_055650193)。虽然 m3 蛋白由于TTG 密码子而不是相应翻译起始位点的ATG 而缺乏前 60aa,但保留了 RTase 保守域(图1C)。Lachnoclostridiumsp.中的相应序列,YL32 基因组也编码部分 II 类 RTase,与 m3-RTase 和 II 类 RTase 的序列相似性为 98% (534/545)。进一步分析了 Lachnoclostridium sp.在宏基因组学数据中基于 Prokka-注释蛋白编码基因序列的 YL32 基因组。lachnoclustridiumsp. YL32在腺瘤中显著增加,但在CRC中显著低于对照受试者。因此,候选基因标记 m3 可能属于 lachnoclustridiumsp. YL32。
图1 m3的鉴别和表征。(A) 宏基因组测序鉴定出m3、具核梭杆菌 (Fn) 和哈氏梭菌(Ch),在腺瘤患者粪便样本中显著增加。(B) m3的 DNA 序列与 Lachnoclostridium sp. 具有很高的相似性YL32。(C)m3 编码一个假定的逆转录酶(RTase),映射到第 II 组内含子 RTase,缺少 frst 60 个氨基酸,但保留了RTase 保守域。CRC,结直肠癌;N,正常对照。
2、通过qPCR验证m3作为结直肠腺瘤的一种新的在粪便中的生物标志物
研究者进一步定量检测了来自香港中国人的粪便样本组中m3的丰度。结果显示,腺瘤患者(n = 207)的粪便m3水平显著高于对照受试者(n = 288),CRC患者(n = 203)的粪便m3水平显著高于对照受试者或腺瘤患者(多重比较均为 p < 0.0001)。m3从对照到腺瘤再到癌有明显的线性增加趋势(图2A)。并且发现,m3水平在非晚期和晚期腺瘤之间类似(图2B)。同样,m3水平在结直肠癌患者的肿瘤淋巴结转移分期中也未显示出显著变化(图2C)。与对照组相比,腺瘤患者粪便m3的发生率显著升高,CRC患者最高(与对照组相比,p < 0.0001;图2D)。受试者工作特征(ROC)曲线分析显示,m3可显著区分CRC和腺瘤患者与对照受试者,CRC和腺瘤的ROC下面积 (AUROCs)分别为0.741和0.675(均 p < 0.0001;图2E)。特异性为78.5% 时,m3对CRC和腺瘤的敏感性分别为 62.1%和48.3%;区分CRC和腺瘤患者与对照受试者的准确性分别为71.7%和 65.9%。这些结果表明,m3可作为一种新的基于粪便的生物标志物,辅助CRC 和腺瘤的非侵入性诊断。
图2 粪便m3定量检测在结直肠癌(CRC)和腺瘤患者诊断中的应用。(A)粪便样本中m3的相对丰度在健康对照受试者 (N,n= 288)、腺瘤患者(A,n= 207) 和结直肠癌患者(n=203)之间存在显著差异。与N相比,p***<0.0001;与A相比,###p<0.001。(B)在非进展期和进展期腺瘤之间未观察到m3粪便丰度的显著差异。(C)在不同TNM分期的结直肠癌患者中,粪便中m3的丰度没有差异。(D)与对照组相比,m3在腺瘤患者中的发生率显著升高,在结直肠癌患者中的发生率最高。(E)m3在区分结直肠癌和腺瘤患者与对照组受试者工作特征(ROC)曲线和诊断性能。AUROC为ROC曲线下的面积。
3、在诊断结直肠腺瘤方面,m3比其他细菌标志物Fn和Ch表现更好。
由于通过宏基因组测序还发现腺瘤患者的Fn和Ch显著增加,研究者进一步通过qPCR检测了Fn和Ch的水平,并与m3进行了诊断性能比较。结果证实,与m3相似,腺瘤患者与对照受试者相比,Fn的相对粪便丰度显著升高,在CRC患者中最高,在CRC发展过程中呈显著线性增加趋势(图3A)。然而,qPCR显示腺瘤患者粪便Ch与对照组相比没有显著增加 (p > 0.05)。与腺瘤患者和对照组相比,Ch在CRC患者中显著富集(图3A)。ROC曲线分析也显示 Fn和Ch在诊断CRC方面均表现良好,但只有Fn能显著区分腺瘤患者和对照组(图3B)。Fn和m3的丰度均与性别、CRC分期、病变部位或体重指数无关。多因素分析显示,Fn和m3与CRC和腺瘤诊断显著相关,同时Fn与年龄。尽管Fn在CRC诊断中的表现优于m3(Fn的AUROC = 0.863 vs m3 = 0.741;p< 0.0001),但通过比较ROC曲线(AUROCs:m3 = 0.675 vs Fn = 0.620,p= 0.09;图3C,D),m3在腺瘤诊断中的表现可能优于Fn。作为特异性为 78.5% 的单一诊断因素,Fn区分结直肠癌患者和对照组的灵敏度为77.8%,准确度为 78.2%(m3 组分别为 62.1% 和 71.7%)。特异性为78.5%时,m3区分患者来自对照受试者的腺瘤,灵敏度为 48.3%,准确度为 65.9%(通过Fn分别为33.8% 和 59.8%)(图 3C,D)。通过logistic回归模型联合Fn和m3显著改善了各自对CRC的诊断性能(AUROC = 0.891,p = 0.003 vs Fn),但对腺瘤没有改善(AUROC = 0.671,p= 0.89 vs m3)。这些结果表明,m3 是一个潜在的良好的诊断生物标志物,尤其是腺瘤。
4、与其他细菌标志物(Fn、Bc和Ch)联合使用可提高m3对CRC的诊断性能,而m3单独使用对腺瘤效果最好
以前报道过的细菌标志物Fn,Ch,Bc和m7用于CRC的诊断,研究者进一步检测了这些标志物与m3联合用于CRC的性能。结果表明,Fn、m3、Ch和 Bc的联合logistic回归模型诊断CRC的效果最好,AUROC为0.907(图4A)。在特异性为80.2%时,Fn、m3、Ch 和Bc组合对CRC的灵敏度为 85.2%,准确度为 82.3%。尽管与对照受试者相比,腺瘤患者中Fn、m3、Ch和Bc 组合的评分显著增加,但其对腺瘤的诊断性能并不优于m3(图4B)。因此,Fn、m3、Ch 和Bc组合可作为CRC非侵入性诊断的新工具,而 m3 单独可用于腺瘤的进一步检测(图 4C)。
图4 联合应用4种标志物检测大肠癌 (CRC) 和单独应用m3检测腺瘤。(A)目标细菌标记物组合的受试者工作特征 (ROC) 曲线分析显示,通过logistic回归 (LR)模型,Fn、m3、Ch 和Bc组合最适合用于CRC诊断。通过比较ROC曲线显示p值;与N相比,***p<0.0001;与A相比,###p<0.0001;。(B)粪便样本中Fn、m3、Ch和Bc (LR4) 组合的水平及其与 m3 诊断性能的比较。N:正常对照;A:腺瘤;(C) 在CRC和腺瘤诊断中应用Fn、m3、Ch和Bc的拟议策略。
5、在独立组中验证细菌标志物的诊断性能
研究者进一步检测了来自中国上海的独立的313个样本组中的细菌标志物(71例 CRC,145例腺瘤和97例对照)。结果显示,与对照组相比,腺瘤患者的Fn和m3均显著增加,癌症患者的Fn和m3进一步增加,通过多重比较,从对照组到腺瘤再到癌症的增加具有显著线性趋势p < 0.0001;图 5A)。使用在香港组建立的相同logistic回归模型,四种标志物(Fn、m3、Ch和Bc)的联合评分在正常-腺瘤-CRC序列期间也显著增加(p < 0.0001)。Fn在区分CRC和对照组方面优于 m3,但差异不显著(CRC 的 AUROC:Fn = 0.776 vs m3 = 0.759),并且四种标志物组合在诊断CRC 方面表现出最佳性能(图5B)。m3 在区分腺瘤患者和对照组方面优于 Fn 和 4 种标记物组合,但差异不显著(AUROC:m3 = 0.662、Fn = 0.616 和4种标记物= 0.652),并且m3显示出 51.0% 的敏感性和75.3%的特异性(图5B)。这些结果进一步证实了四种细菌标志物对 CRC和 m3对腺瘤的诊断价值。
图5 在独立的粪便样本组中验证细菌标志物诊断结直肠癌(CRC) 和腺瘤。(A)与第二组对照受试者相比,CRC和腺瘤患者中Fn 和m3 的相对粪便丰度以及Fn、m3、Ch和Bc(LR4)组合水平。N,正常对照;A,腺瘤;*p< 0.05 和 ***p < 0.0001 与N 比较;#p< 0.05 和 ##p < 0.001 与A 比较。(B)Fn、m3和LR4 的ROC 曲线和诊断性能比较。
6、结合FIT提高细菌标志物对CRC的诊断能力
为比较细菌标志物与CRC筛查中最广泛使用的非侵入性粪便检测的诊断性能,在香港的642 份样本亚组(178 份 CRC、204 份腺瘤和 260 份对照)中进行了 FIT。Fn、m3、Ch 和 Bc 组合的CRC检出率 (84.7%) 显著高于 m3 单独 (61.8%) 或 FIT (71.3%)(均 p < 0.01)。FIT与4种标志物的组合在检测 CRC 方面表现出最佳性能,灵敏度为 93.8%,特异性为 81.2%(图 6A)。四种标记物在 I-III 期癌症中表现出比 FIT 更高的敏感性,但在IV期晚期癌症中不表现出敏感性。对于 I-III 期癌症,四种标志物和 FIT 联合检测的敏感性显著高于FIT,同时也提高了I-III期癌症和IV癌症检出率(图6B)。这些结果表明,细菌标记物组合优于适用于检测 ICIII 期 CRC,它们的组合进一步提高了CRC 的非侵入性诊断。
图6 细菌标志物与粪便免疫化学试验 (FIT) 的比较和组合。(A) 在香港样本的一个亚组中,比较FIT、m3、四种标记物的组合(Fn、m3、Ch 及 Bc;LR4)及细菌标记物与FIT的组合的灵敏度及特异性。LR4 联合 FIT 检测结直肠癌 (CRC) 效果最好,而m3联合FIT检测腺瘤效果最好。(B) 比较 FIT、LR4 及两者联合检测 CRC 的灵敏度(根据肿瘤淋巴结转移(TNM)分期亚组)。(C) 比较 FIT、m3 及其组合检测非晚期和晚期腺瘤的灵敏度。通过2 项试验进行所有灵敏度比较。A,非晚期腺瘤;AA,晚期腺瘤。
7、m3在诊断腺瘤方面明显优于FIT
讨论
在本研究中,研究者通过宏基因组学分析,在结直肠癌或腺瘤患者中与对照受试者比较,筛查了一组先前已确定的 CRC 相关基因标志物。针对腺瘤患者与对照组相比显著改变的候选基因标记物,进一步验证其在 qPCR 非侵袭性诊断腺瘤和 CRC 中的应用价值。证明了粪便细菌标志物 m3 可用于腺瘤检测,同时设计了一组新的粪便细菌标志物 (m3 +Fn+Ch +Bc),以实现改善与以前研究报道的标记物相比,对CRC的诊断能力。Fn、Bc、Ch 和未定义的m7组合显示了良好的CRC诊断性能。ROC曲线比较显示,Fn、Bc、Ch和m3组合 (AUROC = 0.907 (0.877~0.931)) 较 Fn、Bc、Ch和m7组合 (AUROC = 0.892 (0.856~0.921)) 在香港组和上海组(AUROCs:0.830 (0.765~0.884) 与 m3 vs 0.795 (0.705~0.867) 与 m7)表现出 AUROC 增大。这些结果表明 m3 对改善 CRC 非侵入性诊断的其他细菌标志物的影响。最近对CRC的研究发现了大量粪便微生物标志物,尝试从shotgun宏基因组学数据中结合这类标志物显示了良好的诊断性能。研究者最近的多队列宏基因组学数据的荟萃分析,涵盖了来自中国、奥地利、美国、德国和法国队列的526个样本,确定了7个 CRC 富集的细菌物种,在区分 CRC 患者和对照受试者时显示 AUROC为 0.8,当加入临床数据时 AUROC 增至 0.88。由于繁琐的实验程序和繁重的计算工作量,将直接鸟枪法宏基因组学应用于诊断并不具有成本效益。基于鸟枪法宏基因组学对已鉴定的微生物标志物候选物进行靶向检测应用于临床是一种较有前景的策略。基于我们通过宏基因组学研究鉴定的细菌基因标志物,通过 qPCR 定量四种细菌基因标志物显示本研究中CRC诊断的AUROC为0.907。然而,由于无法从这些病例对照样本中确定标志物的真实性能,需要在代表 CRC 筛查人群的大样本队列中进行进一步验证。我们还首次报道了粪便 CRC 富集的病毒和真菌生物标志物可将 CRC与对照组区分开来,AUC分别为 0.802 和 0.93。这些病毒和真菌标志物通过靶向定量应用于CRC的非侵入性诊断需要进一步探索。
评论
本文先通过大量的临床样本进行宏基因组学分析,发现了新的m3基因。有趣的是,m3和两个之前已验证的CRC标志物(Fn和Ch)一样,在结直肠癌和腺瘤患者中显著富集。因此研究者进一步通过qPCR验证m3作为结直肠腺瘤的一种新的在粪便中的生物标志物。并且发现,与其他细菌标志物(Fn、Bc和Ch)联合使用可提高m3对CRC的诊断性能,而m3单独使用对腺瘤效果最好。通过来自中国上海的样本进行重复验证,发现m3可以作为诊断CRC的粪便生物标志物。本文研究运用了大量的临床样本进行宏基因组学分析,并进行统计学处理,从大量的数据里面挖掘有意义的数据,值得借鉴。