精准医学: 尿液DNA甲基化检测有助于膀胱癌早期和复发监测|早期筛查专题
易点评
本研究是膀胱癌预防、检测方面医学研究的典范。作者巧妙运用了中山纪念医院(SYSMH)、癌症基因组图谱(TCGA)和基因表达总表(GEO)的研究数据,以及MassARRAY检测技术,确定了膀胱癌特异性甲基化标记物,并针对其开发出的utMeMA监测方法进行了鉴定,从而证实了对肿瘤患者尿液DNA甲基化进行检测可以诊断出早期、微小以及残留的肿瘤这一结果,与传统尿脱落细胞学检测和FISH检测相比是一种快速、高通量、无创、有前景的方法。为识别特定的分子标志物,使癌症在高危人群中早期发现、癌症复发预防的相关研究做出了贡献,尤其对于关注后基因组时代医学发展,特别是精准医学的研究者,该项研究具有重要借鉴意义。
摘要
背景:目前检测和监测膀胱癌(BCa)的方法往往具有一定的侵入性或较差的敏感性和特异性,特别是在早期、微小和残留的肿瘤检测中。
方法:我们开发了一种有效的方法,称为utMeMA,用MassARRAY检测尿液中肿瘤多个基因组区域的DNA甲基化。我们通过联合分析中山纪念医院(SYSMH)、癌症基因组图谱(TCGA)和基因表达总表(GEO)数据库中的队列,确定了BCa特异性甲基化标记物。BCa诊断模型建立在回顾性队列中(n=313),并在多中心、前瞻性队列中进行验证(n=175)。对该诊断方法的性能进行了分析,并与尿脱落细胞学检测和FISH(荧光原位杂交)检测进行了比较。
结果:我们首先在联合分析中发现了26个BCa的显著甲基化标记。我们建立并验证了一个基于两个标记物的诊断模型,该模型对BCa患者的鉴别准确率高(86.7%)、敏感性强(90.0%),特异性强(83.1%)。此外,基于utMeMA的检测方法在灵敏度上比尿脱落细胞学检测和FISH检测有了很大的提高,特别是在早期肿瘤(Ta期和低级别肿瘤,64.5%比11.8%,15.8%)、微小肿瘤(81.0%比14.8%,37.9%)、残留肿瘤(93.3%比27.3%,64.3%)和复发肿瘤(89.5%比31.4%,52.8%)方面。尿液诊断的灵敏度与肿瘤的恶性程度和时期具有较好的相关性。
结论:尿液肿瘤DNA甲基化检测可用于BCa的早期诊断、微小残留肿瘤的检测和监测,是一种快速、高通量、无创、有前景的方法,可以减少膀胱镜检查和二次手术所带来的负担。
介绍
膀胱癌(BCa)是泌尿系统最常见的恶性肿瘤,据估计,全球每年约有549,393例新增病例、约199,922例死亡病例。大约75%的患者患的是非肌层浸润性膀胱癌(NMIBC),其中70%的患者肿瘤会复发,而15%的患者会在肿瘤的分期和分级上有所加重。因此,被诊断为NMIBC的患者需要接受频繁的治疗和监测,导致BCa成为了患者一生治疗成本最高的癌症类型。目前监测BCa复发的金标包括膀胱镜检查和尿脱落细胞学检查。膀胱镜检查高度敏感,但具有侵入性,费用昂贵,经常伴有不适感,而尿脱落细胞学检查具有高度特异性,但缺乏敏感性(25%-35%),特别是对低级别的BCa(4%-15%)。UroVysion荧光原位杂交(FISH)具有较高的灵敏度(60%~80%),广泛应用于临床常规检测BCa,但对低级别或小肿瘤的灵敏度较低。此外,对于高级别和T1肿瘤的患者,建议采用二次经尿道膀胱肿瘤电切术(Re-TURBT)。然而,我们仍然缺乏有效的手段来估计患者是否有肿瘤残留。因此,迫切需要开发有效的方法来检测早期、微小、残留和复发的肿瘤,来改善癌症的治疗。
DNA甲基化是基因表达的关键表观遗传调控因子,通常会导致基因表达缺陷。在许多肿瘤中,早期会有抑癌基因甲基化增加的现象,DNA甲基化模式的改变可能是与肿瘤发生相关的最早可检测到的肿瘤变化之一。因此,DNA甲基化标志物被广泛应用于常见癌症的诊断和预后判断。一些研究还表明,尿液中的甲基化CpG位点可能是检测或监测BCa的有前景的标志物。在一项多中心研究中,欧洲一家机构--Bladder EpiCheck使用了15个甲基化标志物来监测NMIBC患者的复发,其总体敏感性为68.2%,特异性为88.0%。另一项多中心研究发现,3基因甲基化分类器对监测BCa的总体敏感性为89.6%,特异性为30.5%。然而,这些检测方法仍然需要改进,并在亚洲的多中心和大规模队列中得到验证。因此,这些检测方法在亚洲的常规临床实践中并未完全采用。
在本研究中,我们建立了一种用MassARRAY检测尿液肿瘤DNA(utDNA)多区域甲基化的有效方法,称为utMeMA。重要的是,我们将其应用于回顾性队列和最小绝对收缩与选择算子模型(LASSO),建立了一个基于双标记物的BCa诊断模型,并在前瞻性多中心队列中进行了进一步的验证。此外,我们还系统地评估了utMeMA在诊断BCa早期、微小、残留和复发肿瘤方面的表现,并与常规尿脱落细胞学检测和FISH检测进行了比较。
结果
发现DNA甲基化标记以区分BCa和正常组织。这项研究的设计和实施如图1所示。为了研究检测BCa的特异性DNA甲基化标记,我们首先对11例BCa组织和来自中山纪念医院(SYSMH)的正常组织(NAT)进行了高通量DNA亚硫酸氢盐靶向测序。接下来,我们分析了来自癌症基因组图谱(TCGA)队列的21例BCa和NAT的DNA甲基化数据。众所周知,尿液被认为是无创性诊断BCa的最佳标本。然而,白细胞在泌尿系统疾病的尿液中普遍存在,是鉴别良恶性疾病的干扰因素。为了消除尿液中白细胞DNA的影响,我们进一步分析了来自基因表达总库(GSE40279)的412例BCa组织和656例正常血液标本的DNA甲基化图谱。通过差异甲基化分析,SYSMH队列中的2030个标记和TCGA与GEO联合队列中的3205个标记在BCa和正常组织之间发生了显著变化(补充图1)。此外,我们还应用了一系列统计过滤器来减少标记的数量,寻找BCa最重要和最特异的标记。最后,我们确定了26个标记物,这些标记物在肿瘤中表现出高度和稳定的甲基化,但在正常组织和白细胞中保持在非常低的水平(图2,A和B,补充图2)。这表明了DNA甲基化标记可用于BCa的鉴别。
图1. 指示研究设计的工作流程。SYSMH,中山纪念医院;TCGA,癌症基因组图谱;BCa,膀胱癌;FDR,错误发现率;LASSO,最小绝对收缩和选择算子模型;RF,随机森林模型。
尿液DNA甲基化检测BCa新方法的建立。为了在临床上快速、经济、高通量地检测多个标志物,我们建立了一种名为尿液肿瘤DNA甲基化质谱(utMeMA)的诊断BCa的有效方法,该方法可以同时对较低的甲基化率用较高的分辨率对来自不同基因组区域的CpG位点进行多重定量测定。为了验证26个标志物是否可以用来区分BCa和正常组织,我们用utMeMA检测了21对BCa和NAT以及18个匹配的尿样的甲基化水平(图2C)。除了cg12350762(图2D,补充图3)外,有25个标记显示癌组织和尿液中甲基化水平较高,而NAT中甲基化水平较低。NMIBC和MIBC组织的甲基化水平均高于NAT,表明这25个标记可同时用于NMIBC和MIBC的检测(补充图4)。相关分析显示,26项尿液标志物中有23项与配对癌组织呈显著正相关,其中cg21472506的R2最高,为0.625。3个标记(cg12350762、cg23180938、cg06782686)例外。这些发现表明,尿液DNA甲基化可以用utMeMA检测出来并代表癌组织的甲基化水平,这23个标记物可以作为BCa的诊断标记物(图2e,补充图5)。
图2. DNA甲基化标记物来区分BCa和正常组织。(A)对TCGA队列中在NAT(n=21)和BCa肿瘤组织(n=412)之间差异甲基化的26个甲基化标志物进行了无监督聚类。(B)显示cg21472056在BCa肿瘤组织(n=412)、NAT(n=21)和正常血样WBC(n=656)中的β值分布的Box plot。β值为0表示没有甲基化,而1表示完全甲基化。数据显示为四分位数之间的中位数。用单因素方差分析评估统计学意义,然后进行Dunnett‘s检验。(C)对SYSMH队列中NAT(n=21)、BCa肿瘤组织(n=21)和匹配尿样本(n=18)中差异甲基化的26个甲基化标志物进行无监督聚类。不可用值显示为灰色。(D)TOF-MS检测cg21472056在21例BCa肿瘤组织、18例配对尿液样本和21例NAT中的β值分布。数据显示为四分位数之间的中位数。用单因素方差分析评估统计学意义,然后进行Dunnett‘s检验。(E)18例患者肿瘤组织与配对尿液中cg21472056甲基化水平的Spearman相关分析。采用Pearson’s χ2检验进行统计学意义分析。**P<0.01和*P<0.001。
两种标志物联合检测3组人群BCa尿液诊断模型的构建与验证。为了建立诊断模型,我们招募了142名被诊断为BCa的患者,159名患有泌尿系统良性疾病的非癌症患者,以及来自SYSMH队列的12名健康参与者。我们用utMeMA分析了23个标记的甲基化状态,并使用LASSO进行标记选择和模型开发。我们获得了一个性能优异的模型,只有2个CpG标记(CG21472506和CG11437784),在训练和测试数据集中分别显示了0.919和0.903的高AUC(图3,A和B,表1,补充图6,A和B)。值得注意的是,我们在使用该模型的测试数据(图3、C和D)中都出现了预测结果和病理诊断结果之间高度一致的现象。
为了进一步评估基于utMeMA的诊断模型的临床应用性能,我们进行了一项前瞻性、多中心、盲法研究。这一独立的验证队列纳入了来自中国5家医院的109名被诊断为BCa的患者和66名良性疾病的对照患者。同样,该模型与病理诊断有着很好的一致性(图3E)。然后,我们评估了该模型的尿液诊断评分(UD评分),以区分BCa和良性疾病。BCa患者的UD评分明显较高,而良性疾病患者和健康人的UD评分非常低(图3F)。重要的是,该模型在训练、测试和验证数据集上分别获得了88.1%、90.2%和91.7%的高灵敏度和86%、84%和77.3%的特异度。此外,该模型的准确率、阳性预测值(PPV)和阴性预测值(NPV)几乎都在85%以上,表现出很好的性能(图3G)。该模型的性能优于cg21472506或cg11437784(补充图6,C-D)。该模型具有较高的灵敏度、 和较强的诊断力。
图3. 尿液诊断模型的构建和验证,使用2个标记物在3个队列中检测BCa。训练(A)和测试(B)队列中使用尿液DNA甲基化分析的诊断预测模型的ROC曲线和相关的AUC。(C-E)在训练(C,n=222)、测试(D,n=91)和独立前瞻性验证(E,n=175)队列中,对BCa和非癌症受试者的DNA差异甲基化的2个甲基化标志物进行无监督聚类。每行代表一个患者,每列是一个CpG标记。通过模型可以提前显示真实的疾病状态和预测状态。(F)显示健康受试者(n=12)、非癌症患者(n=225)和BCa患者(n=251)的UD评分。虚线显示了区分胆囊癌和非癌症病例的分界值(0.3564)。数据显示为四分位数之间的中位数。用单因素方差分析评估统计学意义,然后进行Dunnett‘s检验。(G)该模型在训练、测试和验证队列中的敏感度、特异度、准确性、PPV和NPV由截止值决定。*P<0.001。
utMeMA诊断BCa与尿脱落细胞学、FISH的检测比较。我们发现UD评分与晚期、分期、肿瘤数目、尿红细胞数呈正相关,但在年龄、性别、吸烟状况、非癌症疾病类型、尿白细胞数上无明显差异(图4,A-D,补充图7)。通过对488例病例的综合分析,该模型的总体敏感性为90.0%,特异性为83.1%。根据不同的临床特征进一步分析其敏感性和特异性,老年、高级别和MIBC患者的敏感性明显较高,但在性别和吸烟状况方面无明显差异。此外,特异性在年龄、性别和吸烟状况方面没有显著差异(表2,补充图8)。
尿脱落细胞学检查和FISH是检测BCa的常规方法。为了比较utMeMA为基础的模型、尿脱落细胞学和FISH之间的性能,我们对251名BCa患者进行了进一步分析。3种方法的临床特征和诊断状态如图4E所示。令人惊讶的是,utMeMA检出了6例膀胱低度恶性潜能的乳头状尿路上皮肿瘤(PUNLMP)中的5例(83.3%),但其他两种方法均未检出(图4F)。此外,在低级别肿瘤患者中,utMeMA的敏感性比尿脱落细胞学(69.2%比16.0%)高4倍,比FISH(69.2%比22.2%)高3倍。值得注意的是,utMeMA在Ta期(79.2%比32.7%,36.2%)和T1期(93.7%比62.3%,72.4%)患者中的敏感性比尿脱落细胞学和FISH有了很大提高(图4G)。此外,在高度恶性、MIBC和总的患者中,该模型的敏感性也分别优于尿脱落细胞学和FISH(图4,F和G)。在最难发现的低级别和Ta患者中,utMeMA的敏感性比细胞学(64.5%比11.8%)高5倍,比FISH(64.5%比15.8%)高4倍。UtMeMA的巨大优势也见于其他早期肿瘤和单发或多发肿瘤患者(图4,H和I)。尿脱落细胞学和FISH的特异性虽高于utMeMA,但其差异无统计学意义(图4J)。4种非癌症疾病之间也无明显差异(图4K)。在多中心验证队列中也发现了类似的结果(补充图9)。总体而言,utMeMA与尿脱落细胞学和FISH相比表现出明显提高的敏感性,特别是在低级别和早期肿瘤患者中。
图4. 与尿脱落细胞学和FISH相比,utMeMA诊断BCa的敏感性显著提高。(A-C)不同级别(A)、不同分期(B)、不同数目(C)BCa患者(n=251)的UD评分。原位癌(CIS)是指包含CIS(n=24)的所有病例。(D)良性膀胱病变(BBLS)、泌尿系结石、良性前列腺肥大(BPH)及其他良性疾病(n=237)4类泌尿系统非肿瘤疾病患者的UD评分。数据显示为四分位数之间的中位数。统计学处理采用单因素方差分析、Dunnett检验(A、B、D)和非配对t检验(双尾,C)。(E)使用utMeMA预测的诊断状态在BCa患者(n=251)中的分布,以及相关的肿瘤分期、分级、细胞学和FISH结果。顺应性是指仅为顺应性的病例(n=2)。(F-I)检测肿瘤分级(F)、分期(G)、早期(H)、数目(I)的BCa患者utMeMA的敏感性,并与尿脱落细胞学和FISH进行比较。顺位指包括顺位(n=24)的所有病例。(J)与尿细胞学和FISH比较,utMeMA在非癌症疾病患者中的特异性。(K)utMeMA在4种非癌症疾病患者中的特异性。采用χ2检验(G-L)进行统计学处理。*P<0.001,**P<0.01,*P<0.05。
UtMeMA在BCa微小肿瘤检测中的应用。我们观察了utMeMA在评估肿瘤大小方面的表现。UD评分和敏感性在较大的肿瘤(≥3 cm)中显著增加,但在中小型肿瘤中相似(图5,A和B)。将小肿瘤分成两组后,小单发肿瘤的UD评分和敏感度均低于多发肿瘤,与肿瘤负荷一致(图5、C、D)。在上述条件下,utMeMA较尿脱落细胞学和FISH的敏感性有很大提高,特别是在小的单个肿瘤中(81.0%比14.8%,37.9%)(图5,B和D)。一例utMeMA检测发现但尿脱落细胞学、FISH、MR成像和普通膀胱镜检查均未发现的病例,更加突显了这种方法的潜在用途。病灶小且平坦,在白光下没有明显的异常,但后来通过荧光膀胱镜引导下的TURBT诊断为低度恶性的Ta肿瘤(图5e)。此外,在其他3例中也观察到了类似的情况,utMeMA发现的最小肿瘤直径为4 mm。这些数据有力地证明了utMeMA在检测微小肿瘤方面的优势。
图5. utMeMA在检测微小BCa肿瘤中的应用。(A和B)不同BCa肿瘤大小患者的UD评分和utMeMA的敏感性,并与尿脱落细胞学和FISH进行比较。采用单因素方差分析、Dunnett’s检验(A)和χ2检验(B)进行统计学处理。(C和D)BCa单发或多发小肿瘤患者的UD评分和utMeMA的敏感性,并与尿脱落细胞学和FISH进行比较。采用非配对t检验(双尾,C)和χ2检验(D)进行统计学处理。数据显示为四分位数范围(A和C)的中位数。(E)一例患者,通过utMeMA发现微小肿瘤,但被尿脱落细胞学、FISH、MR成像和普通膀胱镜检查遗漏,后来通过荧光膀胱镜检查确诊。肿瘤病理为Ta级和低级别。*P<0.05,**P<0.01。荧光膀胱镜、尿脱落细胞学、FISH、病理图像放大倍数分别为×10、×600、×3000、×400。
utMeMA在BCa肿瘤残留检测和复发监测中的应用。Re-TURBT被推荐给高级别和T1肿瘤的患者,但目前,我们缺乏有效的方法来评估患者是否真的有肿瘤残留。在我们的建模和验证队列中,47名患者接受了Re-TURBT,并在手术前收集了样本,其中15名患者有肿瘤残留,32名患者没有残留肿瘤。有趣的是,与无肿瘤残留的患者相比,肿瘤残留患者的UD评分显著增加(图6A)。重要的是,utMeMA对15例残留肿瘤中的14例(93.3%)作出了正确诊断,但细胞学和FISH分别只诊断了11例中的3例(27.3%)和9例(64.3%)(图6、B和C)。utMeMA的特异性为87.5%,与细胞学和FISH相似(图6C)。这些令人惊讶的发现表明utMeMA可以用来检测肿瘤残留,并作为选择再次TURBT患者的预测指标。
鉴于NMIBC患者的高复发率,开发一种无创和敏感的方法来监测复发是很重要的。我们观察到第一次晨尿和随机尿的UD评分有很高的一致性,表明随机尿也适用于BCa的检测(补充图10,A和B)。接下来,我们从SYSMH招募了另外81名接受监测的患者,并在接受膀胱镜检查之前收集了尿样。随后发现肿瘤复发38例,无复发43例。有趣的是,复发患者的UD评分明显高于未复发患者,并且与肿瘤负担呈正相关(图6D补充图10,C-F)。重要的是,utMeMA准确检出了38例复发患者中的34例(89.5%),但细胞学和FISH分别只检出了35例复发患者中的11例(31.4%)和26例复发患者中的19例(52.8%)(图6,E和F)。UtMeMA的特异性为81.4%,与细胞学和FISH无统计学差异(图6F)。对utMeMA结果呈阳性但没有复发证据的患者的随访正在进行中,他们将在未来的研究中进行重新评估。在亚组分析中,utMeMA的敏感性比尿脱落细胞学和FISH有很大提高,特别是在低级别(75.0%比12.5%,25.0%),NMIBC(84.6%比13.0%,37.5%),以及小肿瘤和单个肿瘤(75.0%比0%,33.3%)(图6,G-I,补充图10G)。utMeMA可作为监测BCa复发的一种无创、高度敏感的方法。
图6. utMeMA在检测残存肿瘤和监测BCa复发方面的应用。(A)有无肿瘤残留的BCa患者(n=47)的UD评分分布。统计学意义采用非配对t检验(双尾)。数据显示为四分位数之间的中位数。(2)Re-TURBT队列的病理特征和检测结果,其中残留肿瘤15例,无肿瘤32例。(C)utMeMA检测肿瘤残留的敏感性和特异性,与尿细胞学和FISH(n=47)比较。(4)UD评分在有无肿瘤复发的BCa患者中的分布。数据显示为四分位数之间的中位数。统计学意义采用非配对t检验(双尾)。(E)监测队列的病理特征和检测结果,其中肿瘤复发38例,无复发43例(n=81)。(F)与尿脱落细胞学和FISH(n=81)比较,评价utMeMA检测肿瘤复发的敏感性和特异性。(G-I)以肿瘤分级(G)、分期(H)和大小(I)为指标检测复发性BCa患者utMeMA的敏感性,并与尿细胞学和FISH(n=38)进行比较。采用χ2检验(C、F、G-I)评定统计学意义。*P<0.05,**P<0.01。