精准医学: 应用脑脊液游离DNA全基因组甲基化测序筛选小儿髓母细 胞瘤早期诊断与预后监测的可靠生物标志物|液体活检专题
易点评
本文是液体活检DNA甲基化标志物发现的典型研究案例。儿童脑恶性肿瘤如髓母细胞瘤(MB)致癌基因突变频率较低,但DNA甲基化改变明显,根据MB的这一特点作者使用了WGBS和CMS-IP-seq技术分别进行甲基化与羟甲基化监测,并将实验结果与大型公共数据库(Illumina Human Methylation 450K芯片数据、已发表的儿童MB患者WGBS数据)相结合,针对MB肿瘤脑脊液(CSF)中的ctDNA差异甲基化CpG位点进行了鉴定,确定了可靠的MB DNA甲基化信号,从而证实了一些特定的表观遗传标记可以用来监测MB肿瘤的发生与复发、确定MB肿瘤亚型以及评估治疗效果这一系列结论,为帮助改善MB患者临床治疗以及药物靶点选择的相关研究做出了贡献。
前言
髓母细胞瘤(MB)是儿童最常见的脑肿瘤,被认为是源于胚胎期的小脑恶性肿瘤。虽然MB的细胞来源尚不清楚,但已推测MB肿瘤细胞起源于早期的神经干细胞或祖细胞。根据其分子特征,MB可分为四种亚型:WNT(wingless)途径激活型,SHH (Sonic hedgehog)途径激活型,以及特征较差的3型和4型。与成人癌症和其他儿童癌症相比,MB的基因组突变非常少。最近的研究表明,不同的MB亚型具有不同的表观遗传学特征,并在肿瘤进展和临床治疗过程中会发生DNA甲基化的动态变化。DNA低甲基化与MB基因表达增加密切相关,这表明DNA去甲基化可能在MB的发病机制中起着关键作用。双加氧酶Ten-11易位家族通过催化5-甲基胞嘧啶(5mC)氧化生成5-羟甲基化(5hmC)、5-甲酰胞嘧啶和5-羧基胞嘧啶,在DNA去甲基化过程中发挥重要作用。在这些氧化的5mC衍生物中,5hmC是主要的催化产物,是调控染色质可及性和基因转录的表观遗传标记。循环肿瘤DNA(ctDNA)或癌组织中5hmC对多种肿瘤(如B细胞淋巴瘤和结肠癌)的诊断和预后价值已有报道,但其对儿童脑肿瘤的诊断和预后价值仍有待确认。
目前,MB的诊断依据是临床症状和放射学结果,并通过组织病理学检查进行最终确认。对于3型和4型MBS,大约30%的患者在诊断时显示出转移的迹象。除了对可检测到的转移进行影像学评估外,通常在确诊时要进行腰椎穿刺(LP)以完成分期过程,并根据Chang分期系统(1969年Chang等报道的分期系统)对播散性病例进行分类。常规核磁共振成像(MRI)一般在治疗期间和治疗后进行,以评估治疗效果和复发监测。二次LP通常在治疗结束时和需要临床指征时进行。影像学的新诊断技术的发现明显改善了治疗监测和评估的效果。然而,人们仍然迫切希望能够有一种独立的方法,在使用先进的成像技术(例如MRI、计算机断层扫描、正电子发射断层扫描和单光子发射计算机断层扫描)发现解剖学或代谢变化之前,能够可靠地监测肿瘤治疗效果、检测肿瘤早期复发。
液体活检是基于对血浆或其他体液中的ctDNA、外泌体或循环肿瘤细胞进行分析的一种检测技术,已成为帮助许多实体肿瘤的进行及时检测、分子图谱和反应监测的一种很有前途的检测方法。然而,由于血脑屏障的存在,血浆中来自脑肿瘤的ctDNA含量明显低于来自外周实体肿瘤的ctDNA含量。与血浆相比,脑脊液(CSF)会更频繁地与中枢神经系统(CNS)中的脑瘤细胞相互作用,因此可以作为脑肿瘤液体活检的底物。有研究表明,脑脊液ctDNA的突变与脑瘤的遗传改变是平行的,其可以作为监测脑瘤状态的可靠来源。然而,脑脊液ctDNA的修饰是否真实地反映了脑肿瘤的表观遗传学特征仍未得到充分的研究证明。在本研究中,我们采用了全基因组亚硫酸氢盐测序(WGBS)和anti–cytosine-5-methylenesulfonate(anti-CMS)免疫沉淀测序(CMS-IP-seq)方法,对极少量的MB患儿脑脊液ctDNA进行了DNA甲基化和羟甲基化的检测。检测结果显示脑脊液标本与肿瘤组织呈正相关,提示脑脊液ctDNA可作为监测MB肿瘤DNA甲基化和羟甲基化的材料。此外,通过对同一患者连续脑脊液标本中纯化的ctDNA的DNA甲基化动态分析,肿瘤特异性DNA甲基化特征出现在阳性细胞学分析之前,这表明我们的方法在调节MB疾病状态方面具有高敏感性和潜在的高临床影响。此外,通过将脑脊液ctDNA的表观遗传学变化与MB患者的临床结果相关联,我们确定了在CSF ctDNA中可检测到具有诊断和预后价值的DNA甲基化标志物,以辅助MB的治疗。
结果
小儿MB患者脑脊液ctDNA的DNA甲基化和羟甲基化分析
为了表征脑脊液中的游离DNA,我们使用从预先离心的脑脊液样本中提纯的DNA进行了生物分析仪分析(图S1A)。我们观察到大多数DNA片段的大小在100-400(bp)个碱基对之间,峰大小在200bp,这与以前的报道一致。这一发现表明,在分析的样本中,脑脊液中的大部分DNA是ctDNA。为了分析脑脊液中MB ctDNA的DNA甲基化和羟甲基化模式,我们使用这些预先离心的CSF样品,在从冷冻箱中回收后,使用或不使用额外的离心,准备了测序文库(图S1A和B以及表S1)。我们发现200μl的CSF在没有额外离心的情况下产生了足够的ctDNA,可以用来构建适合测序的高质量文库(图S1C和表S1)。与以前的方法相比,我们的优化方法,使用随机引物构建亚硫酸氢库,需要更少的CSF (0.2ml比1ml)。然而,低输入量加上ctDNA的小片段大小可能导致低的定位读取率,从而导致高成本。因此,我们开发了LiBis,一种可以显著提高低输入DNA(图S1D)亚硫酸氢盐测序定位读数比率的方法。然后,我们从患者1、2和3收集匹配的MB(SHH)肿瘤和CSF样本,从患者4(图1A)收集MB(WNT)和CSF样本进行综合表观基因组分析。为了测试CSF是否可以用来监测治疗后的肿瘤状态和预测复发,我们还收集了治疗期间和治疗后患者2、3和4的总共8个MB CSF样本(图1A和表S1)。以4例脑积水患者的脑脊液和2例急性淋巴细胞白血病患者的脑脊液样本作为非肿瘤性脑脊液替代对照,2例正常小脑组织作为组织对照(图1A)。总体而言,通过WGBS分析,我们至少三次获得覆盖了1300万个CpG位点的平均6亿次的数据读取量,DNA甲基化比率呈双峰分布,在沿着读取的前10bp进行修剪后没有M偏倚(图S1、E和F,以及表S1)。平均DNA甲基化水平接近0.6~0.8,这与先前的研究结果一致(图S1G)。同时,我们使用CMS-IP-seq方法收集了平均2300万个读取数据,产生了平均85,000个5hmC富集区(表S1)。正如以前的文献所描述的那样(图S1H),后生基因的ctDNA甲基化和羟甲基化的分布模式与肿瘤组织的分布模式是一致的。此外,我们将本研究中获得的MB组织的WGBS数据与之前发表的MB肿瘤的WGBS数据进行了比较。我们还观察到这两个数据集之间的相对较高的皮尔逊相关系数(>0.5)(图S1I)。此外,在ctDNA和MB组织中,5hmC在四种亚型的共同的H3K27ac富集区均有富集(图S1j),这与5hmC在其他系统中的分布一致,包括胚胎干细胞、T细胞和B细胞。这些数据表明,我们的优化方案可以高质量地从脑脊液ctDNA中检测到DNA甲基化和羟甲基化。
为了进一步评估MB CSF的ctDNA中WGBS数据的数据质量,通过Pearson相关分析显示,匹配的MB CSF与肿瘤样本之间存在较高的Pearson相关系数(平均r>0.5),而非肿瘤CSF样本与MB肿瘤之间的Pearson相关系数相对较低(平均r<0.33)(图1B, 图S2, A和B)。这些发现表明,脑脊液ctDNA可以真实地反映代表MB原位肿瘤的DNA甲基化特征。同样,MB肿瘤和匹配的CSF ctDNA之间DNA羟甲基化分析的Pearson相关性在0.4到0.8之间(图1B,下图)。同时,为了估计这些DNA表观遗传标记物的个体差异,我们对被分析患者的脑脊液ctDNA甲基化和羟甲基化数据进行了成对比较。我们观察到个体之间存在显著的正相关,这表明DNA表观遗传标记可能相对保守,患者间变异较小(图S2C)。
接下来,我们比较了MB肿瘤和匹配的MB CSF中调控元件中的DNA甲基化和羟甲基化水平。我们观察到在包括转录起始点、外显子、CpG岛(CGIs)和启动子在内的基因区域内,肿瘤和脑脊液之间有相对较高的Pearson相关系数(平均r=0.7)(图S2D)。重复元素的Pearson相关系数相对较低(平均r=0.5),包括长散在的核元件(LINEs)、短的散在的核元件(SINEs)和长末端重复序列(LTRs)(图1D)。此外,CGIs上的DNA甲基化水平在MB肿瘤组织和MB CSF之间的相关性更强,并且在个体间高度一致(图1E和图S2、E和F)。这些结果表明,脑脊液ctDNA的CGIs中的DNA甲基化状态可以作为报告原始MB肿瘤状态的生物标志物。
图1.脑脊液ctDNA中的胞嘧啶修饰与在MB原位肿瘤中检测到的高度一致。(A)实验设计示意图。本研究采用正常小脑组织(n=2)、非MB脑脊液标本(n=6,4例无其他疾病症状的脑积水患者和2例无脑转移的急性淋巴细胞白血病患者)、配对的MB肿瘤组织、MB SHH患者的CSF样本对(患者1、2、3)和患者4的CSF样本(WNT)。(B)对脑脊液ctDNA样本与其匹配的MB肿瘤之间共有的共同CpG位点(至少覆盖10次)和共同羟甲基化区域的DNA甲基化状态进行Pearson相关分析。(C)对指定脑脊液ctDNA样本和已发表的MB肿瘤样本之间共有的CpG位点的DNA甲基化状态进行Pearson相关分析(n=34)。选定的CpG位点的最小覆盖率为5倍。(D)脑脊液ctDNA与匹配MB肿瘤之间DNA甲基化和羟甲基化的Pearson相关分析。(E)散点图显示脑脊液ctDNA甲基化水平与CpG岛(CpG岛)区域匹配MB肿瘤之间的相关性(CpG岛至少覆盖10次)。
MB CSF ctDNA的DNA甲基化和羟甲基化动力学
为了评估MB和正常小脑组织DNA甲基化和羟甲基化的差异是否体现在CSF ctDNA中,我们通过MOABS比较正常小脑数据、MB肿瘤数据和MB CSF数据(图2、A和B),确定了差异甲基化区域(DMR)或差异羟甲基化区域(DHMR)。与以前的报告一致,MB肿瘤显示DNA甲基化总体减少,但在CGIs处DNA甲基化增加(图S3A)。接下来,我们选择了我们认为在正常小脑和MB肿瘤之间以及在正常小脑和MB CSF之间共同的一个或多个DMR、DHMR。总共,我们分别获得了17898和1777个常见的hyper-、hypo-DMR以及39602个和20707个常见的的hyper-、hypo-DHMR(图2,A和B)。在MB CSF和MB肿瘤CGIs中的DMR和DHMR上的DNA甲基化平均Pearson相关系数r>0.6(图S3B)。MB CSF和正常小脑、MB肿瘤和正常小脑之间的甲基化差异高度一致,DMR内的Pearson相关系数在0.96到0.98之间(图2C),DHMR内的羟甲基化差异也非常一致(图2D)。这些数据有力地表明,MB肿瘤的ctDNA存在于CSF中,可以用来真实地反映MB肿瘤的DNA甲基化状态。
为了评估这些DMR和DHMR的功能,我们对基序进行了分析,并鉴定了几个在DMR和DHMR中富含的神经元功能相关转录因子(TF)基序,包括Olego2、Atoh1和NeuroD1(图2,A和B)。利用基因组区域富集注释工具进一步分析表明,这些DMR和DHMR主要集中在与小脑和中枢神经系统功能相关的重要基因以及基因组区域,尤其是MB肿瘤起源的浦肯野细胞-颗粒细胞前体细胞信号基因(图S3、C和D)。功能基因组分析进一步揭示,与hypo-DMR相比,hyper–DMR往往发生在由H3K27ac标记的基因区域和远端调控区域(图2E,左)。此外,DHMR显示了与DMR相反的富集模式(图2E,右)。例如,在基因区域,hypo-DHMR比hyper-DHMR富集的程度更大(图2E)。这些数据与之前观察到的肿瘤细胞中重复区域DNA甲基化水平较低和基因区域DNA甲基化水平较高是一致的。
据报道,DNA去甲基化与MB的发病密切相关。5hmC是DNA活性去甲基化过程中最重要的中间产物之一。因此,我们使用DHMR对正常小脑和MB肿瘤进行了多维尺度(MDS)分析。正常小脑组织与MB肿瘤和MB CSF清楚地分开,其中MB肿瘤和MB CSF样本是人为配对的(图2F)。请注意,患者1的肿瘤和脑脊液样本比其他患者的样本更接近正常小脑组织。我们还注意到,与其他被分析患者的两个相关系数相比,患者1的脑脊液和肿瘤组织之间的5hmC的皮尔逊相关系数相对较低(图1B和2B)。这可能是由于这些患者之间的临床分期不同(表S2)。然而,我们的总体结果表明,从CSF ctDNA获得的5hmC信号可以用于检测MB肿瘤的存在。例如,我们观察到与正常小脑相比,MB肿瘤和MB CSF中PRDM6位点的5hmC显著增加(图2G)。在这个位置,之前已经有过增强子驱动的PRDM6在MB中激活的相关报道。综上所述,这些分析表明,已鉴定的DMR和DHMR可能与中枢神经系统功能相关,DNA甲基化和羟甲基化途径的失调可能是MB发病的罪魁祸首。
接下来,我们分别比较了这些DMR和DHMR中DNA甲基化和羟甲基化的差异。为简明起见,我们将这些特征性DMR(或DHMR)定义为正常小脑和MB肿瘤之间以及正常小脑和MB CSF之间常见的DMR(或DHMR)。由于基于亚硫酸氢钠的DNA甲基化分析不能区分5hmC和5mC,所鉴定的DMR可能包含5hmC的变化。此外,由于5hmC是5mC的催化产物,识别出的DHMR也可能包含有关5mC变化的信息。因此,我们比较了DMR和DHMR的DNA甲基化以及基因组分布。我们观察到,超过一半的特征性DHMR(n=16,017,在hyper-DHMR中占所有CpG的51.1%;n=567,在hypo-DHMR中占所有CpG的56%)在肿瘤和脑脊液中的DNA甲基化比率与正常相比都不到20%(图S4、A和B)。这一结果表明,尽管特征性DHMR中的5hmC信号有显著差异,但超过一半的特征性DHMR不是特征性DMR,因为它们在肿瘤和脑脊液中没有同时表现出很大的WGBS信号差异。对WGBS数据的详细分析表明,在肿瘤组织和脑脊液中,特征性DHMR中CpGs的DNA甲基化比率主要在0.6到1.0之间(图S4、C和D)。只有一小部分羟甲基化的特征性CpGs,特别是hyper-DHMR的27%(6.8%±20.2%)和hypo-DHMR的10.1%(5.5%±4.6%),在肿瘤和脑脊液中都显示出强烈的(>20%)DNA甲基化变化(图S4,A到D)。类似地,极少的特征DMR保留为特征DHMR(图S4、E和F,图S5、A和B),这主要是由于5hmC的稀疏性。这些发现表明,特征性DMR和特征性DHMR既标记共同的基因组区域,又标记特定的基因组区域,并且是互补的。DNA甲基化和羟甲基化分析都需要得到MB肿瘤和MB CSF中DNA修饰动力学的支持。
图2.与正常小脑相比,MB肿瘤和MB CSF中DNA修饰的变化。(A)上图:显示小脑与MB肿瘤之间以及小脑与MB CSF之间的高DMR(左)或低DMR(右)的Venn图。下图:在共享的高DMR(左)或低DMR(右)中丰富的转录因子(TF)基序列表。(B)除羟甲基化外,与(A)项所述相同的分析。(C和D)散点图显示正常小脑与MB肿瘤、小脑与MB CSF ctDNA的5mC(C)或5hmC(D)差异的相关性。(E)(A)(左)所示的共享高DMR(红色)和次DMR(蓝)的基因组分布;(B)(右)所示的共享的高DMR(红)和次DMR(蓝)的基因组分布。Y轴分别报告DMR或DHMR相对于所有DMR或DHMR的百分比。长散在核元件;短散在核元件;LTR,长末端重复序列。(F)对(B)中标识的共享DHMR中的5hmC信号进行MDS分析。(G)加州大学圣克鲁斯分校(UCSC)小脑、MB肿瘤和MB CSF ctDNA中PRDM6基因座(chr5:122,433,516至122,435,744)5hmC富集的基因组。在MB肿瘤和MB CSF样本中,突出显示的区域均表明5hmC增加。
脑脊液ctDNA中MB甲基化特征的鉴定
正常小脑和MB肿瘤的DMR中有40,056个高分化甲基化胞嘧啶和20,498个hypo-DMCs。在这60554个DMC中,有6598个CpG位点在MB CSF中的甲基化方向与MB肿瘤相同,即它们相互平行,从而形成MB CSF与正常小脑、MB肿瘤与正常小脑之间的共享DMR。在MB CSF的DNA甲基化的背景下,我们将这6598个位点称为“MB CSF signature CpGs”(4253个高甲基化和2345个低甲基化的CpGs)(图3A)。由于这三个患者都是SHH亚型,MB CSF signature CpG则是MB CSF(SHH) signature CpG的缩写。这些CpG大多散布在基因组中。当我们合并相邻的CpG时,如果它们的距离小于300bp,这些标志性的CpG形成了705个区域,平均每个区域有2.35个CpG,而单个CpG有4943个。这一结果表明,即使在非常严格的MB CSF signature CpG选择标准下,我们也观察到一些signature CpG在它们位于相同的基因组位置时具有相同的甲基化动力学。功能基因组注释分析表明,6598个CpG大多位于基因丰富的区域。大约50%的CpG高甲基化位于MB肿瘤特异性H3K27ac富集区(图S6A)。与图2A所示的分析一致,对神经功能有重要作用的转录因子基序在这些CpG的100bp范围内富集[NeuroD1 (P = 1 × 10−28), Olig2 (P = 1 × 10−21), Atoh1 (P = 1 × 10−13), Oct6 (P = 1 × 10−5), and Pax6 (P = 1 × 10−5)]。这些数据表明,在H3K27ac标记的增强子中经常观察到异常的DNA甲基化,这些增强子接近MB中潜在的神经元特异性TF结合位点。接下来,我们研究了从非肿瘤个体(脑积水患者)中提纯的ctDNA的DNA甲基化作为对照,以进一步验证我们的结果。由于在健康人的脑脊液中未检测到ctDNA,因此我们在研究中使用了脑积水患者的脑脊液样本作为替代的非肿瘤对照。在这6598个MB脑脊液信号CpG中,通过要求最小测序深度5,我们在所有分析样本中检测到2027个共享CpG,包括2个正常小脑组织,4个非肿瘤脑脊液样本,3个MB肿瘤组织样本和3个MB脑脊液样本(图S6B)。接下来,我们使用这2027个常见DMC的DNA甲基化状态进行MDS分析。我们观察到正常小脑、非肿瘤脑脊液和MB样本(肿瘤组织和脑脊液)之间的明显分离,而我们将MB肿瘤和MB CSF聚在一起(图3B)。为了进一步证实这一数据,我们结合已发表的MB肿瘤WGBS数据,分析了这2027种常见DMC的DNA甲基化水平。我们观察到,这些CpG中的DNA甲基化水平不仅可以区分MB肿瘤(脑脊液和肿瘤)和非肿瘤(组织和脑脊液)标本,还能够区分MB肿瘤的亚型(图S6C)。例如,与非肿瘤样本(包括来自脑积水患者的小脑和脑脊液样本)相比,MB肿瘤组织和CSF样本中NEUROD1、STARD13和NCOR2位点的DNA甲基化水平显著升高(图3C和图S6D)。这些数据有力地表明,MB CSF中的特征性CpGs及其DNA甲基化一致地反映了MB肿瘤的特征,可以作为潜在的CSF生物标志物来提示MB的存在。
为了进一步测试signature CpGs是否可以用来表征MB亚型,我们使用两个公共数据库分析了MB CSF signature CpG位点的DNA甲基化状态。首先,我们研究了已发表的Illumina HumanMethylation 450珠芯片数据中的MB CSF signature CpG位点,该数据来自大约600名 MB患者肿瘤样本。在6598个MB CSF signature CpG中,有4602个CpG被阵列数据覆盖。这4602个CpG的DNA甲基化状态清楚地确定了600个被分析的肿瘤样本中的MB亚型(图3D)。其次,我们研究了从儿童MB患者收集的已发表的WGBS数据中的MB CSF signature CpG位点。如图S6E,四种不同的MB亚型在MB CSF signature CpG位点显示出不同的DNA甲基化模式。为了进一步获得全面的MB亚型特异性DNA甲基化signature,我们将我们的结果(图3A)与从已发表的WGBS数据集中鉴定的亚型特异性CpG进行了比较,并确定了1047个MB亚型特异性CpG位点。通过分析从4名MB患者采集的肿瘤和/或CSF样本中这些位点的DNA甲基化水平,我们进一步证实,这1047个CpG位点的DNA甲基化状态可以清楚地反映肿瘤亚型(图3E和图S6E)。接下来,我们选择了49个CpG(在1047个CpG中)位点,在SHH亚型中显示了最显著的亚型特异性DNA甲基化特征。如图3F所示,这49个CpG的DNA甲基化水平在我们自己的研究中的MB肿瘤和脑脊液中是一致的,也与SHH MB肿瘤的已发表的数据一致,但与正常小脑和其他MB肿瘤亚型明显不同。我们用两个独立的大型数据集的分析结果汇聚在一起,表明MB CSF signature CpG位点的DNA甲基化模式既可以反映MB肿瘤的存在,又可以用来帮助识别MB亚型,从而有可能在最初诊断时从CSF样本中确定MB亚型,并进一步指导治疗。
图3.用于癌症诊断的脑脊液ctDNA中的MB DNA甲基化特征。(A)MB CSF signature CpG处DNA甲基化水平热图(n=6598)。(B)MDS分析在小脑(深绿色)、MB肿瘤(红色)、MB CSF(橙色)和非肿瘤CSF(浅绿色)中检测到的MB CSF signature CpG的DNA甲基化水平。(C)指定样本中NEUROD1基因座(ChR2:182,539,000至182,550,000)的DNA甲基化和羟甲基化水平。(D)t分布随机邻近嵌入法(t-SNE)分析MB CSF signature CpG与已发表的来自大约600名MB患者的DNA甲基化阵列数据之间的共同CpG位点的DNA甲基化水平。WNT为紫色;SHH为栗色;第3组(G3)为深蓝色;第4组(G4)为浅蓝色。(E)对MB CSF signature CpGs和公开数据中确定的特定亚型CpGs之间常见CpGs的DNA甲基化状态进行Pearson相关分析(n=1047个CpG)。顶部:MB肿瘤样本中的甲基化状态。下图:MB CSF样本中的甲基化状态。(F)选定的49个亚型特异性CpG(共1047个CpG位点)的热图表示,这些CpG在三个SHH亚型MB CSF和MB肿瘤样本(本研究)和公共MB肿瘤数据之间显示出一致的DNA甲基化状态。
利用脑脊液ctDNA中MB的DNA甲基化特征探测疾病状态
为了进一步测试MB CSF signature CpG位点的DNA甲基化水平是否可以用来反映治疗效果和肿瘤复发,我们分析了从2名患者(2和3)连续时间点收集的CSF中的DNA甲基化水平(图4,A和B)。对于患者2,在诊断10个月(治疗7个月期间,图4A)收集脑脊液。我们观察了在不同疾病状态(诊断时、治疗期间和复发前;图4A)收集的CSF中MB CSF signature CpG位点的动态DNA甲基化变化。在6598个MB CSF signature的1106个CpG位点中,共有91个CpG位点(第3组)在治疗期间重新获得DNA甲基化,这表明这些CpG可用于评估治疗效果(图4A)。我们还观察到,在同一患者中,88个CpG位点(第4组)和227个CpG位点(第5和10组)显示出DNA甲基化的持续增加和减少,这表明了与MB相关的独立于治疗的表观遗传模式(图4A)。对于患者3,在确诊后6个月收集脑脊液(图4B)。在不同时间点采集的脑脊液中的MB CSF signature CpG位点也观察到了DNA甲基化的动态变化。在6598个MB脑脊液CpG位点的1336个中,第6组中共有77个CpG在治疗后DNA甲基化水平升高,这表明这些CpG可能与良好的治疗效果有关(图4B)。共有85个CpG(第14组)在治疗后立即显示DNA甲基化水平降低(与正常小脑组织相似)。4、9、10和11组中共有407个CpG位点在所有收集的样本中保持较高的DNA甲基化水平,这表明这些CpG可能代表肿瘤的恶性进展。我们发现,通过比较患者3中第2类和第5类中的203个CpG位点和患者2中第5类和第10类中的227个CpG位点,可以发现61个重叠的CpG显示出DNA甲基化的持续减少,而不管治疗方法如何(图4C)。在患者2的第4组和患者3的第4组、第9组、第10组和第11组之间发现了10个CpG重叠,与正常小脑(<0.2)相比,MB组(肿瘤和CSF;0.8~1.0;图4,A和B)的DNA甲基化水平较高。考虑到患者2和3在可比的持续时间内接受了类似的治疗(表S2),这些重叠的CpG可以用作反映肿瘤状态的可靠的CpG指数。
同时,我们还分析了从患者4(WNT亚型)连续脑脊液标本中提纯的ctDNA中的DNA甲基化。与我们的分析一致,我们观察到SHH和WNT肿瘤亚型之间的DNA甲基化有显著差异(图S7A)。由于没有来自患者4的匹配的MB肿瘤样本,我们比较了来自5个WNT亚型MB肿瘤的公开WGBS数据和来自患者4的脑脊液样本的WGBS数据(在诊断时收集;图S7B)。用类似的方法鉴定MB-CSF(SHH) signature CpGs,我们鉴定出9373MB-CSF(WNT) signature CpGs,其DNA甲基化水平在WNT-MB肿瘤和脑脊液中均与正常小脑不同(图S7C)。共有146个CpGs在MB CSF(SHH)和MB CSF(WNT) signature CpGs之间重叠,大多数CpGs的DNA甲基化程度高于正常小脑(表S4和图S7、D和E)。我们还检测了从患者4的连续脑脊液样本中提纯的ctDNA中的DNA甲基化(在诊断时、诊断后19个月和29个月没有复发;图4D)。在MB CSF(WNT) signature CpGs(n=9373)中,我们观察到1632个CpG在治疗过程中显示出动态的DNA甲基化变化(图4D)。具体地说,第9类CpG的DNA甲基化水平在治疗后(初诊后第19个月和第29个月)从85%下降到10%,与正常小脑的水平相当。第3类CpG的DNA甲基化在第19个月和29个月时呈动态变化(从10%到95%)。对于第1、2和第4组中的CpGs,这些CpGs在肿瘤、CSF和两个监测样本中显示出高的DNA甲基化水平(>80%),而在第5组中的CpGs的DNA甲基化水平较低(<20%)(图4D)。值得注意的是,本研究中大多数脑脊液样本的细胞学分析结果仍为阴性。然而,我们能够检测和分析这些患者脑脊液ctDNA中的DNA甲基化。此外,我们在MB患者的不同疾病阶段检测到了强烈的亚型特异性DNA甲基化特征,这表明该方法具有很高的灵敏度和可靠性。这些数据清楚地表明,MB CSF signature CpG位点的DNA甲基化状态可用于识别MB亚型和监测疾病进展(例如,治疗效果和复发)。
图4.治疗过程中脑脊液ctDNA中MB CS signature CpGs的DNA甲基化动态变化。(A)顶部:患者2的连续脑脊液采集和脑脊液细胞学结果的时间表。箭头表示脑脊液样本采集的时间点(红色箭头,本研究中使用的脑脊液样本)。下图:治疗期间正常小脑组织、MB肿瘤组织和CSF中MB CSF(SHH) signature CpGs的DNA甲基化状态热图。(B)顶部:患者3的连续脑脊液采集和脑脊液细胞学检查结果的时间表。底部:诊断和治疗期间正常小脑组织、MB肿瘤组织和脑脊液中MB CSF(SHH) signature CpGs的DNA甲基化水平热图。(C)群集5和10(患者2)和群集2和5(患者3)以及群集4(患者2)和群集4、9、10和11(患者3)之间重叠的CpG的维恩图。(D)顶部:患者4的连续脑脊液采集和脑脊液细胞学结果的时间表。底部:诊断和治疗后正常小脑组织、患者4的MB肿瘤组织、已发表的MB(WNT)肿瘤组织和患者4的CSF中MB CSF(WNT) signature CpGs的DNA甲基化状态热图。
脑脊液ctDNA中潜在的预测儿童MB预后的DNA甲基化标志物
为了进一步检验脑脊液中MB标志性CpG的DNA甲基化是否可以作为潜在的预后标志物,我们对MB CSF(SHH) signature CpGs(图4A)和先前研究中关于总生存期(OS)的信息进行了单变量Cox比例风险分析。我们鉴定了224个探针,它们与MB患者的OS显著相关(P<0.001)(表S3)。例如,如图5A所示,在我们的研究中,位于C9orf3内含子内的一个CpG位点(cg14582550;chr9:97,786,878到97,786,879)显示MB样本(肿瘤和CSF ctDNA)中DNA甲基化显著增加,这与早期使用Illumina HumanMethylation 450珠芯片的报告一致(图5,B和C)。通过将该位点的甲基化状态与患者的生存信息相关联,我们发现该位点甲基化水平高的患者(>0.0001)的存活率显著低于该位点的低甲基化水平的患者(≤0.8)(图5D)。我们进一步检测了覆盖C9orf3基因体的七个探针(分别位于探针cg14582550上下游的三个探针)的DNA甲基化水平,并观察到与单一探针cg14582550相同的存活率(图S7F)。接下来,我们随机选择了438名和189名患者作为训练和验证数据。通过使用MB signature CpGs对训练数据进行多元Cox回归分析,我们使用逐步回归方法从包含2到5个CpG位点的所有可能组合的模型中选择训集中均方根误差最小的最佳线性模型。最佳线性模型为Y(survival score) = 2.343 + mCG/CG ratio of CpG#1 (cg27490391) * 3.528 + mCG/CG ratio of CpG#2 (cg27579805) * 1.598 + mCG/CG ratio of CpG#3(cg27638288) * (−0.771)。Cg27490391探针位于LHFP基因体,cg27579805探针位于TNRC6C的3‘非翻译区,cg27638288探针位于非遗传区。与正常小脑相比,MB肿瘤中这三个CpG位点的DNA甲基化显著增加(图S7G)。然后,我们使用这个公式为训练数据集中的每个患者(n=438)计算生存分数。根据中位生存评分,患者可以清楚地分为低风险组和高风险组。在训练和验证数据集上,存活率分数高的患者的预后明显好于存活率分数低的患者(图5,E和F)。综上所述,我们的数据清楚地表明,MB CSF signature CpG位点的DNA甲基化状态可以作为潜在的预后标志物来预测MB患者的临床结果。
图5.探讨脑脊液ctDNA中MB DNA甲基化信号对临床结果的预测价值。(A)显示位于正常小脑、非肿瘤CSF、MB CSF ctDNA和MB肿瘤的C9orf3内含子内的CpGs(chr9:97,786,878到97,786,879)的DNA甲基化和羟甲基化水平,包括来自这项研究的数据和34个公开的WGBS数据库。(B和C)表示图4A中突出显示的单个CpG位点的DNA甲基化水平的盒图,使用先前公布的DNA甲基化阵列数据。(D)MB患者的Kaplan-Meier生存曲线,根据图4A中突出显示的单个CpG位点的甲基化比率截止值80%来划分。(E和F)采用Kalan-Meier曲线和对数秩检验,使用模型中三个CpG的甲基化比率,可视化比较训练队列(n=438名患者)(E)和验证队列(n=189)(F)中低风险组和高风险组之间的OS。