如何筛选单基因进行诊断发3+分

Potential Prognostic and Diagnostic Values of CDC6, CDC45, ORC6 and SNHG7 in Colorectal CancerCDC6、CDC45、ORC6和SNHG7在结直肠癌中的潜在预后和诊断价值

一、 研究背景

结直肠癌(CRC)是世界上最常见的癌症之一,也是导致癌症相关死亡的主要原因。虽然近年来外科技术和辅助化疗的进展改善了临床结果,但晚期患者的预后仍然不佳。随着技术的进步,全基因组分子谱被用来筛选和识别几种癌症的关键基因。通过对GEO数据集和TCGA数据库进行mRNAs和lncRNAs差异分析,找到与CRC患者的生存结局相关的关键分子,是寻找潜在的CRC诊断策略和判断预后的迫切需要。

二、 分析流程

三、 结果解读

1.DEGs和DELs鉴定肿瘤和非肿瘤样品之间的差异表达

作者对四个GEO数据集进行DEGs分析并以 |log2 fold change (FC)| ≥ 1 and P < 0.05 为标准绘制火山图,然后再用维恩图来展示了不同GEO数据集之间上调和下调基因的重叠情况,包括306个显著上调基因(图1.E)和显著下调基因213个基因(图1.F)。作者还对TCGA数据库进行DELs分析,发现有241个上调和244个下调的Lnc RNA(图1.G)。

图1.肿瘤和非肿瘤样品之间DEGS和DEL的鉴定

2.DEGs的功能富集分析

验证完差异表达后,作者用DAVID 数据库进行GO分析以确定519个重叠的DEGs的生物学功能,包括在生物过程,分子功能,细胞成分中的富集情况,并绘制了气泡图(图2.A-C),颜色越深,p值越小;点越大,基因越多。DEGs在生物过程中富集,主要参与细胞分裂 (p=4.11E-15)和有丝分裂核分裂(p=9.67E-15);与分子功能相关的基因主要与蛋白质结合(p=5.39E-06)和趋化因子活性(p=4.20E-05)有关;在细胞成分中,主要与纺锤体极(p=6.25E-06)和凝聚染色体核(p=9.20E-06)有关。

图2.D的气泡图和表1展示了DEGS主要参与的七种KEGG通路。癌症的其中一个特点是由于细胞周期活动异常而解除增殖信号的调节, 因此细胞周期调节剂被认为是癌症治疗的潜在靶点。后面作者选定其中三个关键分子(CDC6,CDC45,ORC6)均参与了细胞周期的通路。

图2.DEGS的GO和KEGG通路富集分析

表1.配对肿瘤与非肿瘤样本之间DEGs的路径分析

3.CDC6、CDC45、ORC6和Inc RNA SNHG7在结直肠癌数据集的表达及与临床关系

图3展示了作者选择这四个目标分子的原因,CDC6、CDC45、ORC6和SNHG7在CRC中有重要的预后价值,在TCGA高表达CDC6、CDC45和SNHG7具有更好的无复发生存率(RFS)和总生存率(OS) ,并通过log rank检验计算p值。

图3.TCGA中不同水平CDC6、CDC45和SNHG7表达的Kaplan-Meier生存曲线

接着作者在四个GEO数据集(图4)和TCGA数据库(图5)中验证了,与非癌组织相比,CDC6、CDC45、ORC6和SNHG7在CRC组织中过表达。

图4.GSE8671、GSE21510、GSE32323和GSE39682数据集中CDC6(A)、CDC45(B)和ORC6(C)的表达

图5.TCGA数据集中CDC6(A)、CDC45(B)、ORC6(C)和lncRNA SNHG7(D)的表达

验证完表达以及与预后的关系,作者使用t检验进一步分析发现CDC6和CDC45可能与TNM分期(p<0.001),淋巴结转移(p<0.001)和远处转移(p<0.001)有关;并且ORC6的表达与浸润深度有关(p=0.003)。但作者未发现SNHG7与 TNM分期、浸润深度、淋巴结转移和远处转移之间的联系。

表2.GSE39582数据集CDC6、CDC45、ORC6和CRC临床病理特征表达水平的关系

4.CDC6、CDC45、ORC6和Inc RNA SNHG7表达作为结直肠癌预后指标

作者根据表达均值将患者分为高表达组和低表达组,通过GSE39582(图6)和TCGA数据集(图3)的Kaplan Meier生存分析,评估了DEGs和DELs表达与CRC患者预后的相关性。在GSE39582的CRC样本中,基于250天的随访CDC6、CDC45和ORC6低表达患者的RFS 和 CDC6、CDC45低表达患者的OS明显较差。CDC6、CDC45对预后的影响与图3的TCGA生存分析结果大致相同,但是在TCGA中,ORC6的表达与OS和RFS之间没有显著的相关性,所以图3并无给出此结果。同时,在TCGA中高SNHG7表达的CRC患者OS明显较差。

图6.GSE39582中不同水平CDC6、CDC45和ORC6表达的Kaplan-Meier生存曲线

GSE39582中CRC病例RFS的单因素Cox回归分析(表3)表明,低CDC6、CDC45或ORC6表达(P<0.001)、TNM分期 (I/II 、III/IV)(P<0.001) 、 淋巴结转移 (N0、N1/N2)和肿瘤浸润深度(T1/T2、T3/T4)是影响预后的危险因素。随后的多因素分析表明,低 CDC6、CDC45和ORC6表达是除了TNM分期、淋巴结转移和肿瘤浸润深度外影响CRC患者RFS的独立预后因素。此外,TCGA中CRC样本的多因素分析表明,SNHG7表达、远处转移和TNM分期是影响CRC患者OS的三个独立的预后危险因素(表4)。以上结果表明,上调 SNHG7和下调CDC6、CDC45和ORC6可以预测CRC患者的预后。

表3.GSE39582数据集CRC标本基因(CDC6、CDC45和ORC6)表达与病理参数的相关性

表4.TCGA中CRC标本lncRNA SNHG7表达与病理参数的相关性

5.DEGs和DEL的实时PCR验证

为了验证差异DEGs表达,作者在198对配对CRC和邻近粘膜标本中进行了RT-PCR检测了CDC6、CDC45、 ORC6和SNHG7表达。它们在癌症样本中的表达水平显著高于正常组织样本 (P<0.001)。如果这里能够验证四个分子对结直肠癌的预后会更好,但是作者缺乏CRC样本的预后数据。验证完表达后,作者探讨了患者中表达水平与临床病理分期的关系。如图8所示,CDC6表达水平与T期、 N期和TNM期显著相关(图8.A);CDC45水平与T期和TNM期显著相关(图8.B);ORC6水平与N期显著相关(图8.C);SNHG7水平与M期显著相关(图8.D)。

图7.198个CRC和个体匹配的相邻粘膜样品中差异表达基因的验证

图8.临床病理特征与CDC6(A)、CDC45(B)、ORC6(C)和SNHG7(D)表达的关系

此外,在CRC组织中,lncRNA SNHG7水平与CDC6/CDC45/ORC6水平呈正相关(图9)。这表明SNHG7可能通过调节CDC6、CDC45或ORC6的表达而影响CRC的细胞周期,但作者未做进一步验证。

图9.在198例CRC患者中,lncRNA SNHG7水平与CDC6(A)、CDC45(B)和ORC6(C)水平呈正相关

6.mRNA和lncRNA水平对区分健康与CRC患者的诊断作用

最后,通过生成SNHG7、CDC6、CDC45和ORC6表达的ROC曲线,评估SNHG7、CDC6、CDC45和ORC6在鉴别CRC和良性疾病方面的潜在诊断效用。作者发现SNHG7曲线下的 ROC面积(AUC)为0.84;CDC6 为 0.88;CDC45为0.82;ORC6 0.85,诊断效果较好。然而,作者没有用血清样本来验证他们的观点。

图10.ROC分析,分析SNHG7,CDC6,CDC45和ORC6表达区分CRC与良性疾病的能力

小结

本篇文章中研究思路和过程都非常简单,通过基因表达谱分析鉴定了519个DEGs和485个DELs作为诊断CRC的候选生物标志物,并进行了功能富集分析,进一步选定了四个分子作为研究对象。通过比较不同数据集中的表达发现,目的分子在CRC中均上调,并对CRC预后和临床病理表现有显著影响。最后用PCR验证了临床配对样本,用ROC曲线分析了CDC6、CDC45、ORC6和SNHG7的诊断作用。这些结果表明,这四个基因可能与CRC的启动和进展有关,可作为CRC的潜在诊断、治疗和预后靶点。

(0)

相关推荐