9+纯生信泛癌预后标志物筛选

Landscape of cancer diagnostic biomarkers from specifically expressed genes基因特异性表达的癌症诊断生物标志物的概括

一. 研究背景

诊断时间较晚以及治疗时间有限是导致癌症死亡率高的主要原因,因此可以尽早准确检测出癌症十分重要。但目前的癌症生物标志物缺乏特异性和敏感性,如肝癌的诊断标志物甲胎蛋白在慢性肺炎患者中也为阳性。

由于特异性表达的基因(SEG)具有天然的高特异性以及敏感性,且许多疾病与之有关,因此可以作为诊断标志物。作者使用R包中“SEGtool”对SEG进行研究,SEGtool由作者开发并于2017年发表于该杂志。

二. 分析流程

三. 结果解读

1. SEG在癌症、癌旁组织以及正常组织的分布情况

作者首先对33种癌症进行全面的研究,分别分析了癌组织、癌旁组织以及正常组织中的SEG。

图1. SEG在癌症、癌旁组织以及正常组织的分布

A图:对33种癌症缩写的解释

B图:(数据来源:TCGA)33种肿瘤的SEG数量的柱状图

  • 蓝色:在多个组织中表达的SEG,共2558种

  • 红色:在单个组织中表达的SEG,共1075种

分析:每个癌症类型的SEG数量明显不同,表明这些癌症的异质性。大部分少于100,而与神经系统(GBM、LGG和PCPG)、血液系统(DLBC和LAML)以及生殖系统(TGCT)相关的癌症有100多个SEG,说明他们是专门的系统和疾病

C图:(数据来源:TCGA)其中24个癌旁组织的SEG的柱状图

  • 蓝色:在多个组织中高表达的SEG,共2954种

  • 红色:在单个组织中高表达的SEG,共1081种

D图:(数据来源:GTEx)正常组织的SEG数量的柱状图

  • 3281个SEG中鉴定出1601个

2. 鉴定cSEG作为实体瘤的诊断标记

cSEG:仅在一种癌症中特异性表达的SEG。

图2. 15种癌症的cSEG筛查与分布

A图:cSEG的筛选流程

  • 仅在单个癌症中表达而在癌旁组织、正常组织中不表达的SEG。

B图:15种癌症中cSEG的数量与频率

  • 红色:表达频率 > 80%(3种)

  • 蓝色:表达频率 > 70%(43种)

  • 黄色:表达频率 > 60%

  • 绿色:表达频率 > 50%

注意:KICH(肾脏癌)具有最多的高表达频率cSEG(> 70%,38/43),以及全部的最高表达频率cSEG(> 80%,3/3)

3. 鉴定早期癌症的诊断标记

由于通过早期癌症检测可以预防大多数癌症的死亡,作者便着手分析早期癌症的标志物,根据样本的临床信息(数据来源:TCGA)将癌症数据从T1到T4分为四个阶段,随后确定每个阶段的SEG。

图3. 21例T1期肿瘤SEG分布及17例T1期肿瘤高频标记的研究进展

A图:21种T1期癌症的SEG的数量,共560个

B图:17个T1期癌症中cSEG的数量以及其高表达频率,233个表达频率高(> 50%)

注意:KICH具有最多的T1期标志物(79个),其中ACO2和MUDENG超过90%(深蓝),即具有高灵敏度。

4. 癌症诊断中的双基因标记

双基因组合而成的生物标志物在癌症诊断和预后中具有巨大的发展潜力。由于单个cSEG的低频会导致灵敏度较低,因此双基因组合策略可以在多种癌症的鉴定方面具有更高的敏感性。

表1. 13种癌症中频率最高的cSEG双基因标记

表2. 各癌症T1阶段中频率最高的双基因标记

以上这些基因组合具有较高的敏感性以及特异性,可供早期诊断癌症。

5. cSEG可作为癌症药物的重要潜在靶标

图4. 美国FDA批准的药物在七种癌症中的靶点

作者比较了美国FDA批准的7种癌症(红)的抗癌药物的SEG靶标(蓝),确定了13种SEG(是众多药物的靶点)。(数据来源:hTFtarget) 其中约有一半药物用于相应癌症(绿),另一半是针对其他癌症所开发的药物(橙)。

  • 推测:部分药物以SEG为药物靶点而重新作用于癌症,潜在地用于治疗其他癌症。

6. SEG的调控网络

由于转录因子在癌症的发生以及发展中起着关键作用,因此作者从SEG中鉴定了转录因子及其靶标,并进行监管网络分析以显示SEG受到监管的机制。

图5. 六种肿瘤特异表达TFs的调控网络及SEGs靶基因

  • 共有24种癌症以SEG为转录因子,作者选择其中6种展示它们的调控网络。

  • 三角:转录因子(红色:与预后无关;浅蓝色:与预后相关)

  • 圆圈:靶基因(橙色:与药物相关;蓝色:与预后无关;绿色:与预后相关)

部分转录因子是癌症中特定的关键基因,如LUSC中的TP63,BRCA中的GATA3。而部分转录因子是与预后相关,如KICH中的GATA2,COAD中的CDX2 。由于KICH和GBM的SEG较多,因此其调控网络也更为复杂。

作者通过TCGA与GTEx数据库,筛选出癌症特异性表达和高敏感的基因(尤其是早期阶段),并确定了具有更高灵敏度和特异性的双基因标记,进而构建了这些基因的监管网络。同时,高选择性靶基因的分子药物或抑制剂可减少副作用。这些结果对于癌症的诊断以及治疗有着重要作用。

编辑:鳕鱼堡

校审:糯米饭

(0)

相关推荐