ngs数据分析结果只占一篇science文章的一张大图的3张子图
了解science杂志的都知道,发表在上面的研究文章通常只有4张figures,不过每一张图其实是多张子图的合并,而我今天要介绍的文章就很有趣,本来应该是纯粹的湿实验文章,但是却引入了ngs数据,虽然只占版面的一张大图的3张子图!保持遗传稳定性的两个关键机制包括DNA损伤修复 (调控基因组稳定性)以及有丝分裂检测点(调控染色体组稳定性)。ATR蛋白是一个与ATM 相关的调控DNA损伤修复的主要蛋白激酶,在DNA复制过程中ATR的丢失会增加S期的基因组不稳定性并影响随后的有丝分裂。FOXM1这个转录因子在大部分癌症是高表达的,也有文献表现它的高表达量加速了细胞分裂。背景知识细胞周期检查点细胞周期检查点 (checkpoint)是细胞周期(cell cycle)中的一套保证DNA复制和染色体(chromosome)分配质量的检查机制,是一类负反馈调节机制。当细胞周期进程中出现异常事件,如DNA损伤或DNA复制受阻时,这类调节机制就被激活,及时地中断细胞周期的运行。待细胞修复或排除故障后,细胞周期才能恢复运转。根据在细胞周期(cell cycle)中的时间顺序,可将checkpoint分为三类 ,G1/S, G2/M, and metaphase/anaphase transitions.1:G1期 (Restriction) Checkpoint2:G2 Checkpoint3:Metaphase Checkpoint (细胞分裂期,M期)也就是说,从S(DNA合成期)到 G2(DNA合成后期)的调控目前是不清楚的。细胞有丝分裂周期有丝分裂(mitosis)又称为间接分裂,分裂具有周期性,即连续分裂的细胞,从一次分裂完成时开始,到下一次分裂完成时为止细胞周期细胞周期,从形成子细胞开始到再一次形成子细胞结束为一个细胞周期。在有丝分裂期间,细胞会将其复制的基因组分成两个相同的子细胞。 这个过程必须毫无错误地进行,否则就会出现增殖性疾病(例如癌症)。 一个细胞周期包括两个阶段:分裂间期和分裂期。分裂间期分G1(DNA合成前期)、S(DNA合成期)、G2(DNA合成后期) 期,分裂间期为分裂期进行活跃的物质准备,完成DNA分子的复制和有关蛋白质的合成,同时细胞有适度的生长(这两个阶段所占的时间相差较大,一般分裂间期大约占细胞周期的90%-95%;分裂期大约占细胞周期的5%-10%。细胞种类不同,一个细胞周期的时间也不相同。)M期,即分裂期又分为分裂前期、分裂中期、分裂后期和分裂末期。细胞在分裂之前,必须进行一定的物质准备。细胞增殖包括物质准备和细胞分裂整个过程。有丝分裂是一个连续的过程按先后顺序划分为间期、前期、中期、后期和末期五个时期,在前期和中期之间有时还划分出一个前中期。与有丝分裂有关的细胞器中心体——与纺锤体的形成有关;线粒体——与提供能量有关 ;高尔基体——与植物新形成的细胞壁有关;核糖体——与全过程需要的蛋白质合成有关,主要与间期进行的DNA复制需要的蛋白质有关;纺锤体——纺锤体是产生于细胞分裂前初期到末期的一个特殊细胞器。有丝分裂相关基因在 Gene Ontology (Gene Ontology Consortium) 数据库有注释这个功能相关基因集,属于C5_BP: Archived GO biological processhttp://amigo.geneontology.org/amigo/term/GO:0007067http://software.broadinstitute.org/gsea/msigdb/cards/MITOSIS主要基因有:
基因组稳定性维持是一切生命活动的基础,然而,多种外源和内源因素作用下产生的广泛DNA损伤和复制压力,构成了基因组不稳定的主要来源。ATR激酶负责启动细胞对基因组不稳定的响应和修复,一旦感应到DNA损伤和复制叉压力会迅速活化,直接磷酸化细胞内超过1000个重要底物(包括抑癌基因p53编码蛋白、细胞周期调控蛋白等),全局性地调控基因组的稳定。ATR及其参与的信号通路对基因组稳定,肿瘤的发生、发展和治疗至关重要。https://ghr.nlm.nih.gov/gene/ATRhttps://www.genecards.org/cgi-bin/carddisp.pl?gene=ATR转录组数据文章里面写到了,数据上传到了GSE116131,如下:
实验设计的很好,随意进入一个组,GSM3209418可以看到都是3个测序数据的:Runs: 3 runs, 121.5M spots, 18.5G bases, 7.2GbRun# of Spots# of BasesSizePublishedSRR740785643,592,8416.6G2.6Gb2018-11-17SRR740785738,547,7065.9G2.3Gb2018-11-17SRR740785839,364,7536G2.4Gb2018-11-17转录组数据分析流程算是中规中矩,如下:
作者公布了其分析后的表达矩阵,同时也有测序数据,所以如果自己想对这个数据集做一下超出基因表达量的其它分析,可以考虑下载原始数据自己走一波分析,数据如下;
各种配对的差异分析后,作者展现的是热图,但不是表达量热图,而是差异倍数的热图,通过python脚本聚类后把1767个显著差异基因分成5组。
其中一个差异分析结果,作者还把火山图展示了一下:
作者最关心的是第五组,进行GO注释分析其功能是细胞有丝分裂相关的 :
为了说明第5组基因的特别之处,作者根据背景知识,去ENCODE数据库里面挑选了一下公共CHIP-seq数据集来展示:
当然,RNA-seq这样的转录组数据,最后是少不了RT-qPCR这样的实验验证。
点评本研究既然发表在science杂志,科研水平那必须是值得肯定的,其实本来是纯粹的各种各样的传统分子细胞生物学湿实验组合即可,但是研究团队仍然是引入了RNA-seq这样的测序数据,虽然分析很普通,而且测序数据结果分析只占用了全文不到5%的篇幅,但仍然是一个很好的兆头,可以这样说,以后的生物学研究终于要走入正轨了,全面信息化!可以这么说,以后那些没有生物信息学数据分析的生物学研究是不完整的。■ ■ ■