这款全能型的肿瘤挖掘工具更新了,加速课题进展

解螺旋公众号·陪伴你科研的第2505天

这款全能型工具,不容错过!

我们解螺旋曾在2019年给大家介绍过一款重磅挖掘TCGA数据库的工具,一款超牛超好用的超燃神器,是由华中科技大学生命科学院郭安源教授课题组开发的GSCAlite,近日他们对这个工具进行了重磅升级,升级后的GSCA添加了新功能,使用也更加方便了。

你所知道的差异表达、GSEA、生存分析、GSVA、免疫细胞浸润、CNV、DNA突变、DNA甲基化、药物敏感性,以及上述多种因素间的关联分析,它统统能做!不服不行!工具网址为:http://bioinfo.life.hust.edu.cn/GSCA

郭教授之前的GSCAlite于2018年发表在生物信息学领域著名期刊《Bioinformatics》上,如果GSCA对大家的研究有帮助,大家可以引用这篇。

进入GSCA主页后,我们可以看到主页的最左边是功能模块选项,主要包括Expression、Immune、Mutation、Drug共4个;最右边则介绍了网址新添加的功能。

下面我们将一一介绍GSCA的4个主要功能模块:

1

Expression模块

我们可以看到这个模块可以做的分析包括:单基因的差异表达、生存分析以及亚型和分期的关系,GSEA,GSVA、GSVA与生存、GSVA与分期和亚型之间的关系。

点击Submit后,结果展示如下:

1.1 差异表达

这部分展示了大家自己输入的基因的差异表达的数据表格和热图,热图包含的内容既有log2FC,也有FDR。

彩蛋是当大家点击紫色的方框则会显示该基因在TCGA 33个癌种里tumor和normal差异表达的箱点图。点击红色圆块那个标志则可下载pdf原图,在搜索框里输入基因或者癌种symbol则可过滤筛选出相应的结果。

1.2 表达与生存的关系


这部分展示了基因表达与生存之间的关系,展示的内容包括结果表格和热图。热图里包含OS和PFS两部分结果,点击表格紫色的方框则可分别显示OS和PFS的生存曲线。

1.3 表达和肿瘤分期的关系


这部分网页用了不同的展示方式来说明基因在不同分期中的表达变化,各种类型的图各有千秋吧。包括箱点图,附加FDR的热点图,常规热图,还有折线图。不得不说,这些图的颜值真的都不低!

1.4 表达与亚型的关系

这部分我们以乳腺癌和胃癌为例来看,左边是结果表格,点击紫色方框可生成美丽的箱点图来展示不同亚型间的差异,右边是附加了FDR的热点图。

1.5 GSEA

这部分是以输入的多个基因作为基因集进行GSEA分析。可得到如下结果,左边是富集结果表格,点击紫色方框可得到GSEA曲线图,右边则为标准化后富集值的热图。

1.6 GSVA score的差异比较


这部分展示了GSVA score在肿瘤和正常组织间差异的表格和箱点图。如果你想问GSVA是什么,你可以简单理解为将基因集里所有基因在每个样本中的表达值用算法处理为一个值来代表基因集的整体表达水平。

1.8 GSVA score的生存分析


这部分计算了GSVA score的OS和PFS结果。

1.9 GSVA score与亚型的关系


这部分也是用表格和箱点图展示了相应的结果。

2

免疫浸润模块(Immune)

这部分主要提供4个功能的分析,免疫浸润分别与表达、SNV、CNV和甲基化。

GSCA所用的免疫细胞浸润数据来源于郭教授课题组自己开发的ImmuneCellAI所鉴定的(工具网址为:http://bioinfo.life.hust.edu.cn/ImmuCellAI)。

2.1 mRNA expression和免疫细胞浸润的关系

点击Cancer type列的紫色模块,则可生成附加了FDR和相关性的热点图来展示基因和不同免疫细胞之间的相关性;点击Gene symbol列的紫色模块则可展示基因表达和免疫细胞浸润丰度相关性的散点图。

2.2 基因突变和免疫细胞浸润的关系

这部分用来比较免疫细胞浸润在基因突变型和野生型样本中的丰度差异。点击Cancer type列的紫色模块,则可生成附加FDR和log2(FC)的热点图来展示基因突变对免疫细胞浸润的影响;点击Gene symbol列的紫色模块则可展示基因突变型和野生型免疫细胞浸润丰度差异的箱点图。

2.2 展示拷贝数变异(CNV)和DNA甲基化的Immune infiltrates and CNV和Immune infiltrates and Methylation这两个模块展示结果的方式和上面介绍的基本一致,就不赘述了。

3

Mutation模块

这部分的功能也很多,其实都是基因组层面的分析,但网站只写了mutation,因为展示结果的方式基本和前面一致,在此就不逐个放网站图片了。

SNV这部分可以展示大家输入的基因的突变数目、突变频率、突变类型、突变对生存的影响(包括OS和PFS)。这部分里有漂亮的火柴图用来展示每个基因上各个突变位点的突变率,有bar plot和oncoplot展示不同突变类型的比例和不同基因的突变频数频率。

拷贝数变异(CNV)部分则可给大家统计展示不同类型及其所占的比例、拷贝数变异与生存的关系、拷贝数变异与表达的关系。

DNA甲基化这部分则给大家展示了基因的差异甲基化、DNA甲基化与生存的关系及DNA甲基化与表达的相关性。

4

Drug模块

这部分则是分析基因表达的数据与药物敏感性之间的关系,药物敏感性的数据主要来源于GDSCCTRP这两个数据库。

PS:这两个数据库都包含有基于细胞系的药物敏感性数据。展示的数据左边为数据结果的表格,右边则为包含相关系数和FDR的热点图。

关于这个更新的重磅数据库就介绍到这里了。这两年来,研究关于单基因的生信分析越来越多,做湿实验的时候往往也需要基因与其他组学之间关系的数据结果,有了GSCA这个超实用的数据库,大家就不用求人了,自己点点鼠标就能得到结果了!祝大家都有收获!

—END—
SIMPLE

(0)

相关推荐