基因表达可视化工具
目前,cBioPorta、GEPIA等现有生物学工具为基因表达分析提供了许多有用的可视化和分析工具,但是并不能充分解决实验生物学家要求的其他一些快速分析。例如,根据初步结果选择特定的细胞系进行进一步研究,从多个组织和细胞系的RNA水平和蛋白质水平以及磷酸化蛋白分析基因表达,可视化肿瘤与正常组织之间的miRNA表达等。今天,小编就来给大家介绍一个直观地定量,比较和可视化组织和细胞系中的基因表达的数据库:GEDS(http://bioinfo.life.hust.edu.cn/web/GEDS/),从mRNA,miRNA和蛋白质水平对基因表达进行定量。GEDS数据库整合了TCGA,GTEx,CCLE和MCLP4个数据库标准化的mRNA,miRNA和蛋白质表达数据。
如图所示,我们可以在不同面板中搜索mRNA, miRNA和蛋白质的表达。下面我们就来简要的讲解一下具体使用方法。
1. mRNA
在mRNA面板,我们输入基因名称CDK1,点击搜索。
GEDS将以图片(以箱线图形式)及表格两种形式显示基因的表达谱。
Figure of expression以图片形式显示基因的表达谱。主要包括3个方面:
(1)CDK1在TCGA不同肿瘤类型中的表达情况
从左至右,以中位数,基因表达量依次降低。
(2)CDK1在GTEx正常组织中的表达情况
(3)CDK1在CCLE不同肿瘤细胞系中的表达情况
我们都知道,一般基因在肿瘤组织与肿瘤细胞系之间的表达模式相同,但也有可能会不同。上述我们举得例子基因CDK1在部分肿瘤组织与肿瘤细胞系之间的表达模式就不相同。
通过上图,我们可以发现CDK1的mRNA水平在宫颈癌(CESC)中表达较高,在肾乳头状细胞癌(KIRP)、肾透明细胞癌(KIRC)、肾嫌色细胞癌(KICH)和甲状腺癌(THCA)中表达较低。同时,在CCLE数据集中,CDK1的mRNA水平在这些组织中具有一致的表达。
在前列腺癌中,CDK1在TCGA和CCLE之间存在显著差异,表明该基因在前列腺癌组织和细胞系之间的表达方式不同。
点击每个箱式图,会显示基因在每个样本中的详细表达情况。这里我们点击前列腺癌的TCGA及CCLE箱式图。
根据上图,可以发现前列腺癌细胞系NCI-H660中CDK1表达最高。这表明NCI-H660可能是分析前列腺癌细胞系和前列腺癌组织之间差异的最佳细胞系。
Table of expression则以表格形式显示基因表达谱。
当然我们也可以一次输入多个基因,如下图。
可以通过点击不同的基因名称来进行切换。
2.miRNA
点击miRNA使其切换至miRNA页面。这里我们可以可以输入miRNA官方ID,我们以页面提供的example为例,输入。结果显示miRNA在TCGA不同癌症类型中的表达情况。
3. protein
点击protein使其切换至protein页面。在这里我们可以选择特定蛋白质或磷酸化蛋白质状态,但是该数据目前仅提供300多个蛋白质信息,所以部分蛋白会搜索不到。蛋白质表达水平通过反相蛋白质阵列(RPPA)定量,以箱线图表示。我们这里检索CDK1。
结果如下,依旧以图片表格两种形式呈现。但是和mRNA结果不同的是不包含正常组织的表达量,主要包括TCGA、MCLP及CCLE数据库中的表达情况。