又一个肿瘤免疫浸润分析利器
关于TCGA表达数据的分析。之前我们我们介绍过。目前可能用的最多的也就是GEPIA了。之前在GEPIA2发表的时候(GEPIA I, GEPIA II),我们对这个数据库进行了介绍。最近。GEPIA的团队发表了一个对免疫细胞进行相关分析的数据库—GEPIA2021(http://gepia2021.cancer-pku.cn/),所以今天就来给大家介绍一下。这个GEPIA2021是干啥的吧。
背景数据集
和GEPIA数据库一样,这个数据库也是使用TCGA/GTEx当中表达的数据来进行后续分析的数据库。
和GEPIA不同的是,GEPIA是用来分析在两个TCGA/GTEx当中基因的变化情况的。而在GEPIA2021当中,主要是用来分析免疫细胞在目标组织当中的变化的。
这个方面和TIMER数据库有点儿类似,不过使用的算法不同。在在GEPIA2021当中,主要是作者使用三种算法来评价了组织当中的免疫细胞(CIBERSORT, EPIC, quanTIseq)。因此如果想用这三种算法来分析TCGA/GTEx数据库当中的免疫细胞的话,可以使用GEPIA2021。
数据库使用
在这个数据库当中,总共分成了四个部分的分析。
1. 免疫细胞比例分析
在这个部分,我们可以分析不同的组织当中免疫细胞比例。我们需要做的就是选择想要分析的组织已经想要分子的免疫细胞即可。
例如我们想要分析在乳腺癌当中基于CIBERSORT算法得到的两种B细胞的变化。
在选择好之后,点击plot即可得到相关的结果。
结果主要包括两个部分,一个是相同的组织当中免疫细胞比例是否存在差别。另外一个是在相同的免疫细胞在不同的组织当中是否存在差别
2.相关分析
在相关分析当中,主要用来分析组织当中候选免疫细胞是否有区别。在这个部分,如果选择多种组织的话,也是把这些组织的表达水平融合到一起分析的。
这一部分的结果主要是通过散点图来进行呈现的。同时对于不同的组织使用不同的颜色进行区分。同时在结果当中给出了相关分析的相关系数。
3. 基因表达亚组分析
分析基因在不同组织以及不同细胞之间的某一个表达情况。主要也是通过选择想要分析的组织;想要分析的免疫细胞,同时输入想要分析的基因即可。
在这个过程当中,作者通过数据的转换。计算了候选基因和免疫细胞之间的关系。这样就可以观察在不同的免疫细胞当中基因的表达情况了。
关于具体的转换方式,感兴趣的可以看一下原始文献。
我们点击 Plot 之后。就可以得到相关在不同组织当中不同免疫细胞当中基因的表达情况。以及在不同的免疫细胞分组当中不同组织内基因的表达情况。
4.生存分析
分析免疫细胞在不同肿瘤当中对预后是否有影响。主要的分析方法是通过KM的算法进行分析的。在这个数据库当中,除了以上的基本选择,还可以选择进行cutoff的比例(默认的是使用中位值进行cutoff选择的)。
预后分析的结果是通过生存曲线图来进行展示的。同时里面也包括了预后分析的P值。
另外需要注意的是,对于免疫细胞的选择,如果选择两个以上的细胞,不是对这两个免疫细胞分别进行预后分析。而是来分析这些免疫细胞整体是否影响预后。对于其免疫评分是通过相加融合到一起的。
总的来说
以上就是这个数据库的基本使用方式了。算是GEPIA数据库在免疫浸润方面的一个扩展。如果要和TIMER2数据库比较的话。
数据量方面:这个数据库在TCGA数据的基础上添加了GTEx数据,这样可以更好的分析正常组织了。
分析算法方面:TIMER2计算了多个算法的结果。GEPIA2021的话则使用了其中的三个
分析内容方面:TIMER主要是用来分析不同组学和这些免疫细胞的相关性的(基因表达,突变,拷贝数以及预后)。GEPIA2021的话则是以免疫细胞为主体进行分析。分析这些免疫细胞在不同组织当中的具体特征。
因此,大家可以基于不同的目的来选择不同的数据库。
对了,需要注意的是:在GEPIA2021当中,免疫细胞的选择不能超过四个哈。要过了就不能分析了。