如何利用在线数据库发表六分生信文章

写在前面

前段时间,我们介绍了两篇在OncoImmunology发表的简单的生信+实验的文章。最近又发现一个杂志(Genomics, IF = 6.205)也发表一些生信相关的文章。里面有些文章简单的令人发指。今天就来介绍一个基本上全部都是用在线数据库做出数据的文章。

通过题目,我们可以了解到,整篇文章主要的内容是来分析ARL9基因表达和甲基化在低等级神经胶质瘤当中的对于预后的影响。单基因单癌种在线分析发6分,还是很服气的。

下面就让我们来看看这个文章到底做了些什么东西吧。同时也可以把之前介绍的数据库来拿出来介绍一下。

1. ARL9基因表达和甲基化和预后的关系

文章的一开始首先使用了两个数据库来观察了ARL9基因的表达在癌和正常的差异表达情况。作者这里使用了两个数据库来观察其差异情况。其中一个是TCGA的数据,这里通过GEPIA数据库直接查询的(关于这个数据库的使用,可以查看我们之前两期的介绍:GEPIA介绍一GEPIA介绍二)。另外一个使用的是Rembrandt数据库。这个数据库也是一个在线查询即可的,这个数据库是一个专门的脑部肿瘤的数据库。所以研究脑肿瘤的可以了解一下。

进一步作者分析了基因的表达和甲基化的关系。在这里作者说是通过Cbioportal下载的数据进行分析的(关于Cbioportal的介绍,可以看这个帖子:Cbioportal介绍)。但是明显文章当中的图片就是来自于UCSC XENA的😂。通过分析,作者发现基因的表达和甲基化相关(如果想要了解UCSC XNEA可以看这个帖子哦:UCSC XENA基本介绍进阶介绍)。

进一步作者查看了这些cg位点和预后的关系。关于这个部分,应该也是用UCSC XENA做的。

2. ALR9基因表达和临床参数的关系

为了说明ALR9基因表达和胶质瘤临床参数的关系。作者使用TCGA数据库下载了相关的临床数据,利用GraphPad来对数据进行了分析。关于数据的下载,在UCSC XENA上面可以直接下载,其实同时也可以在线分析的。

3. ALR9表达和预后的关系

上面既然说明了基因的表达和临床参数有关系了,那进一步的,作者就查看了这个基因的表达和预后的关系。这个方面,作者使用的了四个数据集来进行分析(TCGA, CGGA, REmbrandt, Gravendeel)。另外为了说明其预后结果的准确性,作者还做了一个预后相关的meta。尴尬的是,作者说最后没有发现任何文章研究这个基因表达和预后的关系,所以也就用这四个数据集来进行了meta。。。。。

如果想这么做的小伙伴,需要注意哦,CGGA数据库从2020.07月已经把TCGA和REmbrandt的数据放到里面了。所以数据别用重复了。

ALR9基因相关功能分析

为了了解ALR9的功能,作者使用TIMER数据库来分析这个基因的表达和免疫浸润的关系。如果想要了解TIMER数据库的话,可以参考这个帖子哦:TIMER数据库介绍

进一步为了了解其他功能,胶质瘤专用的GlioVis数据库来进行共表达分析,进一步进行富集分析。

写到最后

以上就是这个文章的主要内容。相比较而言,这点儿东西能发六分还是挺让人惊讶的。其中原因是基因比较重要,还是什么的。这个笔者也不是研究胶质瘤的所以也就不是很清楚的。不过相对而言重复起来还是很简单的。但是按照这个模板分析相同套路的文章能否再发这么高,确实打一个问号的。

(0)

相关推荐