航母级基因功能预测数据库

在基于高通量测序的进行基因功能预测的是时候,我们经常需要寻找符合我们研究疾病的数据集。拿肿瘤而言,最常见的的还是 TCGA 数据库。但是一个数据集进行基因功能预测的时候,有可能在后续的实验的时候就会产生数据分析得到的结果可能和我们实验验证的不一样。这个时候最直接的方法就可以使用多个数据集来进行预测,这样得到的结果就相对来说也就比较稳定了。那么如何要寻找其他数据集呢?所以进行就给大家介绍一个收录了巨多数据集用来分析基因功能分析数据库:R2: Genomics Analysis and Visualization Platform (https://hgserver1.amc.nl/cgi-bin/r2/main.cgi)

背景数据集介绍

在这个数据库当中,纳入了 1630 个在线数据集的数据。其中大多数来自于 GEO 数据库。另外也包括类似 CCLE 以及 TCGA 这样的数据集。

在收录的这些数据集当中,包括了多个物种以及不同组学的数据集。

至于这个数据库能干啥。那就特别多了,基于这个数据库的功能。有一个很长的介绍。具体可见:https://r2-tutorials.readthedocs.io/en/latest/

至于如何操作的话,基本上都差不多。这里就用两个基因相关分析来简单介绍一些数据库的使用。

基因相关分析

在 R2 当中首先需要选择是在一个数据集内进行分析还是在多个数据集内进行分析。

1. 单一数据集分析

在选择 单一数据集之后 就需要选择自己想要分析的数据集。例如。我们想要分析某一个胃的数据,可以进行关键词筛选。同时点击具体的数据集,

在选择好想要分析的数据集之后。就需要选择想要进行分析的功能。由于我们要分析两个基因之间的相关性。所以就选择Correlate 2 Genes 即可。

由图中也可以看出这个数据库我们进行好多的分析。

点击Next 之后 就可以输入想要分析的基因了。比如我们这里想要分析TP53和PDCD1的关系。就可以输入想要分析的基因即可。

另外每一个数据集相对应的临床数据。作者也整理到数据库了。比如我们选择的这个就有 STAGE,  年龄等相关的数据。如果想要进行亚组的分析,比如在STAGE 1当中进行观察,可以继续选择相对应的亚组即可。

最后选择想要绘图的参数即可。

在相关分析的结果部分,首先是通过一个散点图来可视化两个基因的相关性的

再往下的是,由于芯片数据的话,可能一个基因有多个探针,我们分析的其实是一个探针的相关。下面也会显示其他探针之间可能的相关性。

2. 多数据集分析

以上是单一数据集分析的过程。而在多数据集分析当中,则可以观察,两个基因在不同数据集当中的相关性。

虽然是多数据集分析,但是不同的芯片,对于基因探针的命名是不一样的,所以还是要首先选择芯片类型

然后选择想要分析的基因和数据集

最后点击下一步,就可以得到不同数据集内,两者的相关性情况了。

可以看到,在HCV感染的CD8+ T细胞当中,两者存在很强的负相关。那是否就可以在HCV当中研究这两者的关系呢?

总的来说

以上就是R2这个数据库的基本功能介绍了。只是简单的介绍了一下两个基因相关的基本操作。其实数据库能做的事情还是很多的。

(0)

相关推荐

  • 1个月接收并见刊的6分+泛癌纯生信

    "Pan-Cancer Analysis of HumanKinome Gene Expression and Promoter DNA Methylation Identifies Dar ...

  • 科研 | Microbiome:微生物群落功能预测的准确性与样本类型和功能类别的关系

    编译:红皇后,编辑:小菌菌.江舜尧. 原创微文,欢迎转发转载. 导读 尽管近些年测序的成本不断的下降,鸟枪宏基因组测序的价格依然要远高于16S rRNA扩增子测序,因此研究人员开发了多种基于微生物群落 ...

  • TCGA数据挖掘网站-UALCAN

    一款操作简单.快速有效的TCGA数据挖掘分析的网站工具---UALCAN . UALCAN (http://ualcan.path.uab.edu/index.html)是一个基于PERL-CGI.j ...

  • KM-plotter 数据库:基因表达与疾病预后信息好帮手

    KM-plotter(https://kmplot.com/analysis/) 是一个在线进行生存分析的网站,数据最全并且是生存分析最权威的网站.在已发表的论文中,生存分析的数据多来自KM Plot ...

  • CancerSEA:免费做单细胞测序分析的数据库

    #背景介绍 单细胞测序分析可以解决肿瘤异质性的问题,提高实验数据分析的准确性,对临床医生对疾病的诊断.检测.治疗提供非常有价值的帮助,也是现今生命科学研究的焦点.但测序费用的昂贵让很多怀着科研梦想的人 ...

  • TCGA数据分析系列:LinkedOmics数据库

    今天继续我们TCGA在线数据库系列.今天介绍的数据库是LinkedOmic,http://www.linkedomics.org/login.php可谓是航母级数据库,没有做不到的,只有想不到的.话不 ...

  • EWAS Data Hub:DNA甲基化芯片数据库

    导语 表观基因组广泛关联研究(Epigenome-wide Association Study,EWAS),基于全基因组范围寻找组间的表观遗传学标记的差别或特征,能够帮助我们了解表观遗传改变与相关形状 ...

  • 综合性基因功能预测数据库

    我们在进行研究一个基因之前都要了解这个基因主要是功能是什么,或者它可能的功能是什么.如果要了解一个基因目前的功能的话.可以通过genecards来查找的. 如果想要挖掘这个基因额外的功能的话,那就需要 ...

  • 综述 | DescribePROT:氨基酸水平蛋白质结构和功能预测数据库

    编译:李可爱,编辑:Emma.江舜尧. 原创微文,欢迎转发转载. 导读 随着基因序列数据量的迅速增长,科学家面临着巨大的任务.目前,2020.04版本的UniProt数据库中,从功能和结构上表征新型蛋 ...

  • 基因预后预测数据库

    在进行肿瘤相关研究的时候,如果有这个肿瘤的随访时间和随访的结局,往往都可以进行预后分析.通过预后分析来了解某一个分组(治疗方式,基因突变,基因表达高低)是否影响肿瘤患者的预后.那么如果在基因研究的时候 ...

  • 融合基因功能预测数据库

    昨天我们介绍的融合基因查询的数据库,可以查询发生基因融合的基因.由于发生了基因融合,所以就相当于形成了新的基因,对于这种基因的功能是什么,昨天的数据库没有介绍.今天我们就来介绍用来查询融合基因功能的数 ...

  • tRFs靶基因预测数据库

    在前几天的介绍当中,我们通过一篇综述了解到了tRNA的功能.其中在那篇综述当中提到了四个和tRNA有关的数据库.但是综述当中介绍的数据库基本上都是用于查询tRFs的基本信息或者查看tRFs在肿瘤当中的 ...

  • 预测BRCA基因功能缺陷的HRDetect基因集(逆向收费读文献)

    大概有50人加入吧,成功坚持下来的朋友们累积了 200多文献阅读笔记,反而是公众号编辑忙不过来,所以大多数好的笔记无缘跟粉丝见面,不过我自己的笔记可以开绿色通道 Nat Med. 2017 April ...

  • miRNA靶基因预测数据库

    好啦,小伙伴们,上次咱们刚介绍过神器starbase,那么今天咱们再来学习一下另一款神器:miRWalk(http://mirwalk.umm.uni-heidelberg.de/).在咱们预测的时候 ...

  • 综合性miRNA靶基因预测数据库

    写在前面 对于miRNA靶基因的预测而言,目前有很多数据库都可以做.这些数据库的区别基本上在于纳入的数据量以及预测的算法不同.预测的结果总是有一些不同的,所以也就导致各个数据库的结果可能不是很一样.我 ...

  • 航母级miRNA数据库

    前几天有小伙伴问关于 miRNA 的数据库,由于 miRNA 相关的数据库太多了,要是分开介绍的话估计要好久好久.幸好,有人已经把 miRNA 相关的数据库整理好了,我们只需要基于自己的目的进行查找就 ...