生信新思路:正常组织的选择性多聚腺苷酸化数据库

昨天介绍的TC3A是基于TCGA肿瘤数据来进行分析的,而这次的这个APA atlas (https://hanlab.uth.edu/apa/)则是基于GTEx的数据来分析的。如果不清楚TCGA和GTEx的区别可以看我们之前的这个帖子:TCGA、ICGC、GTEx 数据库都是啥?

另外呢,去年关于APA在RNA-seq的分析,又有人发明了SAAP-RS的算法,这个数据库也就把最新的算法也纳入进来了,所以我们在一个数据库当中可以选择两种算法来查看相关的数据结果。

这个数据库提供了三个功能:

  1. 整体观察

  2. 和样本特征的相关性

  3. 和表达相关性

1

整体观察(landscape)

在这个部分,我们可以查看APA事件在某一个或者所有组织当中的变化情况。我们需要做的就是:选择分析算法,选择组织(如果不选默认是选择全部组织,也可以多选几个组织)以及选择想要查看的基因。

点击查看之后,我们就可以获得和目标基因在不同组织当中的APA事件分布的箱式图了。

2

和样本特征的相关性

对于正常组织而言,我们不可能分析和临床信息的相关性,但是正常的组织也有自己的临床特征比如:年龄、身高、体重等等的。这个功能就是让我们来分析这些APA事件和这些信息的相关性。

和上面的一样,只不过这次我们需要选择想要查看的样本信息。

对于结果的信息,首先是以表格的形式来查看显示不同组织信息和基因APA事件的关系。对于连续性变量,和APA的关系可以进行相关分析;对于分类变量则会进行方差分析。对于某一个变量的结果,也可以点击 Plot 看到相关的图。

3

和表达相关性

3’UTR 的变化其实并不一定影响基因表达的变化,但是如果影响了基因的表达,可能更能说明这个3'UTR的重要。这个数据库提供了这个基因的 APA 事件和所有基因的表达的相关分析,这样我们就可以了解这个APA事件是否和其他基因有关。虽然是统计学上相关,但是通过基因的位置,说不准能发现远程调控呢!

4

数据的下载

对于这个数据库当中的作用分析好的数据,这个数据库也提供了数据下载的功能。这样我们也就可以基于自己的目的来进行DIY了。具体如果DIY可以参考后面两天的文献解读。

数据库使用

从周一到现在今天这五天我们介绍了3'UTR的功能以及其中很多用来预测3'UTR相关的数据库。最近这两天介绍了关于介绍了和APA有关的数据库。这两个数据库主要还是通过TCGA的数据/GTEx的公共数据库来进行分析的结果。

注意:昨天介绍的TC3A用的是DaPars2的算法,而今天的这个APAatlas用的是DaPars的算法。如果想要比较差异的话,那这两个数据是不能硬性的融合的。那如果我想要获得TCGA数据库当中正常样本的APA评价,怎么办呢?那就留意一下明天的推送哦。

生信文章新思路:TCGA 选择性多聚腺苷酸化2020-04-23
基因PolyA预测2020-04-22
AU富集区域查找2020-04-21
3'UTR是做什么的?2020-04-20
(0)

相关推荐

  • TCGA数据分析系列:LinkedOmics数据库

    今天继续我们TCGA在线数据库系列.今天介绍的数据库是LinkedOmic,http://www.linkedomics.org/login.php可谓是航母级数据库,没有做不到的,只有想不到的.话不 ...

  • 做生信数据挖掘一定要会编程吗

    自从meta分析贬值了之后,生信数据挖掘成为了国内医生.研究生.博士.教师火爆的发文神器,可是令人头痛的事情来了,生信往往需要学习编程,其中R就必不可少,如果要挖TCGA.SEER,Perl或者Pyt ...

  • 单基因泛癌表达(TCGA+GTEx)

    之前我们发布了单基因泛癌分析相关的文章,包括 TCGA单基因免疫相关泛癌分析 TCGA单基因免疫相关泛癌分析-进阶版本 TCGA单基因泛癌分析:富集分析结果答疑 这里有单基因在每种肿瘤中的表达图,仅限 ...

  • 点进来,免费帮你做单基因泛癌表达分析(TCGA+GETx)

    相信绝大多数研究肿瘤的科研工作者的工作都离不开某个特定的基因,现在绝大部分的单基因的生信文章也都有这么一个图,我就随便列举一些文章的Figure1 比如 再比如 再比如 再比如 再比如 再比如 再比如 ...

  • TCGA的28篇教程-GTEx数据库-TCGA数据挖掘的好帮手

    长期更新列表: 使用R语言的cgdsr包获取TCGA数据(cBioPortal)TCGA的28篇教程- 使用R语言的RTCGA包获取TCGA数据 (离线打包版本)TCGA的28篇教程- 使用R语言的R ...

  • 生信工具 | TCGA数据分析工具GEPIA最新更新,用于免疫细胞浸润分析

    GEPIA(http://gepia.cancer-pku.cn/index.html)这个工具可以说是分析TCGA数据库数据分析工具中比较简单好用的工具了,包括生存分析,表达差异分析,相关性分析等, ...

  • 拼凑6个网页工具图表还不够那就再加上6个组学

    学TCGA数据库并不是为了发"套路"文章,那些基本上是本科生毕业设计的水准,但是阅读这样的文章的确可以很大程度上帮助大家认识TCGA数据库,主要是了解它可以做什么,比如我昨天在生信 ...

  • 零代码、无实验复现最新8+SCI,傻瓜式剩下高招!(附详细操作教程)

    解螺旋公众号·陪伴你科研的第2590天 无代码生信复现 大家好,我是Jerry,今天我给大家分享一篇最新的单基因泛癌生信文章,该文章是发表于Frontiers in Immunology杂志上,最新影 ...

  • 一个基因引发的血案

    大家好,我是老米,学习生信一个月,这是我的第二篇Markdown.不知道多少人还记得我的第一个作品:原来一个星期真的可以零基础入门TCGA数据挖掘,甚至markdown写作公众号投稿 (感兴趣的自己点 ...

  • 生信新思路:单一肿瘤多聚腺苷酸化文献介绍

    前几天一直在和大家分享一些关于3'UTR以及3'UTR当中的APA(Alternative Polyadenylation, 选择性多聚腺苷酸化)的内容,为什么要花这么久的时间分享这些呢?主要还是看到 ...

  • 生信新思路:泛癌多聚腺苷酸化文献介绍

    前几天一直在和大家分享一些关于3'UTR以及3'UTR当中的APA(Alternative Polyadenylation)的东西,为什么要花这么久的时间分享这些呢?主要还是看到了两篇利用 TCGA ...

  • 生信新思路:选择性多聚腺苷酸化系列帖介绍

    系列帖的由来 最近一直是在总结核酸研究杂志2019发表的数据库(关于这个他们杂志专门发了一个总结文献,感兴趣的可以去看看,PMID: 31906604,如果懒得自己看,可以每天看一下我们公众号就行), ...

  • 生信文章新思路:TCGA 选择性多聚腺苷酸化

    一个文章套路的小故事 TCGA原始的数据库只有表达组学.甲基化.临床信息这些数据,所以大家在挖掘数据,最基本的就是在这几个组学里面来回的交叉融合.如果一个癌种别人交叉分析了,那其实基于基础的思路很难再 ...

  • 多个研究热点联合分析(生信新思路)

    发现我们常见的生信发文热点有免疫评分.m6A.铁死亡等等,例如下面这三篇经典的范文: 1.Identification of Key Genes inThyroid Cancer Microenvir ...

  • SNP调控选择性多聚腺苷酸化数据库

    前两天我们介绍了选择性多聚腺苷酸化(alternative polyadenylation ,APA)在 TCGA 当中的计算数据库,以及利用 TCGA-APA 事件发表的一些文章,毕竟TCGA是一个 ...

  • 生信数据挖掘,怎么能缺少这个数据库呢

    今天给大家分享一个数据库,这个数据库就是人类基因组流行病学导航数据库(HuGE  Navigator).这个数据库提供了人类基因组流行病学研究,包括以下这些方面:基因变异的人群流行率信息.基因与疾病的 ...

  • 纯生信数据挖掘找不新思路?看看这篇10分SCI

    发现我们常见的生信发文热点有免疫评分.m6A.铁死亡等等,例如下面这三篇经典的范文: 1.Identification of Key Genes inThyroid Cancer Microenvir ...

  • 好发的低分的对纯生信友好的期刊

    有很多网友想看好发的低分的对纯生信友好的期刊,现在总结一下: 1.Med Sci Monitor 影响因子:1.918 审稿周期:1个月左右(审稿周期非常短,审稿速度极快) OA期刊:需要收取版面费 ...