TCGA tRNA延伸片段数据库
我们都知道,RNA可以分为转运RNA(tRNA), 核糖体RNA(rRNA)以及信使RNA(mRNA)。而tRNA会被降解成一些非编码的小片段。这些小片段就称为tRNA延伸片段(transfer RNA-derived fragments, tRFs)。按照研究类型目前tRFs主要可以分为:5ʹ-and 3ʹ-halves (>30 nt), 5ʹ- and 3ʹ-tRFs (15–30 nt), i-tRFs 和 3ʹU-tRFs 这六个类型。
以上是关于tRFs的一些基本知识。对于tRFs属于一类小片段的非编码RNA。所以我们在进行miR-seq检测的时候,是可以检测到tRF的表达变化的。因此对于我们常用的TCGA数据而言,由于TCGA做了miR-seq的数据,原理上来说,我们是可以获得到TCGA当中所有患者的tRFs的变化情况的。但是我们在常规的TCGA数据下载当中,其实只能获得利用miR-seq数据比对获得的miRNA的表达情况。这个时候如果想要了解tRFs的变化的话,只能是从bam文件开始重新比对分析。如果是这样的话,可能就需要一些基本的分析基础了。所以今天就给大家推荐一个已经利用TCGA数据库分析好的tRFs数据库:OncotRF[http://bioinformatics.zju.edu.cn/OncotRF/index.html]。
数据库分析流程
通过以上的介绍其实已经了解了这个数据库是怎么进行分析的。对于数据的获取,这个数据库使用TCGA当中miR-seq的bam数据来进行重新比对。进而就可以获得tRFs的表达情况。对于tRFs的序列数据,主要是通过GtRNAdb[http://gtrnadb.ucsc.edu]来获取核tRNA序列以及通过NCBI[https://www.ncbi.nlm.nih.gov/nuccore/251831106]来获取线粒体tRNA序列。
在获得了相对应的序列之后,就可以通过比对来了解主要的tRFs的在不同肿瘤当中的表达变化了。进而就可以分析这些tRFs和一些临床参数比如预后 这些的关系了。
数据库使用
数据库主要提供了四种使用的方式:tRFs基本检索;具体肿瘤类型所有结果预览;自定义分组比较以及预后分析
基本检索
假如我们有一个目标的tRF想要进行分析。就可以使用这个功能来进行定向检索。在输入相关信息之后点击提交即可。
在结果方面,主要是通过表格来进行呈现的,在表格当中,我们可以看到具体检索的tRFs的基本情况。同时可以点击Expression来观察在不同肿瘤当中的表达情况,也可以点击View查看这个tRFs的具体变化情况。以及点击Link查看是否有相关的文献研究。
基于肿瘤类型进行检索
如果我们只是想要研究tRFs的话。那就可以在Cancer里面查看不同肿瘤当中tRFs的变化情况。在这个里面,作者基于不同的肿瘤类型以及不同的tRFs进行了分类。我们可以在里面看到,不同tRFs的表达情况预后情况以及和mRNA的相关分析。同时选择相关系数>0.5的来进行富集分析,进而来了解这些tRFs的功能。
预后分析作图
以上是对于这些tRFs进行基本的分析。对于预后而言还可以进行绘图。因此我们在KM-PLOTTER里面就可以对特定的tRFs进行绘图了。
这里绘图的设置也是可以进行不同cutoff的设置的。同时也可以选择不同的亚组进行分析。
数据库使用场景
以上就是这个数据库的主要功能了。比较可惜的是作者没有提供所有原始数据下载的功能。不然的话,还可以下载所有的原始数据来进行自己的DIY分析。不过其实功能已经很全了。研究tRFs的或者在使用TCGA挖掘数据没有新的思路的同学可以考虑一下这个tRFs。