基于测序数据的m6A数据库
随着测序技术的发展,我们可以通过二代测序的技术来预测m6A。关于m6A测序的技术叫做meRIP-seq,这个测序结果的分析,类似于chip-seq,最后我们可以获得一种叫做peak的文件,这个代表m6A甲基化修饰在哪个位置。但是至于说是否影响基因的表达什么的,这个测序结果还是看不到的,还是需要结合RNA-seq来看的。
基于测序数据来创建的数据库一共有四个。其中18年相同时间发表了两篇(MeT-DB, RMBase),这两篇被引次数也是很高,说明两个数据库挺好用的。同时其实也能说明m6A在这几年研究的还是很多的呀!另外的一个Whistle是19年发表的,被引8次也是可以的,而最后一个REPIC则是今年发表的一个数据库。
下面,我们就对这几个数据库进行简单的介绍吧。
MeT-DB V2.0
这个数据库收集了8个m6A相关调控因子(FTO, KIAA1429, METTL14, METTL3, WTAP, HNRNPC, YTHDC1, YTHDF1)的 ParCLIP-seq 和 MeRIP-seq 数据来构建的,通过相关的测序数据,我们可以查看具体的调控位置。(网址:http://compgenomics.utsa.edu/MeTDB/)
麻烦的是,这个数据库在最基本的检索的时候没有提供了基因检索的功能,我们只能在所有的结果里面进一步的搜索找到自己的目标基因。
在每一个结构表格当中,都会提供了一个好几列“HIT”相关的信息。这个代表,我们这一列的数据数据库当中其他的数据集有没有重叠以及有多少个重叠。
另外这个数据库还提供了和其他类似 miRNA 数据库以及剪切因子数据库交叉分析的结果,感兴趣的可以去看一下。
RMBase v2.0
这个数据库,据文献报道是说不仅包括m6A的预测还包括m5C、m1A等等的预测。但是数据库现在是这个样子的。。。也是没办法呀。
WHISTLE
这个数据库提供了类似于上面把测序数据和机器学习的整合来寻找m6A调控的位点。(网址:http://whistle-epitranscriptome.com)
为了强调自己预测的准确性,他们也和其他的数据库进行了比较,然后结果当然是觉得自己数据库的结果更好了。
这个数据库的使用就很简单了,我们只需要输入想要检索的基因即可,如果我们想要看某一个功能收到m6A甲基化的影响也是可以通过输入功能的名字来查看的。
输入基因之后,我们就可以得到和基因有关的m6A调控的位点。同时这个数据库还对和这个位点可能影响的基因进行了GO分析,我们也可以进一步的来看这个位点的m6A甲基化对于功能的影响。具体GO分析使用的是GSEA的分析方法。
REPIC
这个数据库是20年新发的数据库,新发的数据库,有一个好处就是对于测序数据的纳入就多一些。至于数据库分析的内容是最基本的纳入m6A-seq/MeRIP-seq的数据来分析m6A调控的位点。
我们需要做的就是选择物种、选择基因组、选择相关的组织、输入目标基因即可。
在选择好基因之后,点击 “submit”,我们就可以看到这个基因具体的分析结果了。
这个数据库在分析方法上,选择了三个软件来进行分析,分别是: exomePeak,MACS2 和 MeTPEAK。结果的展示也是展示三个软件分别在这个基因上的结果。我们点击其中一个就可以看到具体的结果信息,以及和其他两个软件是否有重叠的信息。
目前的对于m6A基于测序数据的数据库就是这四个(有一个上不去,就是三个了😂)。这三个吧,MeT-DB可以查看其 miRNA、SNP 交互的结果;WHISTLE 可以分析m6A位点的具体的功能;REPIC 纳入的数据结果更多一些。所以,大家就基于自己的目的来选择不同的数据库吧。另外这三个都提供了数据下载的功能,所以有需要的可以下载想要的数据哈