SRAMP:哺乳动物m6A修饰位点数据库
导语
N 6-甲基腺苷(m 6 A)是转录后甲基化修饰,广泛存在于RNA转录本的腺苷碱基上。这种修饰物参与RNA转录物的降解,亚细胞定位,剪接和局部变化的调节。在哺乳动物转录组中,仅这类基序的一小部分确实被修饰,决定m 6 A修饰位点的其他序列和结构特征。随着表观遗传学研究的不断深入,研究人员陆续定位了哺乳动物转录组中的 m6A,鉴定了具有动态修饰的「readers」、「writers」和「erasers」蛋白,解析了 m6A 在转录后调控中的一些功能。
RNA甲基化修饰过程中的关键分子:
Writers:将甲基化修饰“写入”RNA,即介导RNA的甲基化修饰过程。最常见的分子是METTL3和METTL14,两者可在体外和体内催化mRNA(和其他细胞核RNA)的m6A甲基化。WTAP是这种甲基转移酶复合体中的另一个关键组分。
Readers:“读取”RNA甲基化修饰的信息,并参与下游RNA的翻译、降解等过程。比如具有YTHDF结构域的蛋白能够识别并结合mRNA中的m6A,而这种结合会减少mRNA的半衰期促使其降解
Erasers:将RNA甲基化修饰信号“擦除”,即介导RNA的去甲基化修饰过程。FTO和ALKBH5可以去除mRNA(和其他细胞核RNA)上的m6A甲基化。
SRAMP(sequence-based RNA adenosine methylation site predictor)是预测哺乳动物m6A修饰位点的数据库。SRAMP运行预测时仅需要RNA序列,而无需加载外部组学数据。在lncRNA、circRNA等测序数据不充足的条件下,也是一个有力的m6A位点分析工具。SRAMP数据库是由北京大学基础医学院崔庆华教授课题组开发,这项工作同样也是发表在《Nucleic Acids Research》,目前被引用次数超过120次。
SRAMP
http://www.cuilab.cn/sramp
这项工具的使用方法非常简单,点击Prediction就可开展预测。由于数据库基于随机森林算法,不了解的可以进来看看科研风暴之前的文章【机器学习变量筛选系列教程一:随机森林算法】,这里会呈现两种预测模式。一个是带有内含子的基因组序列(左),另外一个是不带内含子的成熟的mRNA(右)。
另外这个数据库需要选择是否考虑RNA的二级结构,系统是默认不选的,因为选了以后运行的要慢一些,等待结果的时间长一点。Full transcript mode和Mature mRNA mode。Full transcript mode模式下,需要提交包含内含子的pre-mRNA或者非编码RNA的基因组序列,格式为FASTA。底下还有几个参数供用用户选择,组织或者细胞类型,显示序列的核酸类型。准备好后,点击Submit就可以开始prediction。
这里我们以Mature mRNA mode里的an example sequence)如下图进行演示:
运行过程如下:
等待两分钟之后,(等待时间取决于提交序列的长度)结果就出来啦~记住,千万不要在中途关闭该网页。网站也提供文本的下载,但是会在72小时后自动删除。
首先是数据库会对于序列的预测结果有一个评分,评分的结果可以通过下面这个图来呈现。
我们可以清楚看到m6A位点涉及到的motif(用蓝色标记)和可信度,SRAMP网站提供了几个阈值:99 %/95%/90%/85%,分别对应very high/high/moderate/low的自信度。预测结果是按照“Position”位置排序的,所以还需要综合各个位点“Score”情况。一般来说High的可信度较高而low的话需要注意在后期验证时候的准确性。
再往下,会有具体的评分序列的详细信息。除了包括下列信息也包括了结构信息。
同时我们点击其中一个 draw 的选项可以获得 RNA 二级结构的具体位置。
这款数据库操作简单实用,界面友好非常适合新手。同时也可以跨界使用,即使用来预测植物,网站会把对应的motif序列标记出来。
END