RNA-蛋白结合预测数据库,快来试一下吧!

解螺旋公众号·陪伴你科研的第2570天

RNA-蛋白结合预测数据库

“老板给了我一个RNA,让我找直接作用机制,我该这么办?”

“先用catRAPID数据库看一下与它结合的蛋白吧!”

“这个数据库怎么用啊?”

“看这里呀!”

catRAPID数据库(http://service.tartaglialab.com/page/catrapid_group)的开发者来自西班牙的 Universitat Pompeu Fabra,数据库相关文章(PMID: 21623348)于2011年6月发表在Nature Methods杂志(2019IF=30.822)上。截至2021-05-13该数据库相关文章已引用135次(数据来源:PubMed)。

开发者们利用多肽和核苷酸链的物理化学性质(二级结构、氢键和范德华力)评估蛋白质和RNA的相互作用,分为catRAPID fragments、catRAPID strength、catRAPID omics、catRAPID express、catRAPID signature和catRAPID interactions with large RNAs六个模块。其中最重要的就是catRAPID omics模块了,该模块可以计算模型生物的分子(蛋白质/转录物)和参考集(转录物/核苷酸结合蛋白质)之间的相互作用。

换句话说,就是这个模块可以用已知RNA来预测相互作用的蛋白,也可以用已知的蛋白来预测相互作用的RNA。

catRAPID omics模块

在主页点击对应的超链接即可进入该模块的页面。

因为我们是已知RNA,则选择相应的第2个项目。

我们以RepA为例,输入序列即可。

然后有关于预测细节的3个设置,根据自己的需要设置即可。邮箱是可选项,如果不输入邮箱的话记得不要关闭页面。

待网页运算完成之后刷新页面即可得到结果。

首先是根据星级的统计饼状图。可以看到我们的结果绝大部分未中等星级。

星级评定系统帮助用户对结果进行排名。分数是三个单独值的总和:catRAPID标准化倾向RNA/DNA结合域和无序区域的存在以及已知RNA结合基序的存在

1)catRAPID标准化倾向:交互倾向在0和1之间线性标准化,并乘以分布分数。

2)RNA/DNA结合域和无序区域:蛋白质区域的得分如下:RNA域=1,DNA域=0.5,无序=0.5,DNA域+无序=1。

3)已知的RNA结合基序:基序的存在被赋值为1,否则赋值为0。

接下来是结果的完整列表。表中一共有9列,从左至右依次为编号蛋白IDRNA IDZ值区分能力交互倾向蛋白结构域RNA基序星级评定

1)编号:就是结果的顺序编号。

2)蛋白ID:就是预测到的蛋白,点击会进入到UniProt网站的相应蛋白页面。

3)RNA ID:就是我们输入的RNA,点击会显示该RNA的序列。

4)Z值:在catRAPID omics模块中,使用两个参考数据集计算的平均值(23.25)和标准偏差(37.90)对Z评分进行标准化。

5)区分能力:用来评估快速交互倾向,它代表了预测的可信度,范围从0%(不可预测性)到100%(可预测性)。高于50%的DP值表示可能发生相互作用,而高于75%表示高置信度预测。

6)交互倾向:是一个蛋白质(或区域)和一个RNA(或区域)之间相互作用概率的度量,是基于观察到的核糖核蛋白复合物的组成部分表现出其物理化学特征的趋势。

7)蛋白结构域:是通过分析带有DNA和RNA相关术语注释的Pfam匹配的蛋白质序列来进行鉴定的,并利用IUPred算法对蛋白质序列进行分析,识别无序区域。

8)RNA基序:RNA结合蛋白及其相关识别基序的图谱来自公开数据库(RBPDB和SpliceAid-F)和相关文献。点击会显示相应的详细基序信息及相应的证据来源。

9)星级评定:如前所述是一个综合性评分。

catRAPID express模块

当我们通过catRAPID omics确定了与RNA和相互作用的蛋白,我们还想进一步了解一下二者具体的精细结合位点,那么catRAPID express就派上了用场。

在主页点击对应的超链接即可进入该模块的页面(需要注意的是目前仅支持物种为人)。

根据自己的需要选择相应的项目,这里我们以第一个来演示。

之后是输入序列,与catRAPID omics类似,我们以NOP56和TSC2为例。

结果显示我们输入的蛋白质RNA分子相关的相关系数为0.79,下方有二者的热图,及之前catRAPID omics也会有的一些信息。点击热图后方的(png)可直接下载热图。

下面是匹配结果和组织表达信息。匹配结果显示了我们输入的序列在Ensembl网站的匹配结果,这里我们的匹配结果都是100%。组织表达则显示了蛋白和RNA在不同人组织中的表达情况。

怎么样,这个数据库是不是很好用啊,当你把你的结果交给你老板的时候,你老板也会被你惊艳到的。

—END—
撰文丨阿波没有罗
排版丨豨莶

一个窍门搞定生信创新性问题,也太太太太太太太简单了吧!

医学人体解剖手绘:科学与艺术交织的生命真实

收稿范围广泛的国人友好Q1区SCI杂志

本周直播预告

领  悟  科  研  优  人  一  步

直播主题:医生做科研的最佳路径
直播时间:5月22日晚18点-20点
(0)

相关推荐

  • 经典的miRNA靶标预测数据库

    "胡,starbase是干嘛的?" "不就是预测miRNA与mRNA结合的数据库嘛." "还有呢?" "......" ...

  • lncRNA与蛋白结合预测数据库网站

    写在前面 好不容易找到一条新颖的lncRNA,表达及功能做完了之后,还能做啥呢?可以找一下它的靶蛋白呀.实验方面,大家都知道可以进行lncRNA pull down-MS,但经费有限怎么办?这时候就需 ...

  • 12月在线数据库汇总

    在12月期间,总共发表了医学相关在线数据库47个.下面就来给大家介绍一下主要有哪些数据库,以及笔者比较感兴趣的数据库.如果想要所有相关数据库信息的,后台回复:2012. 1. 疾病与药物相关数据库 疾 ...

  • 科学家揭示乙型肝炎病毒自限性新机制

    近期,Journal of Hepatology在线发表了中国科学院分子细胞科学卓越创新中心(生物化学与细胞生物学研究所)研究员胡荣贵课题组的最新合作成果--Translatomic profilin ...

  • 生信神器之一站式表达谱数据分析

    表达谱数据分析的时候,经常包括各种各样的分析.比如差异表达分析,富集分析,GSEA,蛋白相互作用分析等等等等.NetwordAnalyst(https://www.networkanalyst.ca/ ...

  • LncRNADisease:IncRNA相关疾病数据库

    LncRNA对于理解生命科学,尤其是疾病,至关重要.LncRNADisease数据库整理了实验支持的lncRNA-疾病关联数据的资源,还整合了用于预测新型lncRNA-疾病关联的工具该数据,旨在提供人 ...

  • 高通量测序技术极简介绍

    我们在介绍公共数据库的时候,经常会提到RNA-seq.Chip-seq.甲基化芯片等,对于不了解高通量测序的同学而言,不是很清楚这些都具体是什么.这里就很简单,目的性极强的介绍一下. 测序技术分类 高 ...

  • CHIP

    我们的公众号周一.三.五更新生命科学相关:周二.四.六杂谈. 研究蛋白与蛋白的相互作用的方法有拉下实验(pull-down).coIP (immunoprecipitation, 免疫沉淀): 研究蛋 ...

  • Starbase:研究RNA,有人不知道它吗

    Starbase数据库于2011年上线,目前更新到3.0版本,开发者是中山大学RNA信息中心的屈良鹄研究团队.Starbase是做lncRNA/circRNA/microRNA等研究常用的强大数据库, ...

  • 科研 |Nature:人类RNA结合蛋白的大规模结合及功能图

    编译:小北,编辑:景行.江舜尧. 原创微文,欢迎转发转载. 导读 RNA结合蛋白(RBPs)是一组多样的参与基因表达的蛋白,能够与RNA相互作用形成核糖核蛋白复合体,调控RNA底物的成熟和命运,并且调 ...

  • RNA甲基化靶标预测

    之前我们推荐过一些和RNA甲基化有关的数据库.其中当时总结了四个基于测序来预测RNA甲基化靶标的数据库.前段时间想查一下相关靶标的时候,发现这四个数据库都成了这个样子了.... 另外随着时间的推移会有 ...