预测 lncRNA 亚细胞定位的网站

在整个基因转录翻译的过程当中,基因是在细胞核发生转录,然后出核到细胞质当中发生翻译。对 lncRNA 而言,由于lncRNA的功能主要还是通过影响其它基因来实现的。所以 lncRNA 在不同的位置影响的功能肯定也是不一样的。如果在细胞核,就是参与转录调控了,经典的方式还是影响ceRNA的方式来进行调控;而如果在细胞质的话,那就参与转录后调控了,比如和mRNA形成互补双链来增加 mRNA 的稳定性。所以在研究 lncRNA 的时候,知道 lncRNA 的定位还是很有必要的。今天就给大家介绍几个预测lncRNA定位的数据库。
老基因查询

如果我研究的基因是其他人已经研究很深入的基因了,一般都会有人去做其细胞定位的。这个时候我们可以使用 RNALocate (http://www.rna-society.org/rnalocate/)进行查询。这个数据库通过文本挖掘的方式,来挖掘了已经有研究报道的基因定位。

这个数据库提供了检索的功能,我们只需要提供相关的基因名就可以来检索到结果了。

通过检索,我们就可以得到这个基因目前研究定位的具体结果了。如果有结果的话,数据库会把相关的句子列出来,来证明其文章挖掘的正确性。同时如果这个定位结果来自于数据库,也会把数据库的信息列出来。

需要注意的是,这个数据库是2017发表的。所以关于基因定位的信息也就收集到17年之前,近3年的基因研究结果就没有包含在内了。

新基因查询

RNALocate 的数据的。由于在 RNALocate 已经知道了很多lncRNA的定位了,所以基于这些RNA的定位的序列,来进行机器学习,并获得一个相关的模型,进而对输入的基因序列来进行位置预测。

如果我们研究的基因是新的基因的话,那就不能通过上面的数据库来进行查询了,就只能通过预测来做了。目前对于定位预测的方式主要还是基于基因序列的。下面介绍的两个预测数据库也是基于上面

所以,这两个数据库我们只需要数据目标序列就行。两个数据库的差别其实也就是算法的不同而已。

lncLocator

lncLocator(http://www.csbio.sjtu.edu.cn/bioinf/lncLocator/) 打开页面是这样子的。我们需要做的就是简洁的3步。
拿这个网站自带的示例来具体操作一遍,提交就可以得到结果。

(其中第二步邮箱只是为了保存数据结果,以后查看更方便,这里暂时不选择了)

提交后,我们就可以知道这个序列在每个定位的具体评分了。

iLoc-LncRNA

iLoc-LncRNA 也是一样,

(http://lin-group.cn/server/iLoc-LncRNA/predictor.php),我们只需要输入基因序列即可。
依旧拿网站自带的example示例,输入后提交即可。
自制的有可能有效的方法

PS:这个方法是之前在看另外一个数据库的时候想到的。至于有没有效,我觉得可以尝试一下。

之前我们的介绍 ENCODE 数据库的时候,提到他们做了很多细胞、组织的测序结果,而在里面对于细胞系的测序结果。他们其实还分了细胞核测序以及细胞质测序的结果。所以基于这个结果,我们就可以知道某一个基因/lncRNA 是在核表达还是在细胞质表达了。但是,这些ENCODE做了细胞系可能不全,只是其中代表性的几个。所以,有可能我们研究的疾病相关的细胞系就没在里面也是正常,所以并不一定适用于所有人。

数据库总结

由于lncRNA的定位确实影响其功能的发挥,所以在进行研究之前进行一下预测总是没有坏处的。不然万一设计了ceRNA的实验,结果发现在细胞核里面不表达这个lncRNA。那就尴尬了。。

(0)

相关推荐