预测 lncRNA 亚细胞定位的网站
如果我研究的基因是其他人已经研究很深入的基因了,一般都会有人去做其细胞定位的。这个时候我们可以使用 RNALocate (http://www.rna-society.org/rnalocate/)进行查询。这个数据库通过文本挖掘的方式,来挖掘了已经有研究报道的基因定位。
这个数据库提供了检索的功能,我们只需要提供相关的基因名就可以来检索到结果了。
通过检索,我们就可以得到这个基因目前研究定位的具体结果了。如果有结果的话,数据库会把相关的句子列出来,来证明其文章挖掘的正确性。同时如果这个定位结果来自于数据库,也会把数据库的信息列出来。
需要注意的是,这个数据库是2017发表的。所以关于基因定位的信息也就收集到17年之前,近3年的基因研究结果就没有包含在内了。
RNALocate 的数据的。由于在 RNALocate 已经知道了很多lncRNA的定位了,所以基于这些RNA的定位的序列,来进行机器学习,并获得一个相关的模型,进而对输入的基因序列来进行位置预测。
如果我们研究的基因是新的基因的话,那就不能通过上面的数据库来进行查询了,就只能通过预测来做了。目前对于定位预测的方式主要还是基于基因序列的。下面介绍的两个预测数据库也是基于上面
所以,这两个数据库我们只需要数据目标序列就行。两个数据库的差别其实也就是算法的不同而已。
lncLocator
(其中第二步邮箱只是为了保存数据结果,以后查看更方便,这里暂时不选择了)
iLoc-LncRNA
iLoc-LncRNA 也是一样,
PS:这个方法是之前在看另外一个数据库的时候想到的。至于有没有效,我觉得可以尝试一下。
之前我们的介绍 ENCODE 数据库的时候,提到他们做了很多细胞、组织的测序结果,而在里面对于细胞系的测序结果。他们其实还分了细胞核测序以及细胞质测序的结果。所以基于这个结果,我们就可以知道某一个基因/lncRNA 是在核表达还是在细胞质表达了。但是,这些ENCODE做了细胞系可能不全,只是其中代表性的几个。所以,有可能我们研究的疾病相关的细胞系就没在里面也是正常,所以并不一定适用于所有人。
由于lncRNA的定位确实影响其功能的发挥,所以在进行研究之前进行一下预测总是没有坏处的。不然万一设计了ceRNA的实验,结果发现在细胞核里面不表达这个lncRNA。那就尴尬了。。