一站式 lncRNA 查询数据库

写在前面

在研究一个lncRNA之前,我们都要先去查看这个lncRNA可能的相关功能,比如要查看这个lncRNA的表达、查看其相互作用的miRNA或者需要去查看调控这个lncRNA的转录因子。对于不同的需求需要使用不同的数据库,今天就来介绍一个一站式查询lncRNA相关功能的数据库: AnnoLnc2 (http://annolnc.gao-lab.org/)

这个数据库可以查询多个对于lncRNA多个方面的结果,,一般这种汇总式的数据库,类似于一个中间站,是汇总了很多数据库的结果,所以我们就来介绍了一下数据库都有什么结果以及数据库的结果是基于什么做出来的。

PART 1
数据库使用

首先需要注意的是,这个数据库可以对人和老鼠的lncRNA进行注释。这个数据库没有使用基因名数据的方式来进行查询,而是使用了输入Fasta序列的方式来进行查询的。我们需要做的就是选择物种、输入序列、提交结果。

在结果界面,首先能看到一个在左侧侧边栏有一个主要的结果,这个是数据库对于一个lncRNA所有相关的注释的条目,我们可以点击某一个标题就可以直接跳转到这个地方了。

PART 2
结果汇总

首先我们看到的是一个对于检索的lncRNA的一个结果的基本汇总,可以在汇总当中了解关于这个lncRNA的基因主要显著的信息。

PART 3
基因组位置及结构

在基因组位置这里,数据库把我们提交的序列和目前已知的基因组序列进行比对,来查看这个序列具体的位置以及相关的特征。另外,关于序列特征当中,有一个重复序列的预测,这个作者使用的是 RepeatMasker 来预测的序列当中是否有重复序列。

关于lncRNA本身的二级结构,这个数据库也进行了预测,具体的预测是通过ViennaRNA (http://rna.tbi.univie.ac.at/) 数据库,这个数据库是专门用来预测RNA二级结构的,如果有其他二级结构预测的基因,可以去看一下。

PART 4
表达和调

了解了lncRNA的序列特征之后,就要看这个lncRNA表的情况以及其相关的调控情况了。

1 表达情况

关于基因的表达情况,数据库使用了GETx数据库里面的正常组织、CCLE里面的癌症细胞系以及ENCODE数据库里面的数据来进行查看的,在结果呈现当中,也是分成了正常组织和癌症组织分类来查看的。

2 亚细胞定位

对于lncRNA表达的不同位置可能形式不同的功能。之前我们介绍过关于lncRNA亚细胞定位的数据库,具体的可以参考第二条推送。这个数据库也提供了相关的预测功能,具体的是使用了十种人类细胞胞质和胞核的表达测序的数据,通过比较核/胞质表达来确定这个lncRNA主要是在哪个地方表达。另外的也有包括说多基序(motif)也是可以帮助lncRNA定位的,所以这个数据库就收集了和亚细胞定位的motif来进行预测。

3 表达调控

在表达调控方面,最经典的还是转录因子调控以及miRNA调控。这个数据库使用GTRD来预测lncRNA的可能收到的转录因子调控作用,同时使用TargetScan来预测其miRNA调控的作用。

4 SNP调控

基因序列的改变也会影响这个基因的调控的,所以这个数据库通过GWAS数据库来寻找影响这个lncRNA的SNP,进一步的通过eQTL来评价哪些SNP对于这个lncRNA的表达有影响,这个分析的主要数据来自于GETx。

PART 5
相互作用与功能

1 与mRNA表达的相关性

由于使用的RNA-seq的数据,所以就可以看lncRNA的表达和哪些基因存在共表达关系,所以这个数据库提供了正常组织和癌症细胞当中共表达的基因。

2 与蛋白的相互作用

看完了mRNA的共表达,就可以看这个和蛋白的关系了。这个数据库使用了目前发表的GEO上面的CLIP-seq的数据来进行分析,对于GEO里面没有的蛋白数据,数据库使用lncPro数据库来进行预测。所以在结果当中就包括两个部分,一个是lncPro数据库的结果,另外一个则是CLIP-seq分析的结果。

3 功能预测

了解了lncRNA的相互作用的基因了,就可以来预测这个lncRNA的功能了。由于lncRNA本身是不会编码蛋白来发挥作用的,所以主要是通过其相互作用的基因来预测这个lncRNA的功能,这个数据库主要预测了lncRNA本身GO分析的功能。

PART 6
进化分析

最后对于基因的序列,不同的物种可能序列长度是不一样的,所以可以来进行物种之间的进化分析,来了解不同物种之间同一个lncRNA的进行情况。这个数据库主要是通过UCSC来下载相关的序列,然后通过phyloFit来比较物种之间的进化关系。

PART 7
数据库总结

如果我们要了解一个lncRNA的基本信息的话,基本上这个数据库做的已经很详细了,所以如果刚刚拿到手一个lncRNA可以通过这个数据库来看一下其基本的功能,然后看怎么来进行研究。

(0)

相关推荐

  • 综述 | CLIN TRANSL MED: 非编码RNA(ncRNA)调控轴在动脉粥样硬化进展中的作用

    编译:KT!,编辑:景行.江舜尧. 原创微文,欢迎转发转载. 导读 人类基因组测序项目发现了细胞RNA世界的丰富多彩,并打开了具有调控或结构潜能的短或长非编码RNA(潜藏的转录组学)的大门,同时也转变 ...

  • lncRNASNP: LncRNA相关SNP突变数据库

    lncRNA中的SNP及其对lncRNA的影响怎么做?疾病中lncRNA的表达是什么? 这样的小问题,LncRNASNP大可爱都能解决. lncRNASNP的构建图 IncRNASNP 是提供人.小鼠 ...

  • 需要再战国自然?让这个16分的重磅数据库升级你的科研思路!

    本期直播主题:国自然放榜了,又没轮到我,该为了明年申请做点什么? 点击预约按钮,领开播好礼! 解螺旋公众号·陪伴你科研的第2667天 重磅数据库 RNA结合蛋白(RBP)在转录后的调节中起着关键的作用 ...

  • 必看! 2020年科研中的18个高频问题(一)

    2020年快结束了,吉凯基因在此感谢各位老师在过去一年中的大力支持. 2020年的岁末,吉凯基因针对老师们在科研中遇到的一些常见.基础.但又非常重要的问题进行年终总结.搬砖小陈抽丝剥茧,提取出十八个问 ...

  • Annolnc:一站式lncRNA查询数据库

    长链非编码RNA(lncRNA)是一类新型调控分子,它在从胚胎发育到肿瘤发生等在多种生理病理过程中发挥重要调控作用.虽然人类lncRNA发现数量和规模快速扩张,但这些工具仅支持从单一角度对长非编码RN ...

  • 非编码RNA(Non-coding RNA)是什么?

    非编码RNA(Non-coding RNA)是指不编码蛋白质的RNA,包括miRNA.lncRNA.circRNA.piRNA等.非编码RNA发挥功能的方式很多,可以与蛋白.DNA和RNA相互作用,参 ...

  • 塑料塑胶材料物性表属性、性能参数查询数据库

    阿技材料库, 收录100多个材料厂商,40000多个材料牌号.通过数据技术处理,实现技术参数精确搜索. 可以把以下属性: 叠加筛选搜索,提高选材效率 并查看原厂物性表,查找供应商 基本信息搜索 1.种 ...

  • Power BI动态查询数据库,以及需要注意的问题

    小勤:现在公司数据库里的数据量很大,怎么才能按需要仅接入自己需要的数据?比如说,按需要输入起始日期,然后仅从数据库里接入该起始日期至今的数据. 大海:你可以设置起始日期为参数,然后在接入数据库时使用的 ...

  • 干货:科研必备细胞信号通路查询数据库

    细胞的生命活动起源于信号传导.信号通路是指当细胞内发生某种反应时,信号从细胞外到细胞内传递了一种信息,细胞要根据这种信息来做出相应的反应现象.细胞外信号分子一般不能直接进入细胞,必须通过与胞膜表面(或 ...

  • Cypress web自动化36-cy.exec()执行python查询数据库获取结果

    前言 cy.exec() 可以执行系统命令行,那么用 python 写个查询 sql 的时候,返回结果是 json 格式. cypress 的脚本是 javascript 语言写的,没法直接识别pyt ...

  • 各种RNA的引物序列,你是自己设计还是查询数据库?

    荧光定量PCR是我们检测RNA表达最常见的实验室四大技术之一,其中引物序列的设计是大家常常遇到的问题,今天我们来介绍几个常用的查询PCR引物序列的数据库. 1. Primerbank:https:// ...

  • 林氏字辈3000村各省专辑查询数据库【按村数排序&按拼音排序】

    [全球林氏字辈3000村][各省林氏专辑]本专辑收集了福建.广东.浙江.四川.广西.湖南.江西.重庆.山东.贵州.河南.安徽.江苏.海南.台湾.云南.陕西.吉林.辽宁.山西.河北.黑龙江.内蒙古.香港 ...

  • EWAS Atlas | 甲基化状态查询数据库

     之前我们介绍过两个关于甲基化相关的数据库.这两个数据库都是基于TCGA构建的.或者说,这两个数据库肿瘤相关的数据库.那么有没有其他病种的甲基化相关的数据库呢? 今天我们就介绍一下包括很多样本类型的甲 ...

  • 临床相关突变查询数据库

    写在前面 越来越多的研究发现某一个基因的突变和很多的临床特征有关系.如果我们想有查找临床性状和基因突变的关系的话,内容比较全面的就是ClinVar数据库了.ClinVar 数据库是ncbi旗下用于查看 ...