lncRNASNP: LncRNA相关SNP突变数据库
lncRNA中的SNP及其对lncRNA的影响怎么做?疾病中lncRNA的表达是什么?
这样的小问题,LncRNASNP大可爱都能解决。
lncRNASNP的构建图
IncRNASNP 是提供人、小鼠长链非编码RNA(lncRNA)中单核苷酸多态性(SNP)的全面资源的数据库。该数据库由华中科技大学研究人员开发的专门收录lncRNA和SNP关联信息的数据库,它包含lncRNA中的SNP位点,探究SNP对lncRNA结构的影响,lncRNA中的突变以及lncRNA:miRNA结合,分析SNP位点对于lncRNA与miRNA结合的影响。lncRNASNP2数据库中人类lncRNA和SNP的数量已更新为141,353和10,205,295。此外,确定了在lncRNA中基于GRCh38的859,534 非编码变体 和315,234 TCGA癌症突变。
IncRNASNP
http ://bioinfo.life.hust.edu.cn/lncRNASNP
lncRNASNP主页
一起来看看lncRNASNP的功能,使用方法如下:
01
搜索功能
一般可以在检索栏中可以输入snp号、 lncRNA,甚至 mirRNA也可以,结果展示内容结构基本一致。需要注意的是,我们如果直接输入想要研究的genesymbol可能得不到自己想要的结果,解决方法是先去 NONCODE数据库找到相对应的ID号才既可以检索。本次以snp号rs1001021为例:
可以看到rs1001021在SNP的信息,位置是chr22:26007633频率(Ref / Alt)是G( 0.8992)/ A( 0.1008),位于lncRNA。
lncRNA中的SNP rs1001021及其在lncRNA中的SNP作用,这里的lncRNA的ID是来自于NONCODE数据库的ID号。
除了主页上的检索功能外,还有独立的模块进行检索,在导航栏search,可以进行更加精确的检索。
搜索结果会增加SNP causes miRNA:lncRNA Gains和SNP cause miRNA target loss内容:gain指的是原本lncRNA与miRNA没有结合位点,突变之后的lncRNA与miRNA存在结合位点,loss则与之相反,示意如下:
查看detail,会显示具体的调控结果:
如果搜索lncRNA,还会展现结合位点图,可能与此lncRNA结合的miRNA以有颜色的小块呈现,不同的颜色代表不同的靶向类型(是否保守,是否有实验支持,以及miRNA表达水平):
02
IncRNA
疾病预测模块,这里展示预测的有关这个lncRNA可哪些疾病存在关联,为了解lncRNA和某些特定疾病的关联提供依据。可以通过选择Experimentally supported lncRNA-associated diseases和lncRNA-associated diseases predicted by TAM方式筛选疾病类型。
染色体预测部分提供以下信息是 lncRNA转录本对应的 lncRNA基因 , 以及1小时染色体 上 有0个lncRNA基因的 人lncRNA转录本 。
03
SNP
这里会展示人类lncRNA转录本中的SNP。数据库里在90,062个lncRNA基因的141,353人lncRNA转录物中鉴定了10,205,295个SNP。网站提供一种高级搜索功能,可帮助用户确定功能性SNP的优先级。用户可以输入染色体ID或染色体区域,还可以限制SNP次要等位基因频率(MAF),并选择是影响miRNA:lncRNA还是在GWAS LD地区。
04
Mutation
这里分为 TCGA Mutation 和Cosmic NCV功能区。
在TCGA Mutation,有 315,234 个疾病通过FATHMM算法计算了lncRNAs上的TCGA癌症突变,以及突变对lncRNA功能的影响 。还从TANRIC中收集了20种癌症中的lncRNA表达 ,这些癌症包括BLCA,BRCA,CESC,COAD,GBM,HNSC,KICH,KIRC,KIRP,LGG,LUAD,LIHC,LUSC,OV,PRAD,READ,SKCM,STAD, THCA,UCEC。
在 CosmicNCV:非编码变体,突变影响过滤器源自新的FATHMM-MKL算法。该算法使用隐马尔可夫模型预测蛋白质错义变体的功能,分子和表型后果在118847个lncRNA基因的193085人lncRNA转录本中鉴定出859534 CosmicNCV,其中显示了其中的前25个(按lncRNA起始位置排序)。
05
miRNA
这模块中基于miRNA表达显示miRNA:lncRNA相互作用和相关的SNP。根据TCGA的11635个小RNA样品的miRNA表达谱分析,因此可以选择感兴趣的miRNA以获得其靶lncRNA。可以通过表达来选择miRNA,得到靶向的lncRNA及由SNP带来的结合位点增加/缺失。在这一部分,miRNA根据表达不同被分为四类,高表达(RPM≥1000),表达适中(10≤RPM< 1000),低表达(1≤RPM<10)和不表达(RPM<1)。对于每个人类miRNA,我们也在‘basic information of miRNA’部分提供了其在28种类型癌症中的表达水平。
06
Predict
a. 预测lncRNA变异体对miRNA:lncRNA相互作用的影响
用户可以分别在其中输入您的野生lncRNA序列和突变型lncRNA序列。如果仅提供野生序列,您将获得有关此序列上的miRNA靶标的结果,如果提供野生序列和突变体序列,则将获得由变体诱导的miRNA靶标丢失/获得的结果。采用上述的3种软件预测miRNA与两种序列的结合位点,从而分析突变对于lncRNA-miRNA结合的影响,示意如下
b. 预测SNPs对lncRNA二级结构的影响
这里采用RNAsnp软件预测snp位点对于lncRNA二级结构的影响,示意如下
SNP文件必须包含在单独的行中给出的SNP列表。SNPs被描述为野生型核酸,随后是核苷酸位置,随后是突变核苷酸。示例SNP格式:,A201G(其中A是给定序列中的野生型核苷酸,201是野生型核苷酸的序列位置,G是突变体(或SNP)。)序列文件,必须包含一个lncRNA序列(最好采用FASTA格式,长度至少为200 nts)。
示例结果如下:
07 Data
网页数据库对于检索单一位点或者lncRNA还是很方便的。但是如果是多基因的话,这样比较麻烦。网站提供的Data模块就可以大展身手了,在这里可以得到基本上所有的数据的结果。
总的来说, lncRNASNP提供了疾病中功能变异、调节元件、lncRNA和circRNA之间的关联,是用于研究疾病中lncRNA和circRNA的功能和机制重要的且不断更新的资源,此外,网站开发了四个在线工具,包括基因组浏览器,突变映射器,Circos绘图仪和功能注释(这里没有介绍到),有需要的同学可以自行探索,今天关于lncRNASNP的内容就介绍到这里啦。