表达谱芯片没有ncRNA信息怎么办
在ncRNA还没有研究之前,好多表达谱芯片是没有ncRNA的注释信息的。这也就导致说很多表达谱的芯片,没办法分析ncRNA。对于芯片的探针而言,可以通过重注释的办法来看一下是否能重新获得一部分ncRNA的数据。之前我们在GEO芯片重注释。介绍了通过blast来重注释基因的方法。当然这个方法也适用于对于ncRNA的重注释。但是上面的方法就比较麻烦,所以今天就给大家推荐一个ncRNA重注释到功能分析一体的数据库: ncFANs(http://ncfans.gene.ac/)
数据库功能介绍
在ncFANs当中,主要包括三个可以分析ncRNA的模块。
ncFANs-CHIP: 上传芯片表达数据,对芯片数据进行重注释,来得到更多的ncRNA,同时对重新注释的芯片进行功能分析
ncFANs-NET: 基于之前分析好的ncRNA-protein网络,输入想要分析的ncRNA获得相对应的ncRNA功能
ncFANS-eLnc: 增强子lncRNA鉴定。输入测序数据鉴定增强子lncRNA。
ncFANs-CHIP
数据输入
在这个模块中,可以对Affymetrix的芯片数据进行ncRNA重注释,进而可以进行差异表达分析以及共表达 网络分析。
对于这类芯片数据的重新注释,作者是提前把Affymetrix一部分注释文件注释好了,只需要进行重新匹配即可。因此想要分析的芯片需要是数据库提供的那些芯片。目前这个数据库可以分析下面这些芯片数据。
同时在数据上传的时候,需要上传原始的CEL文件。来进行分析。这里需要case组和control组分开上传。
在上传完数据之后,就可以选择后续的分析了。其中在差异表达分析当中,可以选择是基于limma,t-test还是Wilcoxon test。
在所有的都选择好之后,点击Run即可进行分析。
结果呈现
在结果当中,首先可以看到重新注释完的数据的基本统计信息。同时也可以把重新注释的表达数据下载下来。
进一步可以看到重新注释之后差异表达分析的结果,以及这些差异基因的富集分析结果
另外在共表达网络分析当中,可以具体每个模块内有哪些ncRNA以及其基本的功能
ncFANs-NET
数据输入
上面主要是基于芯片数据进行重注释进而进行功能分析。NET这个模块则主要是分析想要研究的lncRNA和其他蛋白之间的功能预测。在这个部分主要输入想要分析的lncRNA以及候选的编码蛋白的基因即可。
这个模块主要是可以分析这些lncRNA的以下四种功能。
结果展示
在结果展示部分,首先可以看到想要分析的这几个lncRNA的基本表达情况,分别是在GETx数据和TCGA数据库当中的表达情况。
进一步可以在不同的功能分析当中观察输入的lncRNA和目标蛋白在不同的分析当中的相互作用关系。
Coexpression: 在这个部分,作者使用TCGA和GETx数据来进行WGCNA分析,来寻找输入的ncRNA以及编码基因之间的共表达关系
Comethylation: 在这个部分,作者使用TCGA以及MehBank数据库对候选基因的甲基化数据进行了WGCNA分析。由于同样是WGCNA分析,所以得到的结果形式也是差不多的。
LncRnet: 在这个部分则是多组学的角度来分析ncRNA和候选基因之间的关系,其中包括:转录因子网络,ceRNA网络,RBP转录后调控以及lncRNA-DNA活性分析这几个方面来进行分析。最后可以发现目标ncRNA和哪些基因有关。
RF-based:以上都是基于现有的测序数据来进行分析的。这个则是基于随机森林网络进行分析的
限于篇幅,这里介绍了ncFANs当中的两个主要功能。至于增强子ncRNA的鉴定这个功能。有需要的可以去看一下。相对来说也是简单。所以这个也就不做过多介绍了。
总的来说
ncFANs相当于其他ncRNA靶基因预测数据和功能分析数据库而言,一方面多了一个ncRNA重注释的功能。这个对于芯片的重新分析而言还是挺重要的。另外对于其相互作用功能分析而言,ncFANs使用的基本上也是TCGA的数据,所以如果研究肿瘤的话结果还算好一些。如果是其他的疾病的话,可能就需要再考虑一下的。另外,由于使用的是WGCNA的方法进行分析的。这个其实目前一些其他数据库没有用到的手法。