在线聚类分析网站
对于高维度的数据分析而言,例如RNA-seq的数据。我们在得到数据想要解释不同分组之间的差异的基因。往往都需要逐渐的降维来进行解释。最普遍的方法通过差异分析—富集分析这样的也算是一种逐步降维的操作。这样这样的分析,也有可能聚焦到很多个目标当中,比如一个通路当中有很多个基因。因为为了更好的解释高维度的数据,也就有了基因分型这样的分析方法。
简单来说的基因分型,就是各种算法的无监督的聚类分析。对于一个RNA-seq的数据,基于每个样本当中不同的基因特征,把所有检测的样本分成不同的组(亚型)。例如昨天介绍的那个文献,就是基于免疫相关基因把胰腺癌分成了5个亚型
对于聚类分析而言,如果要实现的话,用的最多的还是R或者python。涉及到代码的话,就需要一定的门槛。所以今天就给大家介绍一个在线的用于基因聚类分析的网站:COMSUC([http://comsuc.bioinforai.tech/analysisTab])
内置算法和数据集
如果只是用来分析一些,基本的公共数据的话。例如,TCGA、ICGC、TARGET。在COMSUC当中提供了原始的数据。所以可以用来直接分析。
当然如果想要特异性的分析一些数据的话,那上传自己的数据。具体格式要求的话,可以参照数据库里面的介绍:[http://comsuc.bioinforai.tech/manualTab/Html/General]
另外对于不同的聚类得到的结果是不一样的。至于说那个聚类算法好,这个具体分析具体看。在这个数据库当中,一共提供了8种不同的算法可以使用。
同时在共识聚类当中,也提供了三种算法。
数据库使用
对于数据库的时候的话,如果是使用内置数据集。就基于我们的想要分析的内容进行适当的选择即可。例如,我想要分析:TCGA在ACC癌当中基于mRNA数据来进行Kmeans聚类分析的结果
结果展示的话,主要是成分成四个部分。
样本网络展示,这这个部分,我们可以查看不同样本之间基于聚类的网络是什么样子的。同时,我们在网站的右边还可以自定义可视化结果。以及下载相关的图片。
样本相关性分析图,除了网络图展示不同样本之间的关系之外。还可以展示不同样本之间的相关矩阵
如果是使用TCGA数据的话,里面有预后信息。我们还可以分析不同分型和预后的关系。
不同分型之间存在差异基因。由于基因分型其实就是不同的分组。所以基于不同的分组我们可以寻找差异基因。这里也就展示了那些基因是有差异的。
以上就是这个数据库可以展示出来的结果。对于数据库分析的所有结果。我们都可以通过Download下载下来。
总的来说
这个网站,给我们提供了可以不用代码就可以进行基因分型分析的方法。如果想要进行相关的基因分型分析的话。可以尝试一下这个网站哦。