高通量表达数据分析工具
对于基因表达而言,如果是常规的数据分析的话,目前网上已经有很多的工具可以来进行分析了。之前 我们介绍的NetworkAnalyst就是这个类型的。这类的工具,彼此之间的区别也就是在于功能的多少。今天就继续给大家介绍一款用来分析表达数据的工具:Quickomics(http://quickomics.bxgenomics.com/)。
在Quickomics当中,我们可以分析1. 数据质量评估; 2. 差异表达分析;3.整体数据/局部数据可视化;4.富集分析;5.基因聚类分析;6.交叉分析
分析数据导入
对于这类流程化分析的工具而言。其中主要的难点还是在数据导入这个方面。只要数据导入对了。后续的分析结果自然也就出来了。
在Quickomics当中主要还是支持两种数据格式。一种是基于R语言的数据格式。另外一种则是csv的数据。其中在csv当中。我们点击Upload Files。里面对上传什么样子的数据以及怎么上传的有详细的说明。如果还是不会的话,可以下载里面提供的事例文件。照猫画虎即可。
在上传完之后,在同样的界面,我们可以看一下具体文件的信息。比如上传的样本信息这样的。
数据质量评估
对于上传的数据,在进行分析之前,对于数据的质量都要进行评估。我们在QC Plots可以观察。在这个模块里面,👉是可视化的图形。👈是对图形进行调整的具体参数。
在这个里面,可以进行样本分布的多种分析及可视化,例如PCA分析或者样本之间聚类分析。等等。
差异表达分析
在Volcano Plot这个部分,可以对定义的分组进行差异表达分析。在这个部分,首先可以通过火山图来进行结果展示,同时可以也可以下载相关差异分析的表格。
同时在这个部分。如果上传的数据包括多种分组的话,还可以分析在不同的分组当中基因的比较。
整体/个体数据可视化
在对具体结果可视化当中,主要是可以对某一些基因进行热图可视化。
在个体基因可视化当中,可以对通过箱式图或者小提琴图来对目标基因进行可视化。
富集分析
在Gene Set Enrichment当中可以对差异分析的结果进行GSEA分析。在GSEA分析的基因集当中。使用的还是MsigDB当中的官方基因集。
结果当中,除了最基本的富集分析的表格结果。还可以对具体的KEGG通路进行可视化。
基因聚类分型
在这个部分,可以使用目标基因进行基因分型。在聚类的算法当中,主要是支持:Soft Clustering以及K-means两种算法。
经过分析可以得到聚类相关的图形以及各个样本具体的聚类分组。
交叉分析
在交叉分析这里可以观察不同分组差异基因的venn图。同时也可以下载基因在不同分组的当中的差异分析结果。
以上就是这个工具的主要分析内容了。对于测序数据的常规分析都基本上覆盖了。同时可以不错的可视化。如果有需要的话,可以试一下的哈。