[数据库介绍]g:profiler 多ID富集分析
基因组学分析在得到差异表达基因之后,最常做的还是富集分析。通过富集分析我们可以了解相关基因集主要在形式的功能是什么。目前用来做基因富集分析的工具很多。这次介绍的这个叫g:profiler(https://biit.cs.ut.ee/gprofiler/gost);
G:profiler 不止是可以进行富集分析。这个网站包括四个主要的工具:
g:GOSt: 对基因集进行富集分析
g:Convert: 基因ID转换工具
g:Orth: 不同物种之间同源基因名转换
g:SNPense: SNP注释工具
g:GOSt:富集分析
g:GOSt是一个可以进行富集分析的工具。它可以接受多种多样的输入方式。其中包括:geneid; SNPIDs; 染色体位置;GOterms。另外值得注意的是。它可以接受不同类型的输入。比如输入geneids + 染色体位置 + SNPids。
富集分析的结果可以通过一个瀑布图和分布热图来进行可视化。同时也提供了数据结果下载的界面。其结果包括11个部分:
GO分析结果:BP;CC;MF
通路分析:Reactome, KEGG and WikiPathways
DNA相关调控:转录因子调控(TRANSFAC)以及miRNA(mirTarBase)调控
蛋白数据库:CORUM蛋白复合物注释数据库以及人类表型数据库(Human Phenotype Ontology,HPO)
按照下图显示,即检索结果的默认显示界面,我们可以看到各个注释的结果。结果的横坐标是注释的数据库,总坐标是注释的-log10(P)。每一个点代表一个结果。
同时。如果我们点击Detailed Results
就可以看到所有详细的结果,同时还可以把结果导出成csv。
g:Convert:基因ID转换工具
这个工具和第一个一样也支持多个类型的基因数据。我们需要做的就是设定好想要转换的ID类型即可。
导出的结果包括,输入的类型,转换的结果,结果的官方SYMBOL,以及简单的描述。同样的结果可以导出表格格式
g:Orth:不同物种同源基因转换
该工具通过收集ENSEMBL
数据库里面不同物种基因序列上同源关系的相近程度。寻找不同物种之间相近同源关系的基因。
同样的这个工具也接受多种类型的ID输入。
结果当中会显示原始物种和想要转换的物种之间的配对信息
g:SNPense:SNP注释工具
该工具可以用来注释单核苷酸多态的相关信息。其中包括相关的位置信息,所在基因,具体可能的功能。
该文件的输入就是标准的SNP号(rs号)即可
数据库评价:
随着基因组学数据的增多,现在出来了有很多基因富集分析的工具。其实就结果而言,主要考虑的还是数据库本身背景数据的更新快慢。如果一个数据库更新很快的话,那结果就会更加准确一些。这个数据库倒是提供了一个多ID兼容的功能。这个有需要的时候可以参考。
至于其他的。目前基因ID转换工具倒是不多。这个倒是一个备选。