用Metascape进行一站式的蛋白功能富集和PPI网络分析
通过组学测序得到一组基因或蛋白后,对着测序报告中给的热图火山图,很多新手都是很困惑的。对于这些结果,我们还能做些什么,才能对我们的后续研究工作提供真实可靠的提示与帮助呢?能否得知这些基因主要参与了哪些生物学功能、调控了什么分子通路、通过与哪些蛋白的互作产生的这种调控作用?此时,Metascape网站,就是你需要的。
Metascape网站专门面向无代码基础的组学研究人员进行设计,整合了DAVID的富集分析功能和STRING的PPI蛋白互作网络分析功能。集成数据库最多、数据库更新快、无需下载、分析速度快、出图美观、操作简便等优点,使其在2019年一经问世,便迅速受到了广泛的关注及应用。作者甚至看到身边有很多专门做生信的同学,做富集分析和PPI网络时都放下代码R包,转战Metascape了。Metascape在这些领域的优势不言而喻。相信今天的学习,不仅能为你的文章添加很多漂亮的图片,也能对你后续的实验设计起重大的提示作用。
点开网址,一起开启新世界的大门吧!→https://metascape.org/
一.操作方法
首先,在输入框中贴入你的基因列表中贴入你的基因(不建议新手使用文件直接导入的方法,容易因格式问题导致数据缺失)。基因的输入支持Symbol,Gene ID,Ensembl ID,UniProt ID等多种常用形式,只要统一即可。多数情况下,各种ID的识别率优于Symbol(即我们常说的基因名)。分隔方式可以使用英文的逗号,或直接分行。以下以基因Symbol格式进行演示:

F1. 两种常用的数据分隔形式
点击Submit后,选择你研究的物种:

F2. 物种选择界面
选好物种后,点击Express Analysis提交。待出现以下界面,就能点开链接、看我们的数据分析报告啦!

F3.报告页链接
二.结果解读
1.富集分析结果解读
点开以上结果界面的黄色的Analysis Report Page链接,会看到图形+表格方式展示的富集分析结果和PPI网络分析结果:
首先是我们最关注的功能富集,纳入了包括GO/KEGG、canonical pathways、hall mark gene sets等常见的注释条目,并根据注释内容根据纳入的基因进行层次聚类(可以简单理解成,把富集得到的注释,按其功能进行了分类)。这个图真的太漂亮啦,直接用在文章里也是OK的!

F4. 功能富集的层次聚类结果及聚类树,可对照查看
其中,柱状图中只显示了P值信息,如果需要更详细的信息,可以参照下面的表格进行分析。Count为用户给出的基因列表中,纳入该注释条目的基因数;“%”代表Count数占用户给出的基因列表的比例;P即P值;q是多重假设检验校正后的P值。Log10()即对这些值取底数为10的log值,以平稳数据、增强可视化效果。

F5. 功能富集聚类分析表(局部)
聚类树也会同时以P值进行展示。节点越大、颜色越深,该注释条目纳入的基因数就越多、P值也就越显著:

F6. 聚类树的两种展示类型
点击图片下方的PDF按钮可以直接导出图片,也可点击CYS按钮,导入Cytoscape进行进一步美化(Cytoscape的使用会在后续文章中为大家介绍),或点击Web进入网页编辑模式,直接进行编辑处理(大概是对国内用户不太友好,反正我换了很多浏览器也没打开过这个链接=口=)。
此外,如果你只对GO中的Biological Processes类型的注释(也是最常用的注释类型)感兴趣的话,网站也贴心的给出了单独的Biological Processes柱形图:

F7. GO富集分析biologicalprocesses分类图
2.蛋白质互作网络结果解读
蛋白质互作(PPI)网络展示了蛋白的互作情况,并同时展示了MCODE组分及其富集分析结果。注意这里与STRING网站不同的是,Metascape的PPI网络图中,删除了与基因列表中其它基因不存在互作关系的基因。最贴心的是,网站自带了Cytoscape的经典插件MCODE(Molecular Complex Detection)功能,这个功能的主要用途是发现PPI网络中紧密联系的区域,这些区域可能代表分子复合体。通过MCODE算法识别出的子网络进行功能富集分析,可以进一步明确这些潜在复合体在生命调控中发挥的作用,从而为下一步的实验提供有力依据。这里Metascape提供了以上提到的全套分析结果,我们只管看结论就好啦!如果需要对图片进行进一步美化,也可以下载CYS格式文件进行Cytoscape美化,或直接点开网页工具进行在线美化哦!

F8. PPI网络及MCODE组分分析结果
最后,结果页面的顶部可以下载所有完整的结果和原始数据,建议大家点击“All in One Zip File”下载原始数据进行查看。此外,“Gene List Report PPT file”提供了PPT格式的分析报告的下载,更方便结果的查看编辑哦!

F9. 网站自动生成PPT格式的分析报告
参考文献:
Yingyao, Zhou,Bin, et al. Metascape provides a biologist-oriented resource for the analysisof systems-level datasets.[J]. Nature Communications, 2019.

END
