数据库|最全的KEGG使用教程在这里!
KEGG(Kyoto Encyclopedia of Genes and Genomes,京都基因与基因组百科全书)是一个整合了基因组、化学和系统功能信息的综合性数据库,旨在揭示生命现象的遗传物质与化学蓝图。它是由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立,是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。
KEGG的网址:https://www.kegg.jp/。
1. KEGG数据库
代谢(Metabolism),遗传信息处理(Genetic Information Processing),环境信息处理(Environmental Information Processing),细胞过程(Cellular Processes),有机系统(Organismal Systems),人类疾病(Human Diseases),药物开发(Drug Development),该表只列出了部分代谢通路,详细的代谢通路信息见:https://www.kegg.jp/kegg/pathway.html。
2. KEGG通路中ko和K等编号说明
例如:
ko04010 -> KEGG Ontology
3. 如何理解KEGG通路-ko
查询结果如下:
其中长方形节点表示基因产物(如酶或一些RNA调节子),所有蓝色背景的基因产物都属于KEGG ORTHOLOGY(KO)分类体系(序列高度相似,并在同一条通路上有相似功能的蛋白质被归为一组KO),而白色背景的基因产物则不在KO分类体系之列。
通路中每个元素类型说明:
https://www.genome.jp/kegg/document/help_pathway.html
4. 如何理解KEGG的蛋白和酶促反应编号
查询KEGG的蛋白质或者酶分类编号的具体功能描述和参与代谢通路方法如下,以K10258为例。
查询结果如下:
查询KEGG的酶促反应编号的具体信息如下,以R00259为例。
查询结果如下:
5. 蛋白序列在线KEGG注释
在基因组研究中,特别是当组装了一个新物种的基因组,我们首先要做的就是注释,从而大致推断这些基因的功能。KEGG提供了在线注释功能,进入KEGG中自动注释工具界面,KAAS(http://www.genome.jp/tools/kaas/),如下图,以KAAS job request(BBH method)为例。
点击KAAS job request(BBH method)进入注释界面,提交注释序列: