一文读懂KEGG数据库

KEGG数据库介绍

在进行生物学实验或者生物信息的学习中,都会听说KEGG富集分析,而且该方法在高通量测序分析中已然成为数据分析中必不可少的一环。

这种分析方法依托的是由 Kanehisa实验室 在1995年开发的KEGG数据库,全称为 Kyoto Encyclopedia of Genes and Genomes(京都基因与基因组百科全书)。它拥有多个子数据库,包含基因组,生化反应,生化物质,疾病与药物,以及最常用PATHWAY通路信息。

进入KEGG官网:https://www.kegg.jp ,可以看到主页由以下几部分构成:

KEGG数据库构成

KEGG子库中存储的信息是生物系统的计算机表示形式,由基因和蛋白质(基因组信息)和化学物质(化学信息)的分子部件组成,这些部件的相互作用,反应和关系构成调控网络图(系统信息),除此之外,还包含疾病和药物信息(健康信息)。具体的分类及数据库如下:

KEGG PATHWAY 数据库

在所有子数据库中最重要也是最常用的就是KEGG PATHWAY,它包括大量由科研人员根据已有研究文献,通过手动绘制的KEGG通路图,代表着代谢过程,环境信息过程,细胞过程,生物系统,人类疾病和药物开发。

每个通路标识符都由一个五位数字,和以下任意一个:map,ko,ec,rn和三字母或四字母生物代码组成,它们分别代表五种通路类型:

  • map编号:代表reference pathway,根据已有的知识绘制的、概括的、详尽的具有一般参考意义的代谢图。一个点同时表示一个基因,这个基因编码的酶或这个酶参加的反应

  • org编号:物种特异性通路,这里就是将K编号基因(直系同源基因,后面会介绍)换为每个物种中对应的基因

  • ko编号:KO通路中的点表示直系同源基因

  • ec编号:EC通路中的点表示相关的酶

  • rn编号:化学反应通路中的点只表示该点参与的某个反应、反应物及反应类型

在了解每种通路之前我们先学会在KEGG中切换每种通路类型

地址:https://www.kegg.jp/kegg-bin/show_pathway?org_name=map&mapno=00020&mapscale=&show_description=hide

使用过程中切换各种通路类型,比如进入TCA循环 ,可以通过左上角下路菜单来切换:

接下来,我们详细介绍每种通路:

1
参考通路图 (map)

这里以 TCA循环 的通路图为例,进入参考通路图(Reference pathway)。这是原始版本的通路,也是后续几种通路图的"模板"。每个白框可以代表直系同源基因,酶,反应,也可以点击链接至KO,ENZYME和REACTION详细信息。

上述的形状,箭头,线段代表如下意义:

2
物种特异性通路 (org)

我们选择人的物种名Homo sapiens (human),点击Go。可以看到与Reference pathway 图(map00020)不同的是有物种特异性基因被标注为绿色,而且通路编号为hsa00020

访问链接:https://www.kegg.jp/kegg-bin/show_pathway?org_name=hsa&mapno=00020&mapscale=&show_description=hide

当然,如果直接访问hsa00020的链接也可以进入该通路:https://www.kegg.jp/kegg-bin/show_pathway?hsa00020

点击绿色基因,会进入Gene详细信息

3
直系同源物通路 (ko)

蓝色框超链接到从原始版本中选择的KO条目

进入PCK的直系同源基因信息

4
酶通路 (ec)

蓝色框超链接到从原始版本中选择的ENZYME条目

进入ENZYME

5
反应通路 (reaction)

蓝色框超链接到从原始版本中选择的反应条目,

点击后进入对应的反应信息界面,如下图

KEGG ORTHOLOGY(KO)数据库

KEGG ORTHOLOGY (KO)数据库是构建Pathway和Module的基础,相当于KEGG数据库构建的基石,因此理解KO数据库的构成对于使用及了解KEGG至关重要。

然而,这种通用方法不足以理解由物种内基因和基因组的变异所引起的更详细的特征,特别是对于理解与人类基因和基因组的疾病相关的变异而言。后来他们开发了 KEGG NETKERK,该数据库不仅涉及基因变异,而且包括病毒和其他因素的网络变异方面的疾病和药物知识。

KEGG的开发者根据不同生物之间基因和基因组的保守和变异,引入直系同源物(KO)的概念,使得KEGG通路图,BRITE层次结构和KEGG模块的参考数据集可以广泛应用于任何细胞生物。

概念

1.KO号:表示不分物种的通路,相当于所有物种的这一通路的并集,比如ko00020代表的 TCA 循环 (下图所示),下图的每个圆角矩形也代表着一个KO通路。

2.K号:表示基因,每个号代表的是所有物种的一个同源基因,比如上图中的K01596代表的是 PCK。

进入K01596的详细页面,我们会看到它代表的是一个基因列表,这些基因具有一个功能却来自于不同的物种。

3.C号:表示化合物

对于分析工具使用和kegg资源下载,会在后续文章中更新。

(0)

相关推荐

  • 经常提到的KEGG数据库是什么样子的

    KEGG(Kyoto encyclopedia of genes and genomes, )(https://www.kegg.jp/)是系统分析基因功能. 基因组信息的数据库,它整合了基因组学.生 ...

  • 技术贴 | 微生太宏基因组报告解读 | 第六篇:功能分析-基于KEGG数据库

    本文由阿童木根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读 KEGG 数据库由Kanehisa Laboratories于1995年推出,现在已经发展成为一个综合性数据库.KE ...

  • 不用编程,三分钟KEGG/GO富集分析火热出炉!

    据不完全统计,今年来基迪奥OmicShare云工具平台的KEGG和GO富集分析工具使用次数已经突破30,000+啦!KEGG和GO富集分析作为平台使用频率最高的工具之一,一直陪伴大家.听许多对生信还不 ...

  • 数据库|最全的KEGG使用教程在这里!

    KEGG(Kyoto Encyclopedia of Genes and Genomes,京都基因与基因组百科全书)是一个整合了基因组.化学和系统功能信息的综合性数据库,旨在揭示生命现象的遗传物质与化 ...

  • 一文读懂王清任的五逐瘀汤

    至道汇 今天 瘀血 王清任三步辨瘀血法及其临床应用 一.首辨瘀血典型症状的有无 无论瘀血为病,证候有多么复杂多变,其外在表现总会有一定规律可循.其中表现突出且有别于他证的特异性症状,便可视为瘀血的典型 ...

  • 一文读懂硬度试验

    硬度,硬度测量,硬度公式,硬度换算,材料硬度,钢材硬度,布氏硬度,硬度试验 来源:北京赛亿科技有限公司

  • 一文读懂:广东人从哪里来?

    岭南韵味  广府情怀 粤曲| 粤剧 | 名家 | 名段 很多外省的朋友们不是很了解广东人的组成及来源,也不知道为何叫做"广东".更会有一些朋友会奇怪: ◆为什么秦汉时期的" ...

  • 一文读懂:宗教、哲学、科学,的诞生史

    作者:黃爾文 公元2021年5月7日 2文讲解<西方哲学史>系列 (第3章. 宗教.哲学.科学 の 诞生) 释迦摩尼 如果按照一个"发展顺序"来讲的话呢: ❶是人类最初 ...

  • 一文读懂地产类信托

    2019年以来,政府对于信托资金流向房地产的管控有所加强,年中时有传言光大信托和国投泰康信托暂停所有房地产类项目,引起市场一片哗然,随后市场又有"2万亿地产类通道业务清零"的说法. ...

  • 一文读懂企业IPO需要聘请的各种中介机构(投行方法论系列)

    目前A股IPO的中介机构,券商.会计师.律师这三大机构,为一般的大众所熟悉.但实际上,A股IPO最多有可能涉及到26个中介机构,分别为:1.IPO顾问.2.券商.3.会计师.4.中国律师.5.海外律师 ...

  • 一文读懂!在家煎煮中药的正确“打开方式”

    本期专家:北京中医药大学东方医院药学部张晓 赵薇 刘天聪 日常生活中,很多人会选择用中药来调养身体,取药回家围在炉旁慢慢等待药香四溢.如何正确煎煮中药汤剂?专家告诉你! 1.煎前浸泡 煎前浸泡既利于有 ...

  • 一文读懂 丨 针灸绝技:过眼热

    导读:"过眼热"是传统针刺手法,是"烧山火"针刺手法的一种.它选取风池穴作为手法施术的部位,通过一定的手法,使针下热感传导至眼区,称为"过眼热&quo ...

  • 为什么会心跳慢?要不要治疗?一文读懂!

    正常人心跳次数是60-100次/分,小于60次/分就称为心动过缓,也叫心跳过慢. 大家最关心的一般是:什么原因导致我心跳慢?需要治疗吗? 心跳过慢的原因五花八门,下面就来聊一聊心跳过慢的常见原因和应对 ...