人类疾病数据库MalaCards
MalaCards数据库是人类疾病及其注释的综合汇编。当前版本包括来自74个来源的21369种疾病的信息。
对于每一种疾病,数据库都会显示一张带有关于该疾病的各种注释信息的“疾病卡”,集成了该疾病的各种已知信息,这些信息来自GeneCards数据库、搜索和GeneAnalytics 基因集分析工具。 该数据库使用一个自动计算信息检索引擎,通过利用远程数据、以及GeneCards平台收集的信息,整理和填充疾病卡。 数据库整合了专门疾病和一般疾病列表,包括罕见疾病、遗传病、复杂疾病等。
MalaCards中每种疾病的相关基因的平均数多于OMIM少于DisGeNET。数据库网址是:
malacards.org/
一、数据来源
MalaCards的74个数据来源如下:
二、疾病信息的搜索方法:
疾病信息的搜索方法有两种,一是直接搜索疾病卡,二是搜索疾病卡的某个部分,见下图:
上图显示,疾病卡包含的内容有:疾病别名和分类、疾病状态差异表达的基因、疾病基因富集的GO、相关疾病、症状与表型、疾病的解剖学背景、疾病相关基因、疾病相关通路、信息来源、疾病相关的基因变异、治疗疾病的药物、遗传试验、论文、疾病概要。
下面以alzheimer disease为例,介绍疾病卡的部分内容:
(1)疾病别名
这里列出了该疾病在不同的资源里的别名,名称后面的数字代表列在疾病卡最后的资源的编号。
(2) 相关疾病
这部分的上面列出了阿尔兹海默疾病家族包含的疾病,下面的表格列出了与阿尔兹海默疾病关联性最强的10个疾病、关联分、及疾病相关基因。可以点击表头的链接切换到显示前50个疾病、及显示所有相关疾病。
接下来,列出了与阿尔兹海默病具有共病性的疾病,并画出了与该病相关性最强的20个疾病之间的相关网络。
(3) 治疗用药
这里列出了治疗此疾病所用药物的信息
(4) 解剖学背景
列出了疾病影响的组织、器官和细胞
(5)疾病相关基因
列出了与疾病相关的基因、相关分、证据来源、论文。
MalaCards给每个疾病-基因关联关系分配一个相关分,它是这对关系在八个数据库(OMIM、ClinVar、Orphanet、SwissProt的Humsavar、GeneTests、DISEASES、Novoseek和GeneCards)得分的加权和。对于每一种疾病,MalaCards定义了一组“精英”(Elite)基因,这些基因与这种疾病的关联关系来自人工注释和可靠资源。上表中带星号的是精英基因。
参考文献:
Rappaport N, Twik M, Plaschkes I, Nudel R, Iny Stein T, Levitt J, Gershoni M, Morrey CP, Safran M, Lancet D. MalaCards: an amalgamated human disease compendium with diverse clinical and genetic annotation and structured search. Nucleic Acids Res. 2017 Jan 4;45(D1):D877-D887. doi: 10.1093/nar/gkw1012. Epub 2016 Nov 28.