DiseaseMeth:人类疾病甲基化数据库
导语
DiseaseMeth 是一个专注于人类疾病的异常甲基化数据库,不仅包括多种癌症,同时还包括神经发育和退行性疾病、自身免疫疾病等数据集。其中DNA甲基化芯片包含了这两种常见的illuminaDNA甲基化芯片——27K和450K,以及一些定制的芯片(如illumina GoldenGate Methylation Cancer Panel I等)。高通量测序主要包含WGBS/RRBS两种分析类型的数据。DiseaseMeth通过整合包括TCGA、IHEC等公共的疾病甲基化大数据,重新识别了疾病中的异常甲基化基因,并通过人工搜索了近些年文献报道的新异常甲基化基因,32701甲基化谱样本数,88种疾病,679602对甲基化相关的疾病基因关系。
DiseaseMeth架构设计
该数据库是由哈医大张岩教授所领导的计算表观遗传学课题组开发并维护,目前已为来自世界91个国家七千余位科研工作者提供疾病甲基化信息服务。DiseaseMeth还设计开发了甲基化差异分析平台,方便基于疾病和正常样品的横向比较。这些数据可以被用来深入识别差异的甲基化基因,并调查研究基因与疾病之间的关系。最新的版本升级了疾病甲基化谱可视化浏览器DisMethBrowser,增加了“基因-疾病”、“疾病-疾病”、“基因-基因”相关性在线分析平台,数据库还提供了三个新的在线工具用于聚类分析,功能注释或者生存分析。
主页,依次有检索、分析、浏览器、数据下载四大功能,接下来的介绍围绕它们一一展开:
01Search
检索方式,一共三种:基因检索、疾病检索、高级检索。
Part 1 GeneSearch
GeneSearch根据基因名称或基因组位置搜索基因组区域的甲基化水平,
这里我们以输入DEFB119基因为例:
↓↓↓
返回结果根据癌症类型、基因名字、疾病甲基化水平、正常甲基化水平、P值、甲基化类型表格展示,因此我们可以看到DEFB119基因在每一种癌中的病例组和对照组的甲基化平均水平的差异。点击蓝色基因名字链接会跳转到GeneCards。
往下拉,点击show可看到甲基化分布热图。
结果热图包含7个转录本的甲基化数据,行表示转录本,列表示样本(绿色表示正常轮廓,黑色表示疾病轮廓),可以下载的~
Part 2 DiseaseSearch
DiseaseSearch根据Disease和Gene Symbol搜索基因组区域的甲基化水平。
疾病选项里,可以勾选多个选项。这里我们Rectum adenocarcinoma为例,输入基因TP53得到搜索结果如下:
在结果中,可以查看同一个基因在每一个癌种中的病例组和对照组的甲基化平均水平的差异(案例中这个基因目前只存在于一种癌症,在某疾病里甲基化水平没有差异),以及该基因或基因组区域相关的每种疾病的热图热图。点开“view profiles”,查看基因序列,以及CpG、DNase、TFBS在基因序列上的分布,可以做样本的增减和CpG、DNase、TFBS的隐藏。
Part 3 AdvanceSearch
AdvanceSearch可以使用基因名称/转录本ID或基因组位置来搜索基因组区域的甲基化水平,
如图所示,AdvanceSearch进入如下界面,在疾病选项里可以选择我们感兴趣的疾病,输入基因,选好技术实验平台选项用于选择甲基化组的数据类型,结果如下:
这里查询的基因NKAPL在消化道癌症内的甲基化水平没有差异,如果你是好奇宝宝,还可以下载搜索结果概述进行浏览。
02 Analysis
本功能模块的功能更加高级一点,有差异分析、基因相关疾病、甲基化谱、功能注释和生存分析等。在我们可以输入多个基因或疾病时,也可进行包含基因-基因关系分析和疾病-疾病关系分析。
如上图所示,Disease选项用于选择感兴趣的疾病,可以选择多个;基因名称/转录本ID /基因组间隔用于设置感兴趣的基因组区域,可以输入多个项目。在这里,DiseaseMeth数据库检验方法有4种,包括t检验,minfi,samr和edgeR。输入好相关信息点击analysis即可。
返回结果如下:
Differential Analysis between Case and Control
基因的甲基化和癌症的关联
Association Between Disease and Methylation of Gene
疾病与基因甲基化的关联
Methylation Profile
甲基化分布
(PS:这里没显示热图,是因为因为笔录或样本的数量少于2。)
如果我们需要继续查询别的基因或者在此基础上新增一些基因或者疾病时,可点击界面上方Show Query Box。
Survival Analysis for Cancer
癌症生存分析
点击生存分析选项,提交后可得到癌症中基因表达差异的生存曲线。
Functional Annotation
功能注释
点击后会跳转界面DAVID。
03 DisMethBrower
在GeneSearch检索结果中,点开view profiles,左侧DMxxx开头的是样本,水平的(淡)红线表示甲基化水平为1。
下拉到底后,可以在这里添加样本:
04 Download
最后,就是DiseaseMeth数据库的下载功能了,前面有提到,数据来自TCGA、GEO和其他数据库。
以上对DiseaseMeth数据库功能的简单介绍,该数据库整体操作起来并不难,且提供的功能也相当丰富,如果想要更多疾病甲基化F分析花样,可以自行前往试验,下期再会~
Research:
Xiong, Y., Wei, Y., Gu, Y., Zhang, S., Lyu, J., Zhang, B., Chen, C., Zhu, J., Wang, Y., Liu, H. Zhang Y. (2016) DiseaseMeth version 2.0: a major expansion and update of the human disease methylation database. Nucleic Acids Research.
END