EWAS Data Hub:DNA甲基化芯片数据库
导语
表观基因组广泛关联研究(Epigenome-wide Association Study,EWAS),基于全基因组范围寻找组间的表观遗传学标记的差别或特征,能够帮助我们了解表观遗传改变与相关形状变化和调控之间的关系。在过去的十年中,由于许多EWAS项目的结果,已经积累了大量的表观遗传数据,尤其是来自DNA甲基化阵列的表观遗传数据。但是,由于不同试验的研究平台,研究批次,包括样本的年龄性别等信息千差万别,直接使用这些数据肯定会导致大量的假阳性。为了解决这些问题,实现更好的甲基化数据整合分析,中国科学院北京基因组研究所国家基因组科学数据中心,开发了人类表观组关联分析数据库EWAS Data Hub。
EWAS数据中心用于收集和标准化DNA甲基化阵列数据以及存档相关的元数据。当前版本的EWAS Data Hub集成了来自75344个样本的DNA甲基化阵列数据的全面收集,并采用有效的归一化方法来消除不同数据集之间的批量影响。EWAS Data Hub的数据主要来自GEO、TCGA、ArrayExpress和Encode数据库。因此,利用大量高质量的DNA甲基化数据和标准化的元数据,EWAS数据中心可提供不同背景下的参考DNA甲基化图谱,涉及81种组织/细胞类型(包含25个脑部和25种血细胞类型),6个祖先类别和67种疾病(包括39种癌症)。同时,EWAS Data Hub 还提供了高效的查询方式,可协助检索和发现基于甲基化的生物标记物,用于表型表征,临床治疗和保健。
EWAS Data Hub
https://bigd.big.ac.cn/ewas/datahub
以下从4个方面进行介绍EWAS Data Hub的功能。
一、home-Search
这个数据库在首页提供了三种检索方式:探针(probes)、基因(genes)和样本(Samples)。
以基因DNMT1为例,呈现结果如下:
Basic--基因基本信息和基因的探针数
Tissue--不同组织或细胞的甲基化情况(可选择探针位置和种类)
Sex--不同性别的甲基化差异
Age--探针在各组织中与年龄的相关性
Ancestry Category--探针在6大种族中的甲基化水平
BMI-- DNA甲基化随BMI(乳房,基因启动子)的变化
Cancer--各肿瘤中的患者和健康样本的甲基化水平差异、生存分析曲线和甲基化和表达的关系散点图
通过选择自己研究的肿瘤,就可以看到对照组和实验组之间的甲基化水平的差别,同时还有相对应的生存曲线。
Public EWAS--基因的甲基化研究文献和结论
以上这些图片都可以高清、无损下载。
二、BROWSE
三、EWAS Tooklit
EWAS Toolkit是一款全面且易于使用的DNA甲基化探针集分析工具,可提供不同类型的富集分析。对于450K / 850K平台生成的任何给定探针列表,EWAS工具包都能够:确定丰富和枯竭的基因组位置,识别丰富的Go&KEGG术语,识别EWAS Atlas中的相关特征,识别富集和耗尽的组蛋白修饰和染色质状态,提供组织特定信息,识别丰富的已知图案。
EWAS Tooklit 有两个功能模块,一个是富集和注释,需提交相应文件,富集分析非常耗时,大约需要15到20分钟。网站提供批量下载的结果,分别用于主题分析和其他分析。
另一个是网络可视化,如下:
网络可视化上包括:中心,中心可以是性状或基因;层数:目前仅支持一层或两层;每个节点的最大链接数:允许连接一个节点的链接数;相关系数公式:相关系数的计算方法;系数截止:与系数大于截止的关联将显示。
四、Downloads
Associations、Studies、Cohorts、Probe annotations、Trait to trait relationships都是可以下载的。
这个网站能够有效减弱或去除数据间的批次效应,并且能够帮助大家进行有效数据分析,EWAS Data Hub DNA甲基化分析只是国家基因组学数据中心提供的一个数据库,里面还有更多的功能,感兴趣的话可以自行探索,好啦,关于EWAS Data Hub就介绍这么多了。
References:
END