SurvivalMeth:甲基化预后分析专用数据库
今天介绍一个特别的甲基化数据库:SurvivalMeth。SurvivalMeth是一个研究DNA甲基化对预后影响的新型数据库,由哈尔滨医科大学李霞教授团队开发,2020年8月份上线。数据库包含来自TCGA,CCLE和GEO的常用数据,记录了多种DMFEs,包括309,465个CpG岛相关元件,104,748个转录相关元件,77,634个重复元件,以及细胞类型特异性的1,689,653个超级增强子(SE)和1,304,902个CTCF结合区进行分析。
甲基化样品、癌症数据分布情况
SurvivalMeth收集了36种癌症的DNA甲基化谱,并允许用户在不同的数据集中查询他们感兴趣的基因,以便预测预后。此外,SurvivalMeth不仅整合了不同的组合,包括单个DMFE、多个DMFE、SEs和临床数据,对预上传数据进行生存分析,还允许上传来自各种疾病的DMFE的定制DNA甲基化图谱进行分析。SurvivalMeth为预后DMFEs提供了全面的资源和自动化分析,包括DMFE甲基化水平、相关分析、临床分析、差异分析、DMFE注释、生存相关结果和生存分析可视化。
SurvivalMeth
http://bio-bigdata.hrbmu.edu.cn/survivalmeth/
下面从Pre-Upload、User-Defined两个方面进行介绍。
一、Pre-Upload
Pre-Upload预上传分为Single Case,Multiple Case, Enhancer Case三个子模块,由于运算后返回的内容大同小异,这里主要介绍的是Single 的使用。
Single Case
在此界面中,SurvivalMeth提供了执行多个DMFE生存分析的功能,该功能允许用户分析感兴趣的CpG位点,基因,基因组间隔或基因,CpG位点和增强子的混合物。数据库提供了七个选项:疾病类型、实验平台、输入基因名字、选择转录相关元件、CpG相关元件、重复元素、CTCF绑定区域、临床信息;此外,用户还可以选择是否进行差异分析,并设置差异分析参数和阈值。帮助我们一步一步筛选感兴趣的站点进行搜索。
PS:实验平台中27K的选项没有正常样本。
本次选择内容如下图所示,填写好之后点击Analyse运行:
返回结果如下:
第一部分:Methylation Status
这里主要是基因对应的甲基化状态,如下表,展示了探针对应的肿瘤样本平均值,正常样本的平均值,以及增量,倍数变化和P值。
下面会提供两个表格和两张图,分别是显著差异的表格,不显著差异的表格,甲基化水平箱式图以及探针之间相似性气泡图。此外用户还可以比较临床信息中的甲基化水平,也就是不同临床指标下的甲基化水平差异。
①不同探针对应的甲基化水平:
②不同探针之间的相关性:
③返回结果也给出了临床信息中的甲基化水平:
点击gender,给出对应的甲基化箱图。
④差异分析的无关紧要的结果:
第二部分,Cox Regression Analysiscox
这一部分结果展示的是回归分析的结果,一共两个表格,分别展示了风险模型的各个结果值包括HR、P值,以及回归模型的summary结果。
第三部分:K-M生存分析结果
①Kaplan–Meier图的生存曲线:
②Kaplan–Meier图的样本信息:
③按预后指数排序的预后指数分布:
④ 高风险组和低风险组之间CpG的p值(T检验):
⑤高危和低危人群中CpGs的甲基化水平:
⑥CpG甲基化水平的热图:
第四部分,cg位点注释信息
在这个部分,可以了解cg位点的相关信息:包括染色体,位点信息,基因symbol等等。
多基因模块与单基因模块区别在于多基因模块可以导入多个基因进行分析,增强子模块的输入与基因模块有区别,可以输入基因symbol。
二、User-Defined
User-Defined允许用户提交自己的混合矩阵,该矩阵由DNA甲基化矩阵和生存时间矩阵组成,以进行生存分析。
用户应选择一种方法来开始分析。方法“ Cox回归+ Kaplan-Meier图”执行cox回归和Kaplan-Meier图。方法“ Kaplan–Meier图”仅执行Kaplan–Meier图。然后,用户应上传DNA甲基化混合物矩阵(单个制表符分隔的文本文件),可以通过将矩阵复制到框中或从本地主机上载矩阵来进行上传。DNA甲基化混合物基质的形式如下。
“ Cox回归+ Kaplan–Meier图”的上传数据格式。
混合物矩阵应为单个制表符分隔的文本文件,其中“时间”为生存时间(天),“状态”为生存状态(1表示死亡,0表示存活),“元素”是DMFE的DNA甲基化水平“样本”是患者样本。样品名称和元素名称应由字母和数字组成。
“ Kaplan–Meier图”的上传数据格式
混合矩阵应该是一个制表符分隔的单个文本文件,其中“时间”是生存时间(天),“状态”是生存状态(1表示死亡,0表示存活),“组”是患者样本组, “样品”是患者样品。样品名称应由字母和数字组成。“组”可以包括不少于两个组。
下面以示例文件进行说明,点击Surv Matrix(Cox+KM)后点击Analyse,开始运行:
结果如下:此界面中,有一个表(“来自混合物矩阵的元素表”),该表是来自混合物矩阵的每个上载元素的HM450K注释信息。该表包括标签,注释,染色体,位置,基因符号,基因组区域,岛,重复元件和重复元件家族。如果注释文件中不存在相应的信息,则这些术语将标记为“-”。
这里我们选择前三个探针做进一步的生存分析。点击Analyse,返回结果主要分为甲基化状态、cox回归分析,Kaplan–Meier图:
数据库的使用就介绍到这里啦,SurvivalMeth可以全面,简单定制与DNA甲基化相关的功能元件之间的分析以及预后,使用起来也简单,非常适用于研究与预后相关的DNA甲基化。感兴趣的朋友可以去网站自己动手试试鸭。
Research:
Zhang C, Zhao N, Zhang X, et al. SurvivalMeth: a web server to investigate the effect of DNA methylation-related functional elements on prognosis [published online ahead of print, 2020 Aug 11]. Brief Bioinform. 2020;bbaa162. doi:10.1093/bib/bbaa162
END