MethBank:单细胞甲基化数据库

导语

生命与健康大数据中心(The BIG Data Center)由中国科学院北京基因组研究所于2016年成立。中国科学院北京基因组团队通过研究,建立海量生物组学大数据储存、整合与挖掘分析研究体系,发展组学大数据系统构建、挖掘与分析的新技术、新方法,建设组学大数据汇交、应用与共享平台。所建立的数据库目前具备5000个以上CPU计算核心及总容量超过8PB数据存储资源,已经开发形成了一系列的多组学数据库系统,初步形成了我国生命与健康数据交汇与共享的平台,具备可服务于全球的基因组数据共享网络。之前带大家认识了它们的其中一个数据库EWAS Data Hub:DNA甲基化芯片数据库,今天我们来看看他们的另一个数据库吧:MethBank 

MethBank是一个全面的甲基化数据库,它集成了各种物种的共有参考甲基化组(CRM),全基因组单碱基分辨率甲基化组(SRM),DNA和RNA甲基化工具(MeTools)以及表观基因组范围关联研究(EWAS),并提供了甲基化数据可视化的交互式浏览器。MethBank 3.0以高质量甲基化酶大规模整合为特色,涉及34个来自大量人类样品的共识参考甲基化组织,336个来自不同发育阶段/5个植物组织的单碱基分辨率甲基化组织,18个单碱基在人类和小鼠的多个阶段从配子和早期胚胎中分辨甲基化组织。

MethBank

http://bigd.big.ac.cn/methbank

以下,从5个方面介绍MethBank :

01 search

在首页,我们可以进行搜索甲基化单细胞的相关研究,输入基因、细胞名称、疾病都是可以的:

搜索框下方还有搜索例子:GSE56879、4-cell embryo、MII oocyte、 Hematopoetic Progenitor Cell、Carcinoma。我们点击GSE56879,看看会返回什么:

结果分为两部分,上面的Samples是样本筛选,我们那可以选择Organism(目前只有人和小鼠的),Cell Type也很多,类型在首页上有可视化的图标展示。同时细胞的发育阶段、性别也可以选择。

上图是下部分返回的结果:一次展示不同样品对应的系列、生物、细胞类型、发育阶段、Strain。查看样品加入的序号链接,会看到GEO数据库对其的介绍,(样品状态、类型、生物、来源、生长协议、提取分子等),点击#More Details,展示信息如下:

02 Browse Project

这部分会展示13个甲基化单细胞的相关研究,大部分都是2016-2019年发布的。

表里会给出对应的PMID、文章标题、发表年份、杂志刊名、数据集、样本数,不同的单元组还会用不同的颜色标注,还提供了t-SNE_Analysis。我们来看看Integrative single-cell analysis of transcriptome, DNA methylome and chromatin accessibility in mouse oocytes这篇文章对应的t-SNE_Analysis:

part1,对 Datasets: GSE114822的基本介绍:

Part 2 ,t-SNE可视化。

其中的着色,我们可以选择组织来源、发展阶段、基因型、治疗方式、年龄、性别、疾病等。点击颜色点,会展示相关的细胞信息。

03 Browse Sample

在这里我们也可以根据样本的组织类型、细胞类型、发育阶段、性别进行筛选。

04 Toolkit

Toolkit部分目前只有Lollipop Plotter,用来进行单细胞甲基化的Lollipop绘图。使用起来也非常简单,三步即可。

①输入文件:

甲基化文件必须是一个制表符分隔的文件,具有以下结构:

1.甲基化水平必须以百分比表示(从0到1)。

2.第一行必须指出CpG的位置(位置可以不排序)。

3.每行包含一个样品的甲基化水平。

4.第一列表示样品标识符。每个中间列包含CpG的甲基化水平。

5.请注意,要绘制的CpG和样品的最大数量均为100。

②设置甲基化阈值:

可以自定义阈值或使用我们的默认参数。默认参数表示大于90%DNA甲基化的

CpG位点被认为是甲基化的,而小于10%的CpGs位点被认为是未甲基化的有【甲基化(<):0.1 】和【取消甲基化(>):0.9】两种选择。

③绘图设置:

这部分可以自定义绘图参数或使用网站的默认参数。点类型参数根据站点的位置信息确定点是连续排列还是不连续排列,点大小决定绘制点的大小。

05 Download

高级用户通过Sample Accession下载Bed文件,其他细胞类型也可以批量下载。

MethBank能够系统地鉴定与年龄密切相关的甲基化位点、在不同年龄段具有恒定甲基化水平的位点、差异甲基化启动子、年龄特异性差异甲基化胞嘧啶/区域和甲基化CpG岛。而且,MethBank提供了在线估计人甲基化年龄的工具,并分别鉴定差异甲基化的启动子,功能十分强大。综合起来,MethBank对于解读表观遗传学研究的DNA甲基化调控机制有很大的帮助,大家不要错过ya 。

References:
Li R, Liang F, Li M, et al. MethBank 3.0: a database of DNA methylomes across a variety of species. Nucleic Acids Res. 2018;46(D1):D288-D295. doi:10.1093/nar/gkx1139

END

撰文丨赛赛
排版丨西西
值班 | 小太阳
主编丨司马牧野
(0)

相关推荐

  • 易基因 | 常用的6种DNA甲基化测序方法,你知道几个?

    什么是DNA甲基化? 简单来说,DNA甲基化就是在DNA甲基化转移酶(DNMT)的作用下将甲基选择性地添加到胞嘧啶上形成5′-甲基胞嘧啶的过程.DNA甲基化是最早发现的基因表观修饰方式之一,在维持正常 ...

  • 什么是DNA甲基化?

    近几年DNA甲基化经常被人提及,但很多人对它并不是很了解,那么到底什么是DNA甲基化,它又有什么作用呢,请看敬善基因为您介绍! DNA 化学修饰为 DNA 序列编码基因的表达增加了一层调控机制.这些化 ...

  • Nature Biotechnology | Broad研究所开发新型DNA甲基化靶向测序技术,助力...

    背景介绍 DNA甲基化是染色质表观遗传修饰的一种重要形式.DNA甲基化能够影响多种基因表达过程,并且可受到复杂的调控来指导复杂的生物学过程,如胚胎发生.衰老和肿瘤发生等.在人类基因组中,90%以上的C ...

  • 表观遗传学(Epigenetics)

    表观遗传学的概念基于遗传学而来,不是单纯的体外在环境导致的甲基化和乙酰基化改变,也不是简单转录因子和miRNA等等基因调控,它的指的是由非DNA变异而改变表型的'可遗传的'现象.现在众多所谓的表观遗传 ...

  • 破解肿瘤细胞的病人特异性之谜(第一个纯粹的单细胞公共数据库挖掘高分文章)

    看过单细胞水平的癌症研究的朋友都应该是对下面这样的图不陌生: 可以很清晰的看到,多个病人的单细胞可以分成恶性的上皮细胞和非恶性的肿瘤微环境,微环境的那些细胞可以聚集成为很多类,而且每个类别的细胞都是来 ...

  • DiseaseMeth:人类疾病甲基化数据库

    导语 DiseaseMeth 是一个专注于人类疾病的异常甲基化数据库,不仅包括多种癌症,同时还包括神经发育和退行性疾病.自身免疫疾病等数据集.其中DNA甲基化芯片包含了这两种常见的illuminaDN ...

  • Pubmeth:癌症相关甲基化数据库

    研究过程中,也许有一个问题曾经困扰过你:"该基因是否已经在文献中描述为甲基化且属于哪种癌症类型".虽然不难回答,但解决此类问题比较耗时,一般通过文本挖掘方法(GoldMine)可以 ...

  • RMVar:m6A修饰相关甲基化数据库

    m6A是mRNA上最丰富的甲基化修饰,是RNA中腺嘌呤(A)上第6位N原子上的甲基,主要存在于mRNA的CDS区和3'UTR区,影响mRNA的稳定性,翻译效率,可变剪接和定位等.此外,长非编码RNA以 ...

  • Tabula Muris:小鼠单细胞开源数据库

    # 背景介绍 细胞是生物体的基本结构和功能单位,多细胞的生物进化出了具有不同功能的细胞类型,他们之间相互协作完成更复杂的生物功能.之前对于细胞类型的判断多是基于细胞的形态和表征,近来随着分子生物方法的 ...

  • SC2disease:检验疾病与正常细胞基因差异单细胞转录组数据库

    # 背景介绍 单细胞RNA测序(scRNA-seq)技术是以单个细胞分辨率研究复杂生物的转录组,这种形式能够为科学家研究细胞在表达模式上的异质性,特别是疾病细胞的异质性.scRNA-seq的快速发展为 ...

  • 单细胞甲基化测序(scBS-seq)比对率奇低?你的文库方向性参数可能没选对!

    问题的提出 近年来单细胞测序真是火得一塌糊涂,易基因作为行业较早开展单细胞甲基化测序科研服务的企业,我们也接到了不少老师在数据分析方面的求助.在BS数据分析中,最常用的比对工具就是BSMAP和bism ...

  • 肿瘤预后相关DNA甲基化数据库

    肿瘤预后相关DNA甲基化数据库

  • 单细胞测序数据库

    转自医科研 我就是用这个神器来挖单细胞测序数据的!作者:白介素2关于单细胞测序这个热点我们已经有很多文章介绍过了,这里就不再赘述了.目前,单细胞测序相对来讲还是属于比较昂贵的技术,没钱做不起怎么办?此 ...