【陈巍学基因

2024-04-24 13:20:32

本次主要介绍一下DNA的甲基化和羟甲基化的高通量测序。DNA的甲基化是在DNA的序列不变的条件下，在其中某些碱基上加上甲基的这样一个过程。

DNA甲基化的结果，一般是使甲基化位点的下游的基因表达量变少。

DNA甲基化

化学反应

这个（甲基化）分析方法当中的核心化学反应，是用亚硫酸氢盐来处理DNA。DNA当中，没有甲基化或羟甲基化的C碱基，就会被转化成U碱基。我们来看这个转化的过程，在弱酸性条件下，亚硫酸氢根会结合到没有甲基化的C碱基的6位。而甲基化了的C碱基不会和亚硫酸氢根发生这个反应的。

然后，用碱来处理。结合了亚硫酸氢根的非甲基化的C，就被脱氨基，并且脱亚硫酸根。然后，就被转化成U碱基。

那么，甲基化或者羟甲基化的C碱基，因为之前没有和亚硫酸氢根起反应，所以现在用碱来处理，它也不会发生脱氨基反应。所以，它还保持了是“C”。用亚硫酸氢盐来处理DNA，可以让99%左右的非甲基化的C碱基变成U。也就是说这种方法的的转化效率非常高，转化效率达到了99%。

它的优点，就可以让我们接下来通过高通量测序的方法，可以精确地看到单个碱基的甲基化的水平。经过亚硫酸氢盐转化过的DNA，再经过PCR，PCR新合成出来的链，U碱基的位置，就会被替换成了“T”。那么在接下来的测序过程中，测到的也是T碱基。而甲基化的C，因为没有被亚硫酸氢盐所转化，所以，在接下来的测序过程中，被测到的，还是“C”碱基。这样，通过测序，看一个位置是“C”，还是“T”。如果它保持是“C”，就说明这个位置是被甲基化、或者羟甲基化了。如果测到的是“T”，就说明这个位置是没有被甲基化、或者羟甲基化。

建库方法

甲基化的建库过程。

第一种，用Illumina公司的Truseq DNA建库方法，来做甲基化测序。

因为Illumina Truseq DNA建库试剂盒当中，它所提供的接头，那么这个接头上的C碱基都是已经经过甲基化修饰了。所以，用这些接头做出来的文库，在用亚硫酸氢盐做转化的过程当中，它的（接头上的）C还是保持是C ，不会被转成U。带了这些接头的文库分子，就可以和测序芯片上的草皮DNA发生互补杂交。并且进一步发生桥式PCR反应。生成测序用的DNA的簇（Cluster）。但是，这个方法有一个缺点，就是在用亚硫酸氢盐处理DNA文库的时侯，90%以上的DNA链会断掉。这样，已经建好的文库，其中90%分子会被破坏掉。也就是说文库的丰富度就会损失90%以上。那么，相应的它有它的好处，它的好处就是，在这个建库过程当中用的PCR循环数较少。所以它PCR扩增效率不同，所引起的文库不均一程度也就较低。也就是我们通常所说的PCR bias较少。

第二种建库方法。为了解决文库丰富度受到损失的这个问题，EpiCentre公司开发了EpiGnome方法，方法的操作过程如图。

第1步，亚硫酸氢盐先处理DNA，把未甲基化的C都转变成U。

第2步，把带标签1的随机引物加入，进行第一次的复制。得到第1条的复制链。

第3步，是消化掉过量的引物。

第4步，是加入带末端终止碱基、并带标签2的随机引物。这个引物的作用是让第1复制链延伸，并且加上标签2。

第5步是加入建库的PCR引物，进行PCR。通过PCR，把Index序列和成簇引物序列加入到链的两侧。得到真正的文库。

这个方法的优点是，把亚硫酸氢盐处理的过程，放在了建库之前。这样建成的库的丰富程度会比较高。但是这个方法也有缺点，缺点就是要做较多的PCR循环，那么有了比较多的PCR循环之后，PCR产物的扩增均一性是不太好的。也就是说PCR bias会比较大。

上述两种方法，各有优缺点。

HiSeq2000/2500测甲基化文库的问题、和解决方案

在Illumina的HiSeq 2000或者2500平台上进行测序，如果文库是碱基平衡的文库，也就是说，每个特环当中，A/C/G/T四种碱基的比例，各占25%左右的话，测序仪对碱基的判读会比较好。但是如果缺少了一种或者几种碱基，测序仪对碱基的判读就会出问题。测序得到的数据质量就会下降。并且效的数据产量也会降低。因为甲基化文库中经过亚硫酸氢盐处理，绝大多数的C都变成了T。所以，这个文库中是严重地缺少C碱基的，也就是四种碱基的比例是严重不平衡的。这样在用HiSeq 2000或2500测序仪来测甲基化文库的过程当中，文库测序得到的数据质理就较差。并且经过PF过滤得到的有效的数据产量也会较低。

为了弥补甲基化文库的碱基不平衡性，一般情况下，在上机过程当中，是掺入大比例的基因组文库，或者PhiX文库，来补充比较多的C碱基，一般会掺30%的PhiX文库、或者基因组文库。

在掺入30%的PhiX文库的条件下，一条HiSeq 2000 V3 PE100的Lane，大概可以得到20G 左右的甲基化文库数据。也就是说，在HiSeq 2000或者2500平台上，甲基化文库的测序数据产量，一直都不是很高。质量也比较低。

羟甲基化测序

接下来，我们说一下区分“羟”甲基化和甲基化的测序方法。

在用单纯的亚硫酸氢盐法来测的过程当中，甲基化和差甲化的C碱基都不能被转化成U碱基，所以单纯的亚硫酸氢盐法是无法区分甲基化或羟甲基化的C碱基的。

为了区分甲基化和羟甲基化，科学家想出了两种办法。

第一种办法，是通过高钌酸钾（KRuO₄）来氧化羟甲基化的C。羟甲基化的C可以被转化成甲酰化的C碱基，而甲酰化的C碱基，是可以被亚硫酸氢盐转化成U的。

而甲基化的C，不会被转化成U。这样就把原来的羟甲基化的C和甲基化的C给区分开来了。

经研究表明，用高钌酸钾氧化的方法来氧化羟甲基化的C，其转化效率是94%左右。也就是说，每100个羟甲基化的C中，有94个会被高钌酸钾转化成甲酰化的C。并进一步被亚硫酸氢盐转化成U。同时，原来的甲基货摊C，只有2.1%会被转化成甲酰化的C。

第二钟区分羟甲基化C的方法，是用糖基把羟甲基化的C给保护起来。然后用TET蛋白（Ten-eleven translocation methylcytosine dioxygenase 1），把甲基化的C转化成羟基化的C。

进一步将羟甲基化的C转化成甲酰化的C和羧基化的C。甲酰化的C和羧基化的C都可以被亚硫酸氢盐转化成U。而之前被糖基化保护起来的羟甲基化的C，是不会被TET蛋白转化成甲酰化的C或者羧基化的C的。在亚硫酸氢盐的处理过程中，它还保持是C。并且在之后的PCR扩增产物中，也表现为C。这样，就可以把羟甲基化的C，和甲基化的C，给区分开来。

用这个方法，没有甲基化的C，99.6%都被转化成了U。甲基化的C，97.7%都被转化成了U。而羟甲基化的C，只有8%被化成了U。也就是说92%的羟甲基化的C得到了糖基的保护，还保持了C。上述，就是目前2个区分羟甲基化的C和甲基化C的方法。

设置内参

在甲基化文库建程当中，亚硫酸氢盐对未甲基化的C的转化效率并不是100%，一般是在99%左右。为了对实验的转化效率进行质量控制。一般会在转化实验当中加入内参对照品。一般情况下，是用甲基化酶缺陷型的大肠杆菌，所生产出来的完全没有被甲基化的λ（噬菌体）DNA，或者pUC19（质粒）DNA做内参。来看一次实验当中C的转化效率。一般情况下，实验当中是加入1%的完全没有甲基化的λ DNA做内参。

同样道理，也可以通过用甲基化酶处理过的，CpG岛完全被甲基化的DNA，来跟踪甲基化DNA对亚硫酸氢盐转化的抵抗效果。

数据分析

最后，我们来谈一下，甲基化测序后的数据处理。

因为亚硫酸氢盐处理过后，绝大部分的C都被转化成了T。这样，测出来的序列在和基因组进行对比的时侯，直接对比是对比不上的。为了要进行比对，就要把基因组的碱基做两种转变。

第一种转变是把基因组上所有的C都改到T，再来和测序测到的序列来对比。这样，就可以把原来的链给对比上。

第二种转变，是把基因组上所有的G都变成A，这样才能和经过PCR得到的原样本链睥互补链对比得上。这样做的原因，是原样本链的互被链，它上面绝大部分的G，都被变成了A。所以，只有把（参考）基因组上的G，也都改成A，这样才能对比得上。比对上之后，再来看哪些碱基是没有被转化的。这样，就可以确认这些碱基的甲基化修饰情况了。

基因甲基化研究实验技术服务

DNA甲基化主要形成5-甲基胞嘧啶(5-mC)和少量的N6-甲基腺嘌呤(N6-mA)及7-甲基鸟嘌呤(7-mG).DNA的甲基化可引起基因的失活,可引起染色质结构.DNA构象.DNA稳定性及DNA与蛋 ...
甲基化检测技术服务

MSP法:用亚硫酸氢盐处理基因组DNA,所有未发生甲基化的胞嘧啶被转化为尿嘧啶,而甲基化的胞嘧啶不变:随后设计针对甲基化和非甲基化序列的引物进行PCR.通过电泳检测MSP扩增产物,如果用针对处理后甲基 ...
单细胞甲基化测序（scBS-seq）比对率奇低？你的文库方向性参数可能没选对！

问题的提出近年来单细胞测序真是火得一塌糊涂,易基因作为行业较早开展单细胞甲基化测序科研服务的企业,我们也接到了不少老师在数据分析方面的求助.在BS数据分析中,最常用的比对工具就是BSMAP和bism ...
基因甲基化检测方法有哪些

探究了宫颈细胞变化与基因甲基化的关系过后,我们要做的就是如何检测出基因甲基化的存在现象.随着科学技术的发展,检验技术也在部断提升.大致可以分为两类:特异位点的甲基化检测和全基因组的甲基化分析,后者也称 ...
甲基化测量方法

基甲基化检测主要几种: 甲基化特bai异性PCR(Methylation-specific PCRMSP) 用亚硫酸氢盐处理基组DNA所未发甲基化胞嘧啶转化尿嘧啶甲基化胞嘧啶变:随设计针甲基化非甲基化 ...
甲基化检测丨探索文库构建中更温和的DNA处理方式

. 数字生命健康产业创新服务基因慧 [导语]目前较常使用的DNA甲基化检测方法大都需要BS(重亚硫酸氢盐)处理,该技术容易导致绝大多数DNA分子发生断链.本文主要对甲基化文库构建过程中BS处理方案和 ...
老陈要学车

老陈要学开车,这事首先在家里炸开了锅. 这么大把岁数了,学什么开车.老伴第一个反对.老陈多大了?77岁.老陈这辈子,除了上班,没什么兴趣爱好.退休之后,忽然没事情做了,老陈跟老伙计们一起钓钓鱼,打打牌 ...
2020年9月15日，这几天上海陈兆学教授在许多群里转发了中国中医药报登的朱光的文章，该文专门討论《...

上世纪八九十年代钱老劝我用当代科学语境來解读<黃帝內经>,那时,钱老和我专门谈过厥字的含义.他说在<内经>里到处有厥字,还有专门论篇,他说从面上看厥字包含<到尽头了> ...
古文观止：《送天台陈庭学序》宋濂

送天台陈庭学序明代:宋濂西南山水,惟川蜀最奇.然去中州万里,陆有剑阁栈道之险,水有瞿塘.滟滪之虞.跨马行,则篁竹间山高者,累旬日不见其巅际.临上而俯视,绝壑万仞,杳莫测其所穷,肝胆为之悼栗.水行, ...
陈根：基因疗法助力失明患者，得以计算斑马线数量

文/陈根当前,基因疗法作为一种可以实现治疗性蛋白的长期表达和组织特异性表达的治疗方法,由于可以实现治疗传统药物不能治疗的疾病,或大幅改善治疗疾病的方式,受到了人们的广泛关注. 无论是基因编辑还是基因 ...
陈根：基因屏障，可改变繁衍基因？

文/陈根 CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)技术发现于20世纪90年代初,其在发现的7年后首次用于生物化 ...
【三江文学】瞬间 || 陈巍

[三江文学现代诗刊] 总第1686期社长:李不白高级顾问:衣非特邀顾问:周渔总编:黄葵副总编:李聚宽主编:墨兰雪本期编辑 :幸福密码瞬间在201 ...
《秋雨》作者：陈巍朗诵：澜漪

三江文学散文诗刊第827期陪伴您每一天秋雨作者|陈巍朗诵|澜漪编排|紫衣云梦一个中午都是雷声震耳,不停地轰鸣,乌云遮盖的天空低垂而阴郁,灰蒙蒙的色调.它们为迎接大雨的到来联手酝酿,再 ...
【教师节专刊】《致教师节》文/陈巍诵/感谢生活

三江文学散文诗刊第812期陪伴您每一天点下方绿标收听主播诵读 <致教师节> 文/陈巍诵/感谢生活编/墨兰雪写过山水,写过百花没写过人类灵魂的工程师值此菊桂飘香的时节送 ...
【三江文学】《最美的风景》作者：陈巍朗诵：媛媛

三江文学散文诗刊第537期陪伴您每一天最美的风景作者| 陈巍朗诵|媛媛辑|映日荷花每当闲暇时间,常透过店里的后窗玻璃欣赏邻居家绿油油的菜园子,同时几乎每天都能看到已年过花甲,收拾 ...