DAY7 一二三代测序,重一二代测序原理,三代略看,必备words
一代测序:Sanger测序原理
简单概述 双脱氧终止反应法,聚合酶延伸链 (由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应)
设置四个反应体系1-4,分别加入引物、DNA聚合酶、四种dNTP、一定比例的ddNTP(带有放射性标记)例如1中是ddATP,它就负责测定T碱基的位置;
之后大批量的核苷酸反反复复的结合,把所有的位点都结合
最后利用凝胶电泳和放射自显影只能看到带有荧光标记的ddNTP,先利用电泳条带前后关系确定下他们的排列顺序,再用ATCG关系反转一下
优点:准确度很高,99.999%
缺点 一代最长能测1000bp,再多了就要重头开始一遍导致成本高;另外它一次只测一条,也就是所谓的通量低。
二代测序NGS步骤与原理(先看必备words,见下)
三平台:Roche公司的454技术、illumina公司的Solexa/Hiseq技术(占主要市场,PE(Pair End双端)测序原理)、ABI公司的SOLID技术
双端测序原理:如下
建DNA文库
超声打断,用酶补平为平末端,再在两端加上互补配对的adapter(接头),再通过PCR扩增达到一定浓度,构成单链DNA文库
adapter修饰,图片来自生信星球**image.png
2. 上样
步骤:建好的文库中的待测序列→测序就在flowcell进行,在特异的化学试剂作用下,强力随机地附着在lane上,与上面的短序列配对,吸附住冲过来的DNA,再在表面进行桥式PCR扩增
注意:
lane上有哪两种接头:lane上随机分布两种接头,p5'(与P5互补),P7(与P7'互补)
待测序列含有哪两种接头: 自带了p5接头和p7接头
lane与lane之间一般不会相互影响,也就是说一般不会出现lane1固定的DNA又与lane2结合。
序列只能一开始是利用p5接头互补,因为p7接头和lane是一样的
3. 桥式PCR
第一轮扩增模版:flowcell表面固定的序列(模版链),与lane接头配对产生了补成双链,后来强碱试剂作用下两条互补链被分开,模版链被冲走,但是互补链稳固定在lane上。接下来就要对互补链p5'- p7' 进行操作
去杂:加入NaOH强碱性溶液使双链DNA变性;模板链会被洗脱
图片补充来自生信星球image.png桥式形成: 加入缓冲溶液,互补链的p7'和lane上的p7互补(但还是一个lane中的),形成了桥的样子
image.png桥式PCR: PCR弯成桥状,一轮桥式扩增一倍
image.png循环: 大约35个循环后,最终每个DNA片段都将在各自的位置上集中成束,称为cluster,这是一群完全相同的序列。目的在于实现放大单一碱基的信号强度,满足后期测序需求
解链: 桥式PCR完成后,形成了很多的桥形的互补双链,再次强碱解链。这一次不再进行复制,而是利用一种酶--甲酰胺基嘧啶糖苷酶(Fpg)选择性的切掉lane 上p5' 连接的链,只留下了与lane p7连接的链,这就是Forward Strand(正链,相对应的reverse strand 是负链)
image.png
4. 测序(边合成变测序)
4①双端测序之Forward Strand
primer结合到靠近p5的sequencing primer binding site1上(结合第一张图片看),再加入特殊的dNTP(它的3' 羟基被叠氮基团替代,每次只能添加一个dNTP;还含有荧- 光基团能激发不同颜色);
在dNTP被添加到合成链上后,所有未使用的游离dNTP和DNA聚合酶会被洗脱掉;
再加入激发荧光缓冲液,激光激发荧光信号,光学设备记录荧光信号的记录,再转化为测序碱基
再加入化学试剂淬灭荧光信号并使dNTP 3’ 叠氮基团变成羟基,这样能继续向下进行再加一个,并且保证这个不再发出荧光。如此重复直至所有链的碱基序列被检测出。得到了Forward Strand序列
4② Index测序
index1 primer和链上的index1 互补配对,进行index1的检测,测完后,洗脱产物,得到index1 的序列。之后再桥式,再进行index2的。图片来自生信星球image.png4③双端测序之Reverse Strand: 洗脱掉index2 产物后,还是一个桥式扩增得到双链,再变性得到原始Forward strand 和 新的Reverse Strand, 除去测完的Forward strand。然后和测Forward一样,也是先连接primer,只是连接的位点是Primer Binding Site2,测完后得到reverse strand序列
二代优点:一个循环就能测定flowcell上成千上万的cluster,这就实现了高通量;illunima一次只添加一个dNTP,确实能够保证准确测量同聚物的长度问题
二代缺点:illumina会限制合成的链的长度(原因在于测序长度越长,杂信号越多)
三代测序
单分子实时DNA测序,不需要经过PCR扩增,实现了对每一条DNA分子的单独测序,超长读长(可达二代测序的100倍以上),可直接检测表观修饰
目前以Pacific Biosciences公司的SMRT技术和Oxford Nanopore Technologies公司的纳米孔单分子技术为主流
特点
缺:准确率低
优:读长长
必备words(需不断更新)
flowcell: 测序反应的载体/容器,1个flowcell有8个lane
lane: 测序反应的平行泳道,试剂添加、洗脱等过程的发生位置
tile: 每次荧光扫描的位置,肉眼是看不到的
双端测序: 可能序列比较长有四五百bp,两边各测120-150bp
junction: 双端测序中间一些没有测到的区域
flowcell构造:一个lane包含两列(swath),每一列有60个tile,每个tile会种下不同的cluster,每个tile在一次循环中会拍照4次(每个碱基一次)
sequence by synthesis, SBS 边合成变测序
同聚物:就是3'端一个一个加dNTP聚合而成的聚合物,因为还带接头,所以不能直接说成DNA分子
一二三代测序总结与对比(引自生信星球)
二代测序主要平台有:
1.罗氏454公司的GS FLX sequencer
2.Illumina solexa genome analyzer
3.ABI公司的SOLiD sequencer