技术丨测序技术发展史
在我心中,近100年生物技术最大的突破就是测序技术,正是由于测序技术的不断进步才使得人类可以破解生命的密码。但是一直以来由于成本较高加之技术复杂,大多数检测实验室始终无法将测序作为常规检测方法。近年来来随着纳米孔测序的兴起,使得大多数实验室使用测序作为常规检测的时代不再遥远!本文将从检测的角度来阐述测序技术。
基因测序技术发展历史▲
一、一代测序(Sanger法测序)
一代测序技术指的是由1975年Frederick Sanger发明的Sanger双脱氧链终止法(Chain Termination Method)。基于第一代测序技术的测序仪几乎都是采用该方法。其核心原理是采用ddNTP取代dNTP,在合成核酸链的过程中ddNTP无法形成磷酸二酯键,从而导致DNA合成反应中断。对每个ddNTP进行荧光标记,产生以A、T、C、G结束的四组不同长度的一系列核苷酸,然后通过毛细管电泳进行分离,通过检测荧光信号获得DNA序列。
一代测序特点:
准确度:测序的金标准,准确度高于二代和三代测序;
测序长度:单端700-1000bp,比二代长,比三代短;
测序成本:低;
测序通量:一个反应只能得到一条序列,测序通量低;
PCR:由于测序是基于PCR产物,因此会出现非特异扩增和高GC片段扩增效率低等问题。
数据分析:要求低,多序列比对软件即可。
Sanger法测序是目前实验室使用最广泛的测序技术,常用来对临床检测为阳性的样品,进行测序进一步获得序列信息,进而进行基因分型。很难完成大基因组测序。
Sanger法测序▲
二、二代测序
(高通量测序(High-Throughput Sequencing, HTS);
新一代测序 (Next Generation Sequencing, NGS) )
其特点是一次对几十万到几百万条DNA分子进行序列测定,目前主流的二代测序平台有3种,分别为:Illumina公司的Hiseq平台;Themo fisher公司的Ion Torrent平台和华大基因MGISEQ 平台,另外还有2016年退出市场Roche公司的454这里就不介绍了。
1
●
Illumina公司的Hiseq平台
首先通过不同的方法将打碎的DNA碎片末端连接序列已知的接头,构建单链DNA测序文库。将测序文库的每一条单链DNA通过特异性的接头固定在一个固体支撑体上,固体支撑体的每一个单独小空间中只包含一条DNA链,之后通过PCR特异性的将模板DNA进行富集,从而达到测序所需的模板量。反应过程中加入改造过的DNA聚合酶和带有4种荧光标记的dNTP,用激光扫描反应板表面,根据dNTP多带的荧光读取每条模板序列每一轮反应所聚合的核苷酸种类,经过“合成-清洗-拍照”的循环过程,最终得到目的片段的碱基排列顺序。Illumina测序是通过荧光信号和拍照的方式来识别核苷酸的序列。
2
●
Themo fisher公司的IonTorrent平台
所采用的技术为半导体测序,通过半导体芯片直接将化学信号转换为数字信号。自然情况下,DNA聚合酶将一个核苷酸渗入到DNA分子中就会释放出一个H+,导致局部可检验的PH值发生变化。如果发生结合,就会释放H+,相应的溶液PH值会发生改变,被离子传感器检测到,从而转换为数字信号。
该方法比Illumina平台测序速度更快但是数据量小于Illumina。
3
●
基因组DNA首先经过片段化处理,再加上接头序列,并环化形成单链环状DNA,随后使用的滚环扩增技术(Rollingcircle amplification, RCA)可将单链环状DNA扩增2-3个数量级,所产生的扩增产物称为DNA纳米球(DNAnanoball, DNB),最终纳米球经过DNB装载技术固定在阵列化的硅芯片上。DNA分子锚和荧光探针在DNB上进行聚合,随后高分辨率成像系统对光信号进行采集,光信号经过数字化处理后即可获得待测序列。目前该平台资料较少,是我国的骄傲!
二代测序特点:
准确度:单条可达99.9%准确度,高于三代测序,低于一代测序;
测序长度:单端100-150bp,比二代和三代短;
测序成本:单次测序成本中等,单个碱基测序成本最低;
测序通量:可达数百万条以上片段,几十G-几T的数据量;
PCR:由于建库中利用了PCR扩增,会产生PCR的偏好性和一定概率的碱基错配。
数据分析:要求高,需要专业的生物信息学分析工具。
二代测序在前几年资本市场的推动下风生水起,涌现了一大批上市公司,因此服务体系完善,产品成熟。从检测的角度,二代测序可用于宏基因组的检测,遗传病和肿瘤基因的检测。
三、三代测序(单分子测序)
在2011年和2014年,PacBio和Oxford Nanopore Technologies,ONT公司分别发布了新型的单分子测序技术平台,这种突破性的测序技术被成为第三代测序技术。与前两代测序技术相比,其最大的特点就是单分子测序,测序过程无需进行PCR扩增,并且理论上可以测定无限长度的核酸序列。
1
●
PacBio平台
每个ZMW (零模波导孔)只允许一条DNA模板进入,DNA模板进入后,DNA聚合酶与模板结合,加入4种不同颜色荧光标记4种dNTP,其通过布朗运动随机进入检测区域并与聚合酶结合从而延伸模板,与模板匹配的碱基生成化学键的时间远远长于其他碱基停留的时间,因此统计荧光信号存在时间的长短,可区分匹配的碱基与游离碱基。通过统计4种荧光信号与时间的关系,即可测定DNA模板序列。
2
●
将在某一面上含有一对电极的特殊脂质双分子层置于一个微孔之上,该双分子层中含有很多的纳米孔,并且每个纳米孔会结合一个核酸外切酶。当DNA模板进入孔道时,孔道中的核酸外切酶会“抓住”DNA分子,顺序剪切掉穿过纳米孔道的DNA碱基,每一个碱基通过纳米孔时都会产生一个阻断,根据阻断电流的变化就能检测出相应碱基的种类,最终得出DNA分子的序列。
三代测序特点:
准确度:单条序列的准确率约85%,拼接后可达99%,准确度低于二代测序和一代测序;
测序长度:单端几百bp-几M,长度最长;
测序成本:目前比二代和一代测序成本高;
测序通量:可达数百万条以上片段,几十G-几T的数据量;
PCR:无需PCR,直接测序。
数据分析:要求高,需要专业的生物信息学分析工具。
其他:可进行RNA直接测序,Nanopore的minion测序仪可以做到随身携带。
Nanopore的Minion便携式测序仪是第一款普通实验室都可以配置的测序仪,也使得测序技术可以真正广泛应用于临床检测。
由于三代测序的高错误率和长度长特征,目前最适合应用于临床样品的宏基因组检测。
目前除测序外的核酸检测方法都是基于已知的和特异性的核酸片段,但是检测的终极目标是一网打尽,“应检尽检”,随着测序技术的进步,这样的时代很快就会来临!