全长转录组分析之牛津纳米孔测序介绍
同样的,因为生信技能树90%教程出自我本人,所以基本上我还没有涉猎到的项目就不太可能有教程,甚至该领域中文教程几乎是空白。好在我交友还算比较广,所以邀请了不同系列专栏作者投稿到生信技能树发布他们的笔记!
有点类似于生信菜鸟团的专栏作者,但是又不太一样
个人所知有限,如有理解错误,还请批评指正。
ONT全称Oxford Nanopore Technologies,直译就是牛津纳米孔技术,是三代测序平台中一种。公司官网为https://nanoporetech.com/。
此次专题主要学习和记录一些在分析ONT测序产品如ONT全长转录组,ONT甲基化以及ONT重测序中的所思所想所得。
官网给出其技术优点的广告如下:Nanopore sequencing, the only technology that offers:
Direct sequencing of native DNA/RNA, or samples that have been amplified with PCR/other methods
REAL Real-time
No capital cost required
Read any length of DNA/RNA - short to ultra-long
Scalable to portable or desktop
Simple & rapid, or automated, library prep
High yields for large genomes
总结就是:
1.单分子测序:纳米孔每次只通过一个碱基
2.测序读长长:相比于二代测序最常见的150bp,三代ONT全长转录组平均读长为1-1.5kb(分析项目经验值),最长读长约为10-20kb
3.测序速度快:不同系列时间有差异。
4.测序数据实时监控,机器方便携带等。
应用范围一张图概括:
1.测序仪种类
主要根据测序数据产出的不同分为以下几种平台,每个平台下还有不同的型号:
MinION
ONT最知名产品,仅有U盘大小,插入普通PC电脑即可运行,一次可运行一个flow cells,产出约10-30Gb的测序数据,运行时长约48小时;
Flongle
MinION和GridION X5测序仪的适配器(adapter,flow cell dongle),仅供一次性使用。不同于MinION流动槽含有512个通道,Flongle含有126个通道。它目前最多能生成1.8 Gb数据。
PromethION
PromethION是ONT推出的最新款超高通量测序设备,它支持实时、长读长、直接DNA和RNA测序工作流程。一次可运行24 (PromethION 24) 到48 (PromethION 48) 个测序芯片,按照每张测序芯片包含3,000个纳米孔通道,所有芯片同时运行将可产出高达7.6Tb甚至是15Tb的数据,这能够满足超高通量的、快速周转测序需求。适用于大规模群体遗传学研究和大型动植物基因组测序项目;
GridION
GridION X5系统的测序部分包含五个 flow cells,这些flow cells可单独使用或协同使用,并通过USB连接到计算机。利用现有的试剂和软件每运行48小时可生成高达150GB的测序数据。GridION X5的出现填补了MinION和PromethION之间的空白。
2.测序基本原理
简单概括:基于纳米孔的单分子实时电信号测序技术。
详细一点:DNA/RNA双链在马达蛋白的带领下与镶嵌在生物膜上的纳米孔蛋白结合并解螺旋,在生物膜两侧电压差的作用下,DNA/RNA链以一定的速率通过纳米孔通道蛋白。由于DNA/RNA链上不同碱基化学性质存在差异,所以当单个碱基通过纳米孔通道时,会引起不同电学信号的变化。根据电流的大小及电流大小的变化情况,通过“递归神经网络(Recurrent Neural Network)”的复杂算法对碱基进行判读,即可计算获得相应碱基的类型,完成序列的实时测定。
测序原理示意图:
测序原理参考文献:
Three decades of nanopore sequencing
Nanopore sequencing data analysis: state of the art, applications and challenges
The Oxford Nanopore MinION: delivery of nanopore sequencing to the genomics community
Systematic and stochastic influences on the performance of the MinION nanopore sequencer across a range of nucleotide bias
3.原始下机数据简介
原始下机数据根据前期实验建库时混样与非混样建库稍微有些区别
混样建库原始下机数据如下:
非混样建库原始下机数据如下:
关于原始数据每个文件的具体含义以及我们初步能从这些文件中得到哪些信息,我们下期见~~