Omics精进05|临床Gene Panel检测-实验&&生物信息学分析(带UMI标签)

本文目录

UMI简介实验流程生物信息学分析流程(带UMI标签)  Trimmomatic或cutadapt过滤  FastQc数据质控  picard进行uBAM转换  fgbio提取UMI信息  samtools或picard进行fastq转换  bwa比对到参考基因组  samtools进行bam转换  picard 合并uBAM和BAM  fgbio GroupReadsByUmi  fgbio CallMolecularConsens  合并consensus.uBAM和Consens BAM  fgbio FilterConsensusReads  fgbio ClipBAM  call变异reference

UMI简介

UMI(unique molecular identifer)是一种用来降低二代测序实验误差(sequencer, polymerase, DNA damage error and so on)的有效技术。建文库时在adapter处加入UMI,在生信分析时通过UMI区分真阳性突变和假阳性突变,提高检测的Sensitivity和Specificity,详细原理可以参考:

实验流程

其它步骤同上一篇,不同之处在于文库构建时添加了UMI标签,如下:


生物信息学分析流程(带UMI标签)

Trimmomatic或cutadapt过滤

去接头、测序引物、低质量碱基、短序列及高N比率的碱基。

FastQc数据质控

统计clean reads中碱基质量超过Q20及Q30的占比、reads数、GC比等。

picard进行uBAM转换

picard FastqToSam将fastq转uBAM(uBAM就是未经过比对软件比对的BAM文件)。

fgbio提取UMI信息

fgbio ExtractUmisFromBam提取uBAM中的UMI信息,生成带有UMI的uBAM, UMI信息存储在标签RX中。

samtools或picard进行fastq转换

samtools fastq或者picard SamToFastq将未比对带有UMI的BAM转换为fastq。

bwa比对到参考基因组

bwa index构建参考基因组索引、bwa mem比对得到sam文件。

samtools进行bam转换

samtools view -bS将sam转换为bam格式。

picard 合并uBAM和BAM

picard MergeBamAlignment将fgbio提取UMI信息的BAM与上一步比对所得BAM合并,得到一个包含各种信息包括RX tag等的BAM文件。

fgbio GroupReadsByUmi

fgbio GroupReadsByUmi通过UMI将reads分组

fgbio CallMolecularConsens

fgbio CallMolecularConsens根据UMI和read1、read2的位置,从一组read中识别出最初的分子序列,得到consensus.uBAM

比对前一步uBAM文件中的reads

通过samtools fastq、bwa mem、samtools view最终得到Consens BAM。

合并consensus.uBAM和Consens BAM

使用picard MergeBAMAlignment合并consensus.uBAM和Consens BAM得到consensus.merge.BAM。

fgbio FilterConsensusReads

使用fgbio FilterConsensusReads 对consensus.merge.BAM过滤得consensus.merge.filter.BAM。

fgbio ClipBAM

fgbio ClipBAM对来源于同一个template的read重叠部分突变clip,得consensus.merge.filter.clip.BAM。

call变异

进行到上该步,BAM文件准备完毕,call变异和上一篇一样,可参考上篇~~
Omics精进04|临床Gene Panel检测-实验&&生物信息学分析


reference

  • http://www.zxzyl.com/archives/1026
  • http://www.zxzyl.com/archives/1016
  • 公众号文章:追踪低频突变----分子标签
(0)

相关推荐