Omics精进05|临床Gene Panel检测-实验&&生物信息学分析(带UMI标签)
本文目录
UMI简介实验流程生物信息学分析流程(带UMI标签) Trimmomatic或cutadapt过滤 FastQc数据质控 picard进行uBAM转换 fgbio提取UMI信息 samtools或picard进行fastq转换 bwa比对到参考基因组 samtools进行bam转换 picard 合并uBAM和BAM fgbio GroupReadsByUmi fgbio CallMolecularConsens 合并consensus.uBAM和Consens BAM fgbio FilterConsensusReads fgbio ClipBAM call变异reference
UMI简介
UMI(unique molecular identifer)是一种用来降低二代测序实验误差(sequencer, polymerase, DNA damage error and so on)的有效技术。建文库时在adapter处加入UMI,在生信分析时通过UMI区分真阳性突变和假阳性突变,提高检测的Sensitivity和Specificity,详细原理可以参考:
实验流程
其它步骤同上一篇,不同之处在于文库构建时添加了UMI标签,如下:
生物信息学分析流程(带UMI标签)
Trimmomatic或cutadapt过滤
去接头、测序引物、低质量碱基、短序列及高N比率的碱基。
FastQc数据质控
统计clean reads中碱基质量超过Q20及Q30的占比、reads数、GC比等。
picard进行uBAM转换
picard FastqToSam将fastq转uBAM(uBAM就是未经过比对软件比对的BAM文件)。
fgbio提取UMI信息
fgbio ExtractUmisFromBam提取uBAM中的UMI信息,生成带有UMI的uBAM, UMI信息存储在标签RX中。
samtools或picard进行fastq转换
samtools fastq或者picard SamToFastq将未比对带有UMI的BAM转换为fastq。
bwa比对到参考基因组
bwa index构建参考基因组索引、bwa mem比对得到sam文件。
samtools进行bam转换
samtools view -bS将sam转换为bam格式。
picard 合并uBAM和BAM
picard MergeBamAlignment将fgbio提取UMI信息的BAM与上一步比对所得BAM合并,得到一个包含各种信息包括RX tag等的BAM文件。
fgbio GroupReadsByUmi
fgbio GroupReadsByUmi通过UMI将reads分组
fgbio CallMolecularConsens
fgbio CallMolecularConsens根据UMI和read1、read2的位置,从一组read中识别出最初的分子序列,得到consensus.uBAM
比对前一步uBAM文件中的reads
通过samtools fastq、bwa mem、samtools view最终得到Consens BAM。
合并consensus.uBAM和Consens BAM
使用picard MergeBAMAlignment合并consensus.uBAM和Consens BAM得到consensus.merge.BAM。
fgbio FilterConsensusReads
使用fgbio FilterConsensusReads 对consensus.merge.BAM过滤得consensus.merge.filter.BAM。
fgbio ClipBAM
fgbio ClipBAM对来源于同一个template的read重叠部分突变clip,得consensus.merge.filter.clip.BAM。
call变异
进行到上该步,BAM文件准备完毕,call变异和上一篇一样,可参考上篇~~
Omics精进04|临床Gene Panel检测-实验&&生物信息学分析
reference
http://www.zxzyl.com/archives/1026 http://www.zxzyl.com/archives/1016 公众号文章:追踪低频突变----分子标签