GATK4的mutect2流程

往期GATK4教程目录:

GATK4的gvcf流程

你以为的可能不是你以为的

新鲜出炉的GATK4培训教材全套PPT,赶快下载学习吧

曾老湿最新私已:GATK4实战教程

GATK4的CNV流程-hg38

官网教程

https://gatkforums.broadinstitute.org/gatk/discussion/9183/how-to-call-somatic-snvs-and-indels-using-mutect2 https://software.broadinstitute.org/gatk/documentation/article?id=9183

非常复杂,而且步骤繁多,如果只是想测试一下:

首先制作配置文件,如下;

oscc_01 /oscc/WES/alignment/OSCC_01_N_recal.bam /oscc/WES/alignment/OSCC_01_T_recal.bam
oscc_04 /oscc/WES/alignment/OSCC_04_N_recal.bam /oscc/WES/alignment/OSCC_04_T_recal.bam
oscc_06 /oscc/WES/alignment/OSCC_06_N_recal.bam /oscc/WES/alignment/OSCC_06_T_recal.bam
oscc_09 /oscc/WES/alignment/OSCC_09_N_recal.bam /oscc/WES/alignment/OSCC_09_T_recal.bam
oscc_10 /oscc/WES/alignment/OSCC_10_N_recal.bam /oscc/WES/alignment/OSCC_10_T_recal.bam
oscc_11 /oscc/WES/alignment/OSCC_11_N_recal.bam /oscc/WES/alignment/OSCC_11_T_recal.bam
oscc_13 /oscc/WES/alignment/OSCC_13_N_recal.bam /oscc/WES/alignment/OSCC_13_T_recal.bam
oscc_14 /oscc/WES/alignment/OSCC_14_N_recal.bam /oscc/WES/alignment/OSCC_14_T_recal.bam
oscc_15 /oscc/WES/alignment/OSCC_15_N_recal.bam /oscc/WES/alignment/OSCC_15_T_recal.bam
oscc_16 /oscc/WES/alignment/OSCC_16_N_recal.bam /oscc/WES/alignment/OSCC_16_T_recal.bam

需要根据以往的教程安装好GATK并且下载好配套文件。

然后运行下面的代码:

module load java/1.8.0_91
GENOME=/home/jianmingzeng/biosoft/GATK/resources/bundle/hg38/Homo_sapiens_assembly38.fasta
GATK=/home/jianmingzeng/biosoft/GATK/gatk-4.0.3.0/gatk
DBSNP=/home/jianmingzeng/biosoft/GATK/resources/bundle/hg38/dbsnp_146.hg38.vcf.gz
reference=/home/jianmingzeng/biosoft/GATK/resources/bundle/hg38/Homo_sapiens_assembly38.fasta

cat $config_file |while read id
do
   arr=($id)
   normal_bam=${arr[1]}
   tumor_bam=${arr[2]}
   sample=${arr[0]}

start=$(date +%s.%N)
echo Mutect2 `date`
time $GATK  --java-options "-Xmx10G -Djava.io.tmpdir=./"  Mutect2 -R $reference \
-I $tumor_bam  -tumor $(basename "$tumor_bam" _recal.bam) \
-I $normal_bam -normal $(basename "$normal_bam" _recal.bam) \
-O ${sample}_mutect2.vcf
$GATK  FilterMutectCalls -V ${sample}_mutect2.vcf -O ${sample}_somatic.vcf
echo Mutect2 `date`
dur=$(echo "$(date +%s.%N) - $start" | bc)
printf "Execution time for Mutect2 : %.6f seconds" $dur
echo

done

简单过滤

for i in *_somatic.vcf
do
j=$(basename "$i" _somatic.vcf )
echo $j
cat $i | perl -alne '{if(/^#/){print}else{next unless $F[6] eq ".";next if $F[0] =~/_/;print } }' > ${j}_filter.vcf
done

把vcf文件转为maf文件,需要参考我在生信菜鸟团前面的博客

  • 用VEP对vcf格式的突变数据进行注释

  • 把vcf文件转换为maf格式

cat config |while read id
do
   arr=($id)
   normal_bam=${arr[1]}
   tumor_bam=${arr[2]}
   sample=${arr[0]}

perl ~/biosoft/vcf2maf/vcf2maf.pl --input-vcf ${sample}_filter.vcf   --output-maf ${sample}.maf  \
   --ref-fasta ~/.vep/homo_sapiens/86_GRCh38/Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz \
   --tumor-id  $(basename "$tumor_bam" _recal.bam)  --normal-id  $(basename "$normal_bam" _recal.bam)  --ncbi-build GRCh38

done

得到的maf就可以用maftools去可视化啦!

提醒两个问题

首先,GATK4目前主流分析选择的人不多,大部分公司或者科研院所仍然是以成熟版本的GATK4系列为流程!

其次,本推文分享的代码只是MUTECT2的6个步骤的其中一个,看下一篇推文查看全部流程。

(0)

相关推荐

  • 6 GATK4完整流程

    0定义变量 source activate wes #GATK=~/biosoft/gatk/gatk-4.1.2.0/gatk ref=/mnt/f/kelly/bioTree/server/wes ...

  • GATK4的gvcf流程

    走GVCF肯定是多个样本,比如我这里有50个病人的正常组织及肿瘤组织的WES测序数据. 得到了它们的bam文件,也是走的GATK流程,这里就不多说了.本教程首发于生信技能树VIP论坛:https:// ...

  • GATK4的CNV流程-hg38

    至少gatk-4.0.2.1.zip无法走CNV流程,我重新下载了目前最新版的才能顺利运行: wget https://github.com/broadinstitute/gatk/releases/ ...

  • 天真的我准备把全部流程迁移到GATK4

    GATK4的gvcf流程 GATK4的CNV流程-hg38 你以为的可能不是你以为的 新鲜出炉的GATK4培训教材全套PPT,赶快下载学习吧 曾老湿最新私已:GATK4实战教程 本着尽量使用最新版软件 ...

  • 一步一步用Snakemake搭建gatk4生成正常样本的germline突变数据库的流程

    echo "START" 大家好,我是熊猫. 事情是这样的,前些天我在朋友圈发了一张图片: Snakemake展现gatk4生成正常样本的germline突变数据库流程图 这是使用 ...

  • 深圳盐田港进口榴莲报关流程手续

    榴莲进口报关所需资料如下: 1.提单.箱单.发票.合同 2.原产地证 3.卫生证(带壳不需要) 4.植检证 5.中文标签 榴莲一般贸易进口流程如下: 1.签订进口合同.外商准备相关单据(产地证.植检证 ...

  • 汽车是怎么开发出来的?浅谈汽车开发流程

    许良  汽车话题下的优秀答主你知道汽车是怎么开发出来的吗?你的脑海中很可能浮现出来这样一个画面:一个非常有艺术气息的设计师,在草图上帅气的描绘着看起来非常犀利的线条.对,但不全对.对于汽车工程师的我而 ...

  • 2021年三亚养猪补贴对象、标准及申请流程介绍!

    近几年随着猪价的上涨,养猪户也越来越多,但是目前生猪养殖成本大幅上升,市场猪肉价格居高不下,为了鼓励生猪养殖,很多地区发布了一系列的养猪补贴政策,今天就给大家介绍一下2021年三亚生猪养殖补贴政策及养 ...

  • 初试数字化转型,某服装公司成功提升业务全流程效率

    艾瑞咨询<2020年中国企业数字化转型路径实践研究报告>中说到,数字化转型的核心本质是利用数字"复制.链接.模拟.反馈"的优势,实现企业转型升级.数字化不是目的,转型才 ...