使用IGV看序列比对情况

本文从以下五个方面介绍了可视化序列比对数据和相关的tracks:

  • 文件格式:推荐的是BAM/SAM,其他格式,并且需要进行sorting&indexing

  • Read 覆盖率:整体视图,默认的覆盖率视图,和扩展覆盖率视图

  • 序列比对track:颜色、透明度、插入、缺失和排序

  • PE序列比对:将reads以pairs形式和颜色来区分,同时可以分为几个屏幕看。

文件格式

IGV推荐使用格式是:BAM以及SAM格式。

除了BAM,GOBY、VCF、PSL、BED、TDF等格式IGV也支持。

Sort和Index

BAM文件在载入IGV前,需要进行sort 和index。Index会生成一个以“.fai”结尾的辅助文件,这个文件会根据文件名自动关联序列比对数据(.bam),导入IGV中。

  • 序列比对数据需要以.bam扩展名结尾;

  • 在进行index时,文件名必须一致,index文件也必须在同一个文件夹下。

    比如:test_xyz.bam文件的index文件名应该是test_xyz.bam.bai,或者是test_xyz.bai。

  • 这两步骤可以用samtools或Picard软件进行。

Tracks

载入bam文件后会产生3个相关的tracks:

  • Alignment track :显示每个的reads的比对情况

  • Coverage track:显示覆盖率和测序深度

  • Splice Junction Track:提供一个可选的横跨剪切位点(spanning splice junctions)的reads视图。

一般情况下,前两个tracks会自动出现。这些设置可以通过右键进行修改。

Coverage Track

默认情况下,IGV能动态计算和显示比对文件的覆盖率和测序深度。当IGV窗口放大到reads 可视化阈值大小(默认为30KB)时,这个track会以灰色条形图显示每个位点的测序深度。如果某核苷酸与参考序列不同(超过20%reads)时,IGV会标出不同的颜色。

即:A→绿色;C→蓝色;G→橙色;T→红色。

  • 将鼠标悬停在你需要查看的位点处可以看到详细的信息,右键可以复制。

覆盖率数据(TDF)

可用igvtools将BAM文件转化为TDF格式,这个文件是专门显示覆盖率

TDF文件是BAD文件的精简版,当只需要看覆盖率数据时,可用igvtools工具进行转换;方便快速查看。

Alignment Track

当IGV窗口放大到30KB(默认)时,就会显示出各个reads的情况。

  • 当窗口放大到一定程度时,IGV的窗口中心会出现一条线,再继续放大,中心线会变为两条,刚好可以框住一个碱基。

结构变异(Structural Variants)

IGV使用颜色和其他的标记来显示变异:SNP、SV、异倍体(aneuploidy)。

IGV使用reads透明度来表示其质量。

  • 灰色:和参考基因能比对上的reads;

  • 紫色 I:插入;(鼠标悬空在此处能显示插入的碱基信息)

  • 黑色横线(—):缺失;

  • 注意:那些透明或者白色的reads有着亮灰色边框的其比对质量(MQ)为0.

Paired-end 比对

对于PE比对,igv可通过右键选择将reads以成对的方式展示。(如下图)

用户可以将需要标记的reads用紫色标记(1),而不同于预期的将会同(3)一样进行标记。

  • Ctrl+鼠标单击(Mac:command+click)将paired reads用相同的颜色标记其轮廓,每对颜色都是不一样的。注:黑色外框的reads则该reads没有mate。

  • 而Ctrl+鼠标单击(Mac:command+click)任意的一个read都可以去掉这个轮廓。

  • 单击右键,选择Go to mate region可以找到PE中的另一条read。

  • 如果这对reads的插入片段大小较大,则标记一条read时,其另一条read将不会被标记。

  • 停留在一个read上或者单击它,可以看到这条read的信息,包括它paired的另一条read。

在PE比对中,还可以通过右击一个read,选择View mate region in split screen,分屏查看paired mate。(注:若这个read没有mapped mate,则这个选项为灰色)。双击窗口顶端的位点栏,即可恢复正常的单屏视图。

Interpreting Color by Insert size

IGV用颜色来标记异常的插入片段大小的reads,这个只用DNA比对(不适用于RNA-Seq)。

默认的颜色标记规则:如图

  • 红色:插入片段大小大于预期值(这里可能有缺失)

  • 蓝色:插入片段大小小于预期值(这里可能存在有插入)

  • 不同颜色显示PE reads中其mate可在其他染色体上找到(此处可能为染色体间重组)


Interpreting Color by Pair Orientation
  • inversions

  • duplications

  • Translocations

本文简单介绍了使用igv查看序列比对的情况,还有其他模式如Bisulfite Mode,详细可看原文网页(http://software.broadinstitute.org/software/igv/book/export/html/37)。

(0)

相关推荐

  • IGV-基因组浏览器-改造记录(五)

    写在前面 IGV是目前广泛使用的基因组浏览器.但在前述的推文中,我们已经提到过,其并没有较多我们做小RNA数据分析或可视化所需的特性.为此,我们已经介绍了四处我们课题组对IGV修改.我的意思是,我们做 ...

  • IGV-基因组浏览器-改造记录(六)

    写在前面 经过了前面的五次IGV改造,我以为这个系列可能就到此为止了. 然而在近期的数据分析过程中,我们仍然发现了一个新的需求: 在展示sRNA reads的时候,只看某个长度的reads,比如植物的 ...

  • 【软件介绍】IGV软件的安装和基本介绍

    [软件介绍]IGV软件的安装和基本介绍 - 目录 1. IGV 下载与安装 2. Java 安装及环境变量设置 3. IGV 基本介绍 3.1 IGV 界面布局 3.2 IGV 结果界面 3.3 序列 ...

  • 盲派命理官杀当财看的三种情况

    在八字命理中,盲派论命,首先要定出一个人如何取财.他用什么取财,具体看法就是看八字的功神,其中,盲派理论认为,官杀当财看的时候,财富级别最大. 那么,什么情况下,官杀当财看呢?下面,就给大家介绍一下, ...

  • 孩子扁桃体发炎,到底要不要切除?主要还是得看这几种情况

    每年交替季节来临时,气温的变化使许多儿童容易生病.对于抵抗力较弱的孩子,很容易感染细菌.患病率最高的是扁桃体炎.婴儿一岁时扁桃体开始发育,四到十岁发育高峰,到青春期就逐渐萎缩.那么为什么孩子总是扁桃体 ...

  • 扁桃体反复发炎,割不割主要看这几种情况!

    来源:HAOYISHENG 什么是扁桃体 扁桃腺,又称扁桃体,是人和两栖类以上动物,鼻后孔的顶壁或咽与口腔.鼻腔交界处粘膜下淋巴组织所集成的团块的通称,因为外形像扁桃一样而得名. 一般所说的扁桃腺是指 ...

  • 新房装修:一定要擦亮眼睛看清楚5种情况,不然容易翻车掉坑

    大家好,我是淄博设计师陈行知,欢迎关注我,了解更多家居知识 房子装修又苦又累,它不仅涉及到材料.工艺纷繁复杂,而且它还是一个手工活,无论是首套房装修的小白,还是经历过一次装修的人,在新房的装修过程中翻 ...

  • 掉头竟可以不看红绿灯?这种情况可以!

    掉头竟可以不看红绿灯?这种情况可以!

  • 树荫下适合种植什么蔬菜?多种叶菜、果菜,看树荫下光照情况择种

    现在是夏季,我国的南方天气已经很热晒了,早上还没有到八点就能感觉到热烘烘的,晴天白天气温高达35度左右不奇怪,露天菜地里种植的蔬菜,有些出现暂时性的叶子软垂了,而有些刚破土而出的菜苗甚至被晒得枯萎了: ...

  • 从“八字”看父母的健康情况

    文/命理师蚕子 本人女,想通过本人八字看近2年父母的健康情况,家中老人身体不好,已经生病了,有无化解办法,请大师指点. [父母健康解答]坤造:甲子.庚午.辛巳.甲午,大运:4岁起大运,己巳.戊辰.丁卯 ...

  • 从糖票看计划经济食糖供应情况

    糖,在副食品供应中仅次于肉票,老.弱.病.残.产妇.婴儿更是离不开糖. 七十年代后期,食糖供应部分靠古巴进口,后发现古巴糖卫生不达标,传播肝炎病毒,就中止了进口. 糖的原料甘蔗主要产地南方,南方地少, ...

  • “一妆到底”的摄影模式,合理还是不合理呢?主要看这2种情况

    "一妆到底"的摄影模式,指的是在人像拍摄当中,只给模特化一种妆容,然后摄影师就一直拍,一直拍,只补妆,不改妆的情况. "一妆到底"的拍摄模式,一般会在两类情况下 ...