泛癌全基因数据分析工具推荐:ICGC
写在前面
关于ICGC的数据库,我们之前有过一个简单的介绍,具体的可以参见第二条。今天的这个部分,只是来介绍一下关于在PCAWG分析的时候,ICGC的使用。其中涉及到的一些检索和分析的过程。其实也适用于其他数据集。
ICGC界面操作
👆的图片是ICGC数据库总体的一个入口,我们在图中的检索框当中输入我们想要输入的基因或者突变类型就可以获得相关的数据结果。这个如果我们想要单纯的来看PCAWG数据的结果的话,就可以有专门的数据检索入口了。我们可以使用:https://icgc.org/ZzP 这个网址可以直接进入到PCAWG的分析入口。
在这个检索结果里面,👈是一个检索栏,我们可以在里面查询相关的疾病类型、基因以及突变的类型。👉是检索后的具体结果。对于呈现的具体结果而言,在突变和基因方面的结果稍微有一些不一样,所以我们就分开介绍一下。
突变结果显示
在突变的具体结果当中,我们可以看到数据库里面对于某一个类型突变的具体介绍。只要内容包括:突变的ID、突变改变的形式、突变的结果、临床的重要性,在所有PCAWG数据里面的个数以及进一步的数据分析。
在呈现结果的最后一个按钮是对于这个数据突变进行进一步分析的按钮。这里的进一步分析是按照这个突变类型把数据分成两组来进行分析。主要包括两组的生存有没有差异,性别分布有没有差异以及年龄分布有没有差异。
基因界面结果
基因界面的结果,我们可以通过每一个突变的基因的基因名,基因的位置、基因类型、基因所有突变的汇总、以及进一步的分析。
在进一步的分析当中,如果我们点击表格当中的柱状图。就可以看到和👆突变进一步分析的类似的结果。里面包括这个基因突变和不突变的预后的结果,在年龄之间的差异以及在性别之间的差异。
另外的进一步分析的话,我们可以是可以查看在所有基因界面里面的基因的进一步分析的结果。这个进一步分析包括使用oncoplot来可视化突变类型。以及对基因进行富集分析。
数据下载
关于PACWG数据的下载,在昨天的汇总贴当中,我们也说到了ICGC是可以下载PCAWG的所有数据类型的。其中就包括bam的文件。具体的数据下载地址是:https://dcc.icgc.org/releases/PCAWG。如果想要下载原始数据的话,可以去下载的
写在后面
以上就是ICGC的基本使用。我们介绍的是关于PCAWG的使用。其实这个适用于其他所有在ICGC的数据。另外ICGC里面还包括了其他的分析。这个我们明天来继续的讲解。