系统分析SNP对免疫影响的数据库

肿瘤浸润免疫细胞作为肿瘤微环境的组成部分,影响肿瘤的进展、预后及治疗。其中遗传变异被认为是影响免疫反应的关键因素。因此,鉴定免疫数量性状位点(immunQTL)以评估遗传变异对免疫细胞浸润的影响,可能是充分了解遗传变异在肿瘤发展中起作用的关键步骤。那么今天就来给大家介绍一个系统评估遗传变异对人类肿瘤免疫浸润影响的数据库:CancerImmunityQTL(http://www.cancerimmunityqtl-hust.com/),系统分析多种癌症类型的immunQTL。此数据库系统地探索了单核苷酸多态性(SNP)对肿瘤浸润免疫细胞的影响,并确定了来自TCGA的33种癌症类型的免疫数量性状位点(immunQTL)。

数量性状位点(Quantitative trait locus, QTL),是将表型数据(性状测量)和基因型数据(通常是分子标记物)联合起来分析的一种统计方法,目的是解释复杂性状变异的遗传基础。QTL分析使研究人员能够在多种领域将某些复杂的表型与特定的染色体区域联系起来。而接下来要介绍的immunQTL是把免疫作为表型,来分析样本的SNP对肿瘤浸润免疫细胞的影响。

CancerImmunityQTL数据库主要由三个数据集组成,分别是immunQTL,生存Survival -immunQTL和GWAS-immunQTL。我们可以:

1.浏览或搜索不同癌症类型的immunQTL;

2.浏览或搜索不同癌症类型的与患者生存率相关的immunQTL;

3.在不同癌症类型的GWAS连锁不平衡(LD)区域中浏览或搜索immunQTL;

4.下载所有结果和图片进行进一步分析。

CancerImmunityQTL提供三个模块(immunQTL、Survival-immunQTL及GWAS-immunQTL)的数据浏览和查询。在主页面,我们可以通过单击浏览器栏中三个模块的相应按钮或页面底部Browser by Function部分的相应模块进入“immunQTL、Survival-immunQTL及GWAS-immunQTL”页面。

1.    Single Search & Batch Search

主页面的单一搜索和批量搜索均可用于所有三个数据集的全面查询。我们可以选择特定的癌症类型或免疫细胞类型,并输入SNP ID或基因组区域进行搜索免疫QTL。其中SNP ID需要dbSNP提供的refSNP ID(如“rs2442556”),免疫细胞一栏可选择通过质量控制的17个免疫细胞亚群,基因组区域则为hg19(GRCh37)版本。4个栏目不必全部输入。

例如:我们想查一下胃癌内免疫QTL。点击Single Search

结果将显示为包含三个数据集的三个动态表格。Download则提供3个数据集结果的下载。

Batch Search部分允许用户输入多种癌症类型、SNP ID、免疫细胞或感兴趣的基因组区域。

2.    Browser by Cancer Type

人体解剖学简要显示了33种人类癌症的病理位置,直方图分别显示了33种人类癌症的样本量,immunQTL数量及推断的22种免疫细胞亚群的组成。将鼠标放在人体解剖图的一侧的癌症名称上,会自动显示匹配结果。

如果我们点击某些癌症名称,页面将转到该癌症类型的搜索结果。

3.    immunQTL

通过TCGA数据库中的基因型数据和CIBERSORT估算的免疫细胞分数,该数据库开发了一种计算方法来识别33种癌症类型中的immunQTL,总共确定了913种不同癌症类型的immunQTL。

包括Single Search & Batch Search。我们可以通过从下拉菜单中选择特定的癌症类型,免疫细胞类型或输入SNP ID来进行搜索。还可以通过选择样本大小,SNP的插补得分和immunQTL的P值或FDR来精简搜索结果。

单击“搜索”按钮后,查询结果将显示在一个表中,具体包含内容如下图所示。该表包含样本大小,SNP ID,SNP基因组位置,SNP等位基因,SNP INFO(imputation confidence score,归因置信度得分),SNP注释,位于或附近的基因符号,免疫细胞类型, beta值(SNP对免疫细胞分数的影响大小),immunQTL的P值和FDR。

其中Box Plot为箱线图的矢量图,显示每个记录的SNP基因型与免疫细胞分数之间的关系。这里我们点击第一栏的Box Plot,根据图片分析,在STAD中,携带纯合子rs5762936 AA的个体的Tregs百分比显着高于携带纯合子rs5762936 aa和杂合子rs5762936 Aa的个体。图片可供下载。

4.    Survival-immunQTL

对于每个immunQTL,将样本分为三类:纯合基因型AA、杂合基因型Aa和纯合基因型aa(A和a分别代表一个SNP的主要和次要等位基因)。log-rank test比较了三组之间的生存时间差异,并绘制了KM曲线来显示结果。FDR < 0.05的immunQTL被定义为生存相关的immunQTL。

包括Single Search & Batch Search。具体操作同3. immunQTL,根据搜索框来进行检索。这里以SNP ID: rs250137为例进行简要介绍。

可以发现,关于该SNP ID的免疫QTL生存有意义的只有结肠癌内B细胞存在。下面表格主要包含癌症类型、SNP ID,免疫细胞类型,beta值(SNP对免疫细胞分数的影响大小)以及每个基因型组的中位生存时间等等。其中KM Plot显示SNP基因型与总生存时间之间的关系。

点击KM Plot,分析表明,具有rs250137 AA等位基因的结肠癌患者比具有rs250137 aa等位基因的患者预后更好(P值= 8.06×10 -5)。

5.    GWAS-immunQTL

tagSNPs来自GWAS(http://www.ebi.ac.uk/gwas/),GWAS连锁不平衡区来自SNAP数据库(https://personal.broadinstitute.org/ plin / snap / ldsearch.php)。与tagSNP和/或连锁不平衡区重叠的免疫QTL被定义为GWAS相关的immunQTL。

包括“Single Search”&“Batch Search”。具体操作同3. immunQTL,除了按癌症类型,表型或SNP ID进行搜索外,下拉框中还设计了各种LD(连锁不平衡)阈值,样本大小,SNP的估算得分,immunQTL的P值或FDR以限制SNPs。这里以Phenotype: Metabolite levels为例进行简要介绍。

搜索结果中列出了SNP的信息,样本大小,受调节的免疫细胞以及相关的GWAS特征。例如,发现rs61773374(作为代谢物水平的tag SNP)与ACC中巨噬细胞M2的相对分数显著相关。

6.    Download

可以从“下载”页面下载每种癌症类型的所有三个数据集。

(0)

相关推荐