这样筛选危险因素让你文章焕然一新!

Identification of pleiotropic genes between risk factors of stroke by multivariate metaCCA analysis通过metaCCA分析来鉴定中风危险因素之间的多效性基因

一.研究背景

中风是一种临床综合征,中风易感性可能受到许多心血管因素的影响,包括心房纤颤(AF),高血压(HBP),冠状动脉疾病(CAD)和心力衰竭(HF)以及代谢性疾病。研究这些危险因素的共同发病机制可能对中风预防和临床干预有益。

全基因组关联分析(GWAS)已检测到与中风相关的20多个显著遗传位点,例如ALDH2ZFHX3PITX2HDAC9TSPAN2FOXF2。但是单位点分析的GWAS忽略了不同表型之间的相关信息,因此不能有效识别复杂疾病中的罕见变异。所以在本篇文章中,作者利用MetaCCA方法,对GWAS的汇总统计结果进行分析,以探讨多个疾病表型与基因型之间的关系,从而为研究疾病的发病机制提供依据。

二.分析流程

三.结果解读

1.数据处理

作者下载了中风相关的七个GWAS数据集(房颤AF、高血压HBP、冠状动脉疾病CAD、心衰HF、BMI、胆固醇水平、糖尿病)。

表1.从GWAS下载数据集的详细信息

然后作者利用plink软件基于LD信息过滤SNP。接着将过滤得到的SNP注释为其相应的基因。然后接着进行metaCCA分析。

MetaCCA也称Summarystatistics based multival rate meta analysis of genome wideassociation studiesusing canonical correlation analysis,是利用典型相关分析(canonical correl ationanalysis,CCA)的原理,对GWAS的汇总统计结果进行分析,以探讨多个疾病表型与基因型之间的关系,从而为研究疾病的发病机制提供依据。MetaCCA可有效解决单位点分析的GWAS其忽略不同表型之间的相关信息,而不能有效识别复杂疾病中的罕见变异的难题。

2.通过metaCCA和VEGAS2分析鉴定多效性基因

作者通过metaCCA分析检测到107个与多种表型显著相关的基因。然后使用VEGAS2算法对该基因集进行了测试。通过该算法,作者在测试中鉴定出了20个显著基因(调整p值≤0.05)(表2)。

  • 发现了6个与AF相关的基因(ARHGAP32MPPED2SIK3DOCK9FUT8SKAP1);

  • 3个与BMI相关的基因(SKAP1PVRL2PLA2G6);

  • 7个与HPB相关的基因(SIK3PDE3ADIAPH3USP8SPECC1RAB8AMACROD2);

  • 4个与CAD相关的基因(SIK3DOCK9PVRL2SMARCA4);

  • 7个与T2D(2型糖尿病)相关的基因(MYRFDENND5BFUT8SKAP1GMIPPVRL2PLA2G6);

  • 9个TC相关的基因(MYRFSIK3PDE3AZMYM2NYNRINGMIPPVRL2SMARCA4PLA2G6);

  • 1个与HF相关的基因( FUT8)。

表2.过metaCCA和VEGAS2分析鉴定的多效性基因

鉴定的20个多效性基因中的7个(USP8SPECC1RAB8AZMYM2DOCK9FUT8PLA2G6)之前从未被报道与上述所包含的任何性状相关,属于新鉴定出的基因。上述结果也表明,这些基因可能与中风的几种危险因素有关联,而且可能通过调节下游信号通路来调控中风的发生。

3.鉴定的多效基因的生物学解释

为了进一步了解由metaCCA鉴定的多效性基因调控的下游信号通路,作者基于网络工具Enrichr对metaCCA鉴定的107个基因进行了功能富集分析。结果表明,最常见的富集通路包括葡萄糖醛酸化,黄酮和脂质的代谢,这些代谢被称为中风的代谢危险因素(表3)。

表3.多效性基因的通路富集

为了可视化这些基因编码的蛋白质间的相互作用,作者通过STRING 11.0数据库对GO富集中包含的相同107个基因进行了PPI分析(图1)。

图1.多效性基因的蛋白质-蛋白质相互作用(PPI)网络

为了确定影响中风的潜在风险基因,作者挑选了在VEGAS2测试中证实与多个性状有关联的十个基因(PDE3ADOCK9SMARCA4MYRFGMIPFUT8SKAP1PLA2G6SIK3PVRL2)。然后作者确定了与其中5个选定基因(PDE3ASMARCA4GMIPFUT8PLA2G6)有关的18条指向缺血性卒中的最短通路(图2A)。结果发现:SMARCA4是所包括基因组中几乎所有基因的驱动基因。SMARCA4可能会通过多种通路调控中风,包括配体依赖性核受体(BCL6,ETS2,HMGB1,HDAC9),转运蛋白(ABCA1,ALB),和其它分子(肌钙蛋白T,PLAT,TNNT2,NR3C1,NOS3)。

另外,作者确定了与其中5个选定基因(PDE3ASKAPTFUT8SMARCA4PLA2G6)有关的24条指向脑出血的最短通路(图2B)。在这些基因中,SMARCA4PDE3A也通过多种中间因素影响结果。

(图中实线表示链接分子之间的直接关系(例如:蛋白质之间的相互作用);而虚线表示间接关系(例如:抑制或激活))

图5.基因-性状的通路网络

小结

在这项研究中,作者将metaCCA方法应用于GWAS汇总统计数据中的7个缺血性和出血性中风的危险因素(AF,CAD,HBP,HF,BMI,TC和T2D),来检验这些因素之间的重叠的遗传关系,并鉴定中风的预测风险基因。首先作者进行了metaCCA分析,以鉴定可能影响中风的多种危险因素的多效基因,并提出了缺血性和出血性中风的几种潜在调控通路。

此研究也存在局限性:由于研究中缺乏个体水平的基因型数据,所以无法确定能被已鉴定基因所解释的变异性的比例。

(0)

相关推荐