这样筛选危险因素让你文章焕然一新!
Identification of pleiotropic genes between risk factors of stroke by multivariate metaCCA analysis通过metaCCA分析来鉴定中风危险因素之间的多效性基因
一.研究背景
中风是一种临床综合征,中风易感性可能受到许多心血管因素的影响,包括心房纤颤(AF),高血压(HBP),冠状动脉疾病(CAD)和心力衰竭(HF)以及代谢性疾病。研究这些危险因素的共同发病机制可能对中风预防和临床干预有益。
全基因组关联分析(GWAS)已检测到与中风相关的20多个显著遗传位点,例如ALDH2,ZFHX3,PITX2,HDAC9,TSPAN2,FOXF2。但是单位点分析的GWAS忽略了不同表型之间的相关信息,因此不能有效识别复杂疾病中的罕见变异。所以在本篇文章中,作者利用MetaCCA方法,对GWAS的汇总统计结果进行分析,以探讨多个疾病表型与基因型之间的关系,从而为研究疾病的发病机制提供依据。
二.分析流程
三.结果解读
1.数据处理
作者下载了中风相关的七个GWAS数据集(房颤AF、高血压HBP、冠状动脉疾病CAD、心衰HF、BMI、胆固醇水平、糖尿病)。
表1.从GWAS下载数据集的详细信息
然后作者利用plink软件基于LD信息过滤SNP。接着将过滤得到的SNP注释为其相应的基因。然后接着进行metaCCA分析。
MetaCCA也称Summarystatistics based multival rate meta analysis of genome wideassociation studiesusing canonical correlation analysis,是利用典型相关分析(canonical correl ationanalysis,CCA)的原理,对GWAS的汇总统计结果进行分析,以探讨多个疾病表型与基因型之间的关系,从而为研究疾病的发病机制提供依据。MetaCCA可有效解决单位点分析的GWAS其忽略不同表型之间的相关信息,而不能有效识别复杂疾病中的罕见变异的难题。
2.通过metaCCA和VEGAS2分析鉴定多效性基因
作者通过metaCCA分析检测到107个与多种表型显著相关的基因。然后使用VEGAS2算法对该基因集进行了测试。通过该算法,作者在测试中鉴定出了20个显著基因(调整p值≤0.05)(表2)。
发现了6个与AF相关的基因(ARHGAP32,MPPED2,SIK3,DOCK9,FUT8,SKAP1);
3个与BMI相关的基因(SKAP1,PVRL2,PLA2G6);
7个与HPB相关的基因(SIK3,PDE3A,DIAPH3,USP8,SPECC1,RAB8A,MACROD2);
4个与CAD相关的基因(SIK3,DOCK9,PVRL2,SMARCA4);
7个与T2D(2型糖尿病)相关的基因(MYRF,DENND5B,FUT8,SKAP1,GMIP,PVRL2,PLA2G6);
9个TC相关的基因(MYRF,SIK3,PDE3A,ZMYM2,NYNRIN,GMIP,PVRL2,SMARCA4,PLA2G6);
1个与HF相关的基因( FUT8)。
表2.过metaCCA和VEGAS2分析鉴定的多效性基因
鉴定的20个多效性基因中的7个(USP8,SPECC1,RAB8A,ZMYM2,DOCK9,FUT8,PLA2G6)之前从未被报道与上述所包含的任何性状相关,属于新鉴定出的基因。上述结果也表明,这些基因可能与中风的几种危险因素有关联,而且可能通过调节下游信号通路来调控中风的发生。
3.鉴定的多效基因的生物学解释
为了进一步了解由metaCCA鉴定的多效性基因调控的下游信号通路,作者基于网络工具Enrichr对metaCCA鉴定的107个基因进行了功能富集分析。结果表明,最常见的富集通路包括葡萄糖醛酸化,黄酮和脂质的代谢,这些代谢被称为中风的代谢危险因素(表3)。
表3.多效性基因的通路富集
为了可视化这些基因编码的蛋白质间的相互作用,作者通过STRING 11.0数据库对GO富集中包含的相同107个基因进行了PPI分析(图1)。
图1.多效性基因的蛋白质-蛋白质相互作用(PPI)网络
为了确定影响中风的潜在风险基因,作者挑选了在VEGAS2测试中证实与多个性状有关联的十个基因(PDE3A,DOCK9,SMARCA4,MYRF,GMIP,FUT8,SKAP1,PLA2G6,SIK3,PVRL2)。然后作者确定了与其中5个选定基因(PDE3A,SMARCA4,GMIP,FUT8,PLA2G6)有关的18条指向缺血性卒中的最短通路(图2A)。结果发现:SMARCA4是所包括基因组中几乎所有基因的驱动基因。SMARCA4可能会通过多种通路调控中风,包括配体依赖性核受体(BCL6,ETS2,HMGB1,HDAC9),转运蛋白(ABCA1,ALB),和其它分子(肌钙蛋白T,PLAT,TNNT2,NR3C1,NOS3)。
另外,作者确定了与其中5个选定基因(PDE3A,SKAPT,FUT8,SMARCA4,PLA2G6)有关的24条指向脑出血的最短通路(图2B)。在这些基因中,SMARCA4和PDE3A也通过多种中间因素影响结果。
(图中实线表示链接分子之间的直接关系(例如:蛋白质之间的相互作用);而虚线表示间接关系(例如:抑制或激活))
图5.基因-性状的通路网络
小结
在这项研究中,作者将metaCCA方法应用于GWAS汇总统计数据中的7个缺血性和出血性中风的危险因素(AF,CAD,HBP,HF,BMI,TC和T2D),来检验这些因素之间的重叠的遗传关系,并鉴定中风的预测风险基因。首先作者进行了metaCCA分析,以鉴定可能影响中风的多种危险因素的多效基因,并提出了缺血性和出血性中风的几种潜在调控通路。
此研究也存在局限性:由于研究中缺乏个体水平的基因型数据,所以无法确定能被已鉴定基因所解释的变异性的比例。