Science Advances |杨剑教授:从基因对表型变异的影响中推断出环境与基因型的相互作用

国际顶尖统计遗传学家杨剑教授团队于2019年8月14日在Science Advances上发表了题名为《Genotype-by-environment interactions inferred from genetic effects on phenotypic variability in the UK Biobank》的文章。该研究对英国生物银行的13个数量性状进行了全基因组变异数量性状位点分析,对348501个欧洲无亲缘关系个体的约560万个变异进行了分析,证明了在没有环境数据的情况下基因型与环境的相互作用(GEI)检测的可行性,并指出GEI对肥胖相关性状的一般影响。

摘要

基因型与环境的相互作用(GEI)是理解复杂性状变异的基本组成部分。然而,在人类中识别具有GEI效应的基因变异仍然具有挑战性,这主要是由于效应规模较小,而且很难监测环境波动。在这里,我们证明GEI可以从一个大样本中与表型变异相关的遗传变异中推断出来,而不需要测量环境因素。我们对英国生物银行的13个数量性状进行了全基因组变异数量性状位点(vQTL)分析,对348501个欧洲无亲缘关系个体的约560万个变异进行了分析,发现了75个显著的vQTL,其中9个性状的P<2.0×10−9,尤其是与肥胖有关的性状。五种环境因子的直接GEI分析表明,GEI效应对vQTLs有较强的富集作用。我们的研究结果表明GEI对肥胖相关性状的普遍影响,并证明了在没有环境数据的情况下GEI的检测。

文中重要图片说明

图1 |在GEI、QTL和vQTL效应存在下,基因型组间均值或方差的差异示意图。利用遗传变异(MAF = 0.3)模拟1000个个体的表型(A) QTL和GEI效应同时存在,(B) 只存在GEI效应 (无QTL效应),(C) 只存在QTL效应 (无GEI或vQTL效应),或(D) 只存在vQTL效应 (无QTL效应)。

图2 |通过仿真对vQTL分析的统计方法和表型处理策略进行评价。在一个多SNP的模型中,根据不同数量的致病SNPs(即 4, 40, or 80),两个协变量(即性别和年龄)和一个误差项模拟10000个体的表型(方法)。在四种情况下模拟SNP效应:(i)既不影响均值也不影响方差(nei), (ii)只影响均值(mean), (iii)只影响方差(var),或(iv)同时影响均值和方差(both)。误差项由正态分布、t分布(df = 10或3)、分布(df = 15或1)五种不同的分布产生。(A)四种统计检验方法,即采用Bartlett s检验(Bart)、Levene s检验(Lev)、Fligner-Killeen检验(FK)和DGLM检测vQTLs。(B) Levene s检验用于分析使用六种策略处理的表型,即,原始显型(raw),调整后的原始显型协变量(adj), RINT后的(rint),对数变换后的十(log),平方变换后的十(sq),立方体变换后的十(cub)。阳性率定义为P < 0.05的vQTLs数量除以1000次仿真试验的总数,即零(“nei” and “mean”)下的FPR和备选项下的幂(“var” and “both”)。红色水平线表示FPR为0.05。

图3 |在UKB中13个性状曼哈顿图的全基因组vQTL分析。对于13个性状中的每一个(性状的全名见表1),将vQTL分析中所有常见(MAF 0.05) SNPs的检验统计量[log10(PvQTL)]与它们的物理位置作图。虚线表示全基因组的显著性水平1.0×108,实线表示实验性显著性水平2.0×10−9。为了图形清晰,SNP PvQTL < 1.0×1025都省略了,单核苷酸多态性与PvQTL < 2.0×10−9以橙色表示,顶部vQTL SNP对每个轨迹由菱形表示,其余SNP和染色体分别用灰色和蓝色。

图4 |在UKB中腰围曼哈顿图的全基因组vQTL分析。所有来自vQTL(红色条形图)和QTL(蓝色条形图)分析的常见SNP的测试统计数据[log10(P值)]根据它们的物理位置绘制。顶部的vQTL SNP由一个橙色菱形表示,每个重要的vQTL位点(PvQTL < 2.0×10−9)都表示最近的蛋白编码基因的名称。

图5 |与随机QTLs组比较75个vQTLs中GEI效应的富集。在GEI分析中包含五个环境因素/协变量即性别、年龄、身体活动(PA)、久坐行为(SB)和吸烟。(A)75个顶级vQTL SNPs的GEI测试统计量[−log10(PGEI)]的热图。“*” 表示Bonferroni校正后GEI效果显著[PGEI < 1.33 × 10−4 = 0.05/(75 × 5)]。(B)从所有重复1000次的顶级QTL SNPs中随机抽取75个顶级QTL SNPs的显著GEI效应数量分布(均值, 2.25; 标准差, 1.49)。红线表示75个顶级vQTL snp的显著GEI效应的数量(即16)。

(0)

相关推荐