Science Advances |杨剑教授:从基因对表型变异的影响中推断出环境与基因型的相互作用
摘要
文中重要图片说明
图1 |在GEI、QTL和vQTL效应存在下,基因型组间均值或方差的差异示意图。利用遗传变异(MAF = 0.3)模拟1000个个体的表型(A) QTL和GEI效应同时存在,(B) 只存在GEI效应 (无QTL效应),(C) 只存在QTL效应 (无GEI或vQTL效应),或(D) 只存在vQTL效应 (无QTL效应)。
图2 |通过仿真对vQTL分析的统计方法和表型处理策略进行评价。在一个多SNP的模型中,根据不同数量的致病SNPs(即 4, 40, or 80),两个协变量(即性别和年龄)和一个误差项模拟10000个体的表型(方法)。在四种情况下模拟SNP效应:(i)既不影响均值也不影响方差(nei), (ii)只影响均值(mean), (iii)只影响方差(var),或(iv)同时影响均值和方差(both)。误差项由正态分布、t分布(df = 10或3)、分布(df = 15或1)五种不同的分布产生。(A)四种统计检验方法,即采用Bartlett s检验(Bart)、Levene s检验(Lev)、Fligner-Killeen检验(FK)和DGLM检测vQTLs。(B) Levene s检验用于分析使用六种策略处理的表型,即,原始显型(raw),调整后的原始显型协变量(adj), RINT后的(rint),对数变换后的十(log),平方变换后的十(sq),立方体变换后的十(cub)。阳性率定义为P < 0.05的vQTLs数量除以1000次仿真试验的总数,即零(“nei” and “mean”)下的FPR和备选项下的幂(“var” and “both”)。红色水平线表示FPR为0.05。
图3 |在UKB中13个性状曼哈顿图的全基因组vQTL分析。对于13个性状中的每一个(性状的全名见表1),将vQTL分析中所有常见(MAF 0.05) SNPs的检验统计量[log10(PvQTL)]与它们的物理位置作图。虚线表示全基因组的显著性水平1.0×10−8,实线表示实验性显著性水平2.0×10−9。为了图形清晰,SNP PvQTL < 1.0×10−25都省略了,单核苷酸多态性与PvQTL < 2.0×10−9以橙色表示,顶部vQTL SNP对每个轨迹由菱形表示,其余SNP和染色体分别用灰色和蓝色。
图4 |在UKB中腰围曼哈顿图的全基因组vQTL分析。所有来自vQTL(红色条形图)和QTL(蓝色条形图)分析的常见SNP的测试统计数据[log10(P值)]根据它们的物理位置绘制。顶部的vQTL SNP由一个橙色菱形表示,每个重要的vQTL位点(PvQTL < 2.0×10−9)都表示最近的蛋白编码基因的名称。
图5 |与随机QTLs组比较75个vQTLs中GEI效应的富集。在GEI分析中包含五个环境因素/协变量即性别、年龄、身体活动(PA)、久坐行为(SB)和吸烟。(A)75个顶级vQTL SNPs的GEI测试统计量[−log10(PGEI)]的热图。“*” 表示Bonferroni校正后GEI效果显著[PGEI < 1.33 × 10−4 = 0.05/(75 × 5)]。(B)从所有重复1000次的顶级QTL SNPs中随机抽取75个顶级QTL SNPs的显著GEI效应数量分布(均值, 2.25; 标准差, 1.49)。红线表示75个顶级vQTL snp的显著GEI效应的数量(即16)。