仅2张图分析如何发到顶刊PNAS?

Assessing thyroid cancer risk using polygenic risk scores使用多基因风险评分评估甲状腺癌风险

一、研究背景

甲状腺癌是世界上第九大常见癌症类型,年发病率 > 50万例(> 5万例发生在美国)。尽管手术和其他疗法解决了大多数病例,但患者的发病率较高,在某些情况下,肿瘤表现出更多的侵袭行为。其中,甲状腺乳头状癌 (PTC)就占所有甲状腺癌的85%,并且,与其他癌症相比,其表现出高度的遗传度。全基因组关联研究(GWASs)已经确定了至少10个与甲状腺乳头状癌风险相关的单核苷酸多态性(SNP)。然而,这些危险因素如何有助于临床上个体化评估甲状腺癌风险的可能性尚未被探讨。

二、研究思路

三、结果解析

1. 研究参与者及其人口统计学特征

基于之前发表的来自俄亥俄州哥伦布和德克萨斯州休斯顿、冰岛、荷兰和西班牙人群的甲状腺癌全基因组关联研究(GWASs),作者还纳入了使用英国生物样本库(UKB)基因型信息生成的甲状腺癌GWAS数据,在甲状腺癌的Meta分析中添加UKB数据并没有发现任何新的显著相关的全基因组风险变异。此外,作者还用芯片基因分型数据计算了来自俄亥俄州、冰岛和英国的三个最大样本集的多基因风险评分(PRS),即使用汇总的来自俄亥俄州(1544例患者和1593例对照)、冰岛(723例患者和129556例对照)和英国(534例患者和407945例对照)的三个PTC研究组中的GWAS结果,建立的多基因风险评分(PRS)模型去评估这些变异对PTC风险的联合遗传效应。

附表S1 每个研究组甲状腺癌GWAS和Meta分析中纳入的样本信息

表1 俄亥俄州、冰岛和UKB研究组的人口统计学特征

2. 俄亥俄州、冰岛和英国研究组的PRS分析以及与癌症风险的相关性

纳入PRS分析的效果估计是基于甲状腺癌的Meta分析,包括上述三个研究组。作者在从甲状腺癌GWAS Meta 分析中排除了来自美国的所有样本后,使用效果估计值为俄亥俄州研究组生成了PRS,从而省略了任何潜在的混淆效应。同样, 在为冰岛和英国个体生成PRS时,这些研究组的相应样本被排除在Meta分析之外。

对于属于俄亥俄州、冰岛和UKB研究组的个体,作者使用已发表的10个GWAS甲状腺癌风险SNP(10-SNP PRS)以及592475个次要等位基因频率 > 1%的常见SNP(592K-SNP PRS)生成PRS。基于LDpred方法估计了592,475个常见SNP的PRS,调整了连锁不平衡影响的GWAS汇总统计量,并从中发现10-SNP592K-SNP的PRSs在甲状腺病例组和对照组中大致呈正态分布,在3个研究组中甲状腺癌病例组和对照组间差异均有统计学意义。

表2 每个研究组PRS模型中使用的效应估计值

附图S1 甲状腺癌病例组(实线)和对照组(虚线)的多基因风险评分分布

3.预测模型中的PRS

为了研究PRSs的预测能力,作者使用ROC曲线评价了预测模型。通过临床因素(CFs),包括出生年份、性别、10个首要主成分和相似度(UKB样本不可用),作者获得了各个研究组的ROC曲线下的面积(AUC),而在与CF的模型中加入10-SNP PRS的AUC的对比中,作者发现在CF的模型中加入10-SNP PRS的三个研究组AUC均显著增加。

接着,作者进一步评估了将592K-SNP PRS添加到具有10-SNP PRS和CF的模型中后的预测能力,结果表明在模型中加入全基因组PRS(592K-SNP PRS)没有实现显著改善。在多重共线性分析中,作者发现在所有预测因素组合模型中,俄亥俄州组10-SNP和592K-SNP PRS评分的方差膨胀因子(VIFs)分别为2.32和2.32,UKB组分别为2.04和2.04。冰岛研究组10-SNP和592K-SNP PRS评分的VIF略小,分别为1.64和1.63。VIF表示如果模型中包含的相应变量彼此不相关,则方差与方差相比大多少的程度。而且,作者估计正在研究的10个SNPs解释了俄亥俄州研究组中甲状腺癌家族风险的约8%。

表3 各研究组中不同模型的分类结果

图1 评估PRS模型对俄亥俄州(A)、冰岛(B)和UKB(C)研究组区分能力的ROC曲线

附表S2 AUC分析中完整模型下运行的协变量的Logistic回归分析结果

4. 根据俄亥俄州 、冰岛和英国的Meta 分析结果,通过10-SNP PRS 百分组评估甲状腺癌的风险

作者Meta分析了俄亥俄州、冰岛和英国的结果,对每个个体的10-SNP PRS评分进行排序,并将其与癌症状态相关联。与底部十分位组相比,PRSs顶部十分位组个体的风险高6.9倍。这种差异是实质性的,可能在临床咨询中有用。

图2 从俄亥俄州、冰岛和UKB研究组的Meta分析结果获得的甲状腺癌状态的10-SNP PRS十分位的OR估计值,使用底部10-SNP PRS十分位(0-10%)作为参照组(显示为水平实线)

小结

作者通过对俄亥俄州 、冰岛和英国甲状腺癌数据样本集的Meta 分析以及基因分型,初步建立了PRS模型,并利用Logistic回归分析评估PRS与甲状腺癌状况的关联性,ROC曲线来评估PRS模型的预测能力,从而验证了该模型的可行性,证明10个GWAS SNP对癌症易感性具有累加效应,10-SNP PRS与 > 50万个常见变异的PRS具有同样强的风险预测能力。这些低外显率变异体有可能应用于医学,以改善个体化的癌症风险评估。PRS可以用于甲状腺癌的个人特征分析,有助于优化甲状腺癌的筛查,但是,本研究中构建的PRS忽略了用于评估PRS 与疾病状态之间相关性的研究人群的任何混淆效应。

(0)

相关推荐