Nature:超5.3万人的基因数据揭示疾病遗传密码
Pixabay.com
精准医学跨组学(TOPMed)项目旨在阐明心脏、肺、血液和睡眠障碍的遗传结构和生物学,最终目标是改善这些疾病的诊断、治疗和预防。该方案的最初阶段侧重于对具有丰富表型数据和不同背景的个人进行全基因组测序。在这里,研究者描述了TOPMed的目标和设计,以及从序列数据中获得的可用资源和早期见解。
精准医疗跨组学(TOPMed)项目分析了53831名来自不同大洲、有着不同背景的人的完整基因组。大多数人来自少数群体,在遗传学研究中,这一群体的代表性历来不足。代表人数的增加应意味着更好地了解心脏、肺、血液和睡眠障碍如何影响少数群体,并应有助于减少长期存在的健康差距。
弗吉尼亚大学医学院遗传学研究员Stephen S. Rich博士帮助领导了步该项目,他说:“人类基因组计划为将基因组学应用于精准医疗带来了很多希望和机会,而TOPMed项目是朝着这个方向迈出的重要一。”“TOPMed的重要特点在于,它不仅发布了53000多人的基因组数据,包括大量与心脏、肺、血液和睡眠障碍有关的数据,而且还发布了献血参与者的多样性和数据。”
这些资源包括一个变体浏览器、一个基因型插补服务器以及可通过dbGaP(基因型和表型数据库)获得的基因组和表型数据。在前53831个TOPMed样本中,研究者在与参考基因组比对后检测到超过4亿个单核苷酸和插入或删除变异。通过在高变异位点上组装未映射的读码和自定义分析,检测出了其他以前未描述的变异。在4亿多检测到的变异中,97%的频率低于1%,46%是单例,只存在于一个个体(53%存在于不相关的个体)。这些罕见的变异提供了对突变过程和最近人类进化史的见解。
基因变异在基因组中的分布
TOPMed研究中广泛的遗传变异目录为探索“罕见和非编码序列变异对表型变异的影响”提供了独特的机会。此外,将TOPMed单倍型与现代估算方法相结合,提高了全基因组关联研究的能力和范围,将变体包含的频率降至约0.01%。
研究人员发现,在被研究的人群中,非洲人后裔的遗传变异最大。科学家们发表在Nature杂志上的报告称,得出的数据是迄今为止关于非洲血统的人得出的最好数据。这项研究还对某些基因变异提供了重要的新见解,这些基因变异会降低人们从处方药中获益的能力。这可能因种族和民族群体而有所不同。
TOPMed研究中的祖先、遗传多样性和罕见变异遗传相关性
研究者发现,TOPMed WGS数据为开发和测试调查人类变异的方法、推断人类人口统计学和探索基因组功能约束提供了丰富的资源。除了这些用途,TOPMed数据将改善几乎所有正在进行的常见和罕见疾病的研究提供了一个深刻的变化,使制成的研究实现完整性,以前的实现只有通过直接测序。
“TOPMed是一项重要的、历史性的努力,它将代表性不足的少数群体纳入了基因研究,”Rich说,他曾在该项目的执行委员会任职,并担任指导委员会主席。“TOPMed的工作不仅应该转化为更好的科学知识,而且应该在各个层次增加多样性——科学家、学员、参与者——在工作中为每个人扩展个性化医疗。”
参考文献:
Daniel Taliun, Daniel N. Harris, Michael D. Kessler, Jedidiah Carlson, Zachary A. Szpiech, Raul Torres, Sarah A. Gagliano Taliun, et al. Sequencing of 53,831 diverse genomes from the NHLBI TOPMed Program. Nature, 2021; 590 (7845): 290 DOI: 10.1038/s41586-021-03205-y