对100万个人类基因组测序,以揭开遗传秘密

2021-05-12 14:42:00

图片来源:HYanWong/维基共享资源

20年前,也就是2001年,第一张人类基因组图谱发布,该项目历时3年,耗资5至10亿美元。人类基因组计划让科学家能够几乎从头到尾阅读30亿对DNA碱基,这些碱基从生物学上定义了人类。

该项目让我这样的新一代研究人员能够确定癌症治疗的新靶点、用人的免疫系统改造老鼠,甚至搭建一个网站,让任何人都能像使用谷歌地图一样轻松地浏览整个人类基因组。

第一个完整基因组的绘制来自于一些匿名的捐赠人士,科学家们试图绘制一个参考基因组,这个基因组代表的不只是一个个体。但这还远不能涵盖世界上广泛多样的人口特点。世界上没有相同的两个人,也没有相同的两个基因组。如果研究人员想彻底了解人类的多样性特点,就需要对数百万个完整的基因组进行测序。而现在,一个这样的项目就在进行中。

了解基因多样性

不同人之间的基因差异性使每个人都与众不同。但基因的变化也会引起很多疾病,致使某些人群更容易感染某些疾病。

图片来源:Look For Diagnosis

在进行人类基因组计划的时候,研究人员还对其他生物的基因组进行了测序,如小鼠、果蝇、酵母菌和一些植物。科学家们为绘制第一个基因组图所付出的巨大努力,为读取基因组带来了一场技术革命。有了这些科学进步,测序一个完整的人类基因组就无需花费数年时间和数亿美元的经费,现在就只需几天的时间和一千美元。基因组测序和基因分型服务(例如23andMe或Ancestry)有很大的不同,后者只是查看一个人基因组的一个小片段而已。

技术的进步使科学家可以对全世界成千上万人的完整基因组进行测序。基因组聚集联盟等组织目前正在努力收集并整理这些分散的数据。目前,该组织已收集了近15万个基因组,这些基因组展示了惊人的人类基因多样性。在这些数据中,研究人员发现这些人的基因组存在超过2.41亿个差异,平均每8个碱基对就有一个变体。

这些变体大多很罕见,对人没有实际影响。然而,这其中隐藏着具有重要生理和医学影响的变体。例如,BRCA1基因的一些变体,会使一些女性群体(如德系犹太人)易患卵巢癌和乳腺癌。该基因的一些其他变体会导致一些尼日利亚女性的乳腺癌死亡率高于正常水平。

研究人员识别人群水平的变异类型的最佳方法,就是通过全基因组关联研究,将大组人群的基因组和对照组进行比对。但疾病是复杂的。不同人的生活习惯、疾病症状和发病时间会有很大差异,基因对很多疾病产生的影响也很难区分。目前的基因研究的预测能力很低,无法梳理出很多基因对疾病的影响,因为我们没有足够的基因组数据。

对复杂疾病的遗传学理解,尤其是与种族群体中的基因差异相关的疾病,本质上是一个大数据问题。研究人员需要更多的数据。

图片来源:HYanWong/维基共享资源

100万个基因组

为了满足对更多数据的需求,美国国立卫生研究院启动了一个名为“我们所有人”的项目。该项目旨在10年内,通过调查问卷和可穿戴设备,从美国100多万人中收集遗传信息、病例和健康习惯。它还有一个目标,即从未被充分代表的少数人群体中收集更多的数据,以促进对健康差异的研究。“我们所有人”项目于2018年向公众开放注册,目前有超过27万人提供了样本。该项目还在继续从所有50个州招募参与者。参与其中的有许多学术实验室和私营企业。

这个项目可以使许多领域的科学家受益。例如,神经科学家可以在寻找与抑郁症相关的基因变体时,考虑病人的运动量水平。肿瘤学家可以在寻找与降低皮肤癌风险相关的变异体时,探索种族背景的影响。

100万个基因组,和随之收集而来的健康及生活方式的信息,将提供极其丰富的数据,让研究人员能发现基因变异对疾病的影响,不仅是对个人疾病的影响,而且也对不同人群的疾病的影响。

人类基因组的“暗物质”

该项目的另一个好处是,它能让科学家们了解到目前非常难研究的那部分人类基因组。目前大部分遗传研究都是针对基因组中编译蛋白质的部分,但这些只占人基因组的1.5%。

我的研究侧重于RNA——一种将编码于人DNA中的信息转化为蛋白质的分子。然而,来自人类基因组中98.5%的RNA并不用于转化蛋白质,这些RNA本身具有大量的功能。其中一些非编码RNA参与了诸如癌症扩散、胚胎发育和控制女性X染色体等过程。具体地说,我研究的是,遗传变异如何影响非编码RNA的复杂折叠,使其能够完成它们的工作。由于“我们所有人”项目包含了基因组所有的编码和非编码内容,这将是迄今为止与我工作相关的最大的数据集,它将有望揭秘这些神秘的RNA分子。

第一个人类基因组图谱的绘制带来了20年来惊人的科学进步。我认为基本可以肯定的是,庞大的基因组变异数据库将揭示有关复杂疾病的线索。多亏了大规模的人口研究和诸如“我们所有人”这样的大数据项目,研究人员将能够在未来十年内,解答我们个人基因如何影响我们的健康这个问题。

撰文:Xavier Bofill De Ros,美国国立卫生研究院RNA生物学研究员。

(0)

相关推荐