人类基因组计划从1990年启动,2003年完成,为生物学和医学带来了深刻变革。新冠病毒的发现、鉴别和溯源乃至疫苗研发,都离不开人类基因组计划引发的DNA测序技术的飞速发展。然而,对人类基因组计划及其催生的基因组学的质疑声一直不绝于耳,《纽约时报杂志》(New York Times Magazine)甚至曾宣称该计划是“历史上最大、最昂贵、最激进的生物医学研究计划”。人类基因组计划、基因组学以及近年发展起来的基因编辑到底为医学带来了哪些根本变革?未来发展还面临哪些不确定性?2021年1月7日,《新英格兰医学杂志》(NEJM)观点栏目发表的文章阐述了上述问题,其作者为美国国立卫生研究院主任Francis Collins、MIT和哈佛布罗德研究所(Broad Institute of MIT and Harvard)创始和现任所长Eric Lander、加州大学伯克利分校教授Jennifer Doudna和美国国立人类基因组研究所研究员Charles Rotimi。作为美国国立人类基因组研究所首任所长,Collins领导了人类基因组计划的实施,Lander是该计划2001年在Nature发表人类基因组草图的第一作者,Rotimi倡导了人类基因组学研究多种族的重要性,而Doudna则因对CRISPR基因编辑技术的杰出贡献获得2020年诺贝尔化学奖。我们在此发表该文的全文翻译(亦可访问NEJM医学前沿官网、APP或微信小程序)。
人类分子遗传学和基因组学——重要进展和激动人心的可能性
Human Molecular Genetics and Genomics — Important Advances and Exciting Possibilities
Collins FS, Doudna JA, Lander ES, Rotimi CN
N Engl J Med 2021; 384:1-4
分子遗传学在过去50年间取得的惊人进展以及向基因组医学的转变,在1970年,也就是美国医学科学院成立时,是难以想象的(美国医学科学院,Institute of Medicine,IOM;现称美国国家医学院,National Academy of Medicine,NAM)。当时“基因组学”一词尚未创造出来,构成现代生物技术基础的工具和技术还处于起步阶段,而对几个核苷酸进行测序的方法也刚刚行得通1。IOM成立早期恰逢DNA领域取得颠覆性发现。当时,生物研究界迅速采纳了Boyer和Cohen的重组DNA技术、Sanger的DNA测序方法和Mullis的聚合酶链反应(PCR)技术(图1)。然而,即使在这一背景下,试图对人类基因组进行测序的“大科学”概念在当时似乎也是激进的。1987年,《纽约时报杂志》将人类基因组计划描述为“历史上最大、最昂贵、最激进的生物医学研究计划。”但从1990年人类基因组计划启动到2003年完成的几年间,基因组技术取得了巨大进展。DNA测序通量从每天1,000个碱基对增加到每秒1,000个碱基以上,这为低成本测序技术打开了大门,使基因组研究领域的进展可以应用于常规医疗。基因组研究已经从试图理解人类遗传密码的基本原理发展到分析上述密码在不同人之间的差异,并将这一知识应用于精准针对疾病病因定制干预措施。基因组工具和数据集的发展改变了医学研究的性质,使科学家能够进行全面且强大的探索,而不再局限于检验聚焦在关于几个候选通路的假设。随着人类基因组第一条参考序列的完成,我们的关注点从寻找基因转移到探索其功能。在家族和人群中进行的系统性遗传图谱有助于科学家精准定位导致人类疾病的基因变异体。基因组计划带来的影响是深远的。5,000多种罕见孟德尔疾病致病基因的发现,促进了基因诊断、妊娠相关咨询、新药治疗以及某些情况下的基因治疗。在基因组区域和常见病之间发现的100,000多种稳健关联指明了新的生物学机制,例如小胶质细胞在阿尔茨海默病中的作用、自噬在炎性肠病中的作用以及突触修剪在精神分裂症中的作用。上述发现还帮助我们开发出了识别心脏病、乳腺癌和其他疾病高危患者的多基因风险评分,不过仍需对此类评分进行进一步严格测试,包括评估临床结局。癌症基因组研究揭示出体细胞突变促使肿瘤发生和生长的数百个基因,这些信息推动了新药的研发。基因组分析还帮助我们解释了为何一部分人接受某些治疗有效或发生某些感染后可以生存,而其他人则治疗无效或无法生存。基因组学研究的重点近期已从分析DNA变异发展到研究单个细胞的基因表达模式,其推动力是用于单细胞RNA测序和染色质分析的新方法。迄今,已有数千万人体细胞被阐明,而我们正在通往绘制完整细胞图谱的路上。这项工作正揭示出数百种新的细胞类型,并表明健康人和各种疾病患者之间的细胞类型差异。随着全基因组测序成本从人类基因组计划时的30亿美元下降至如今的600美元,人们正努力建立包含成千上万人全基因组测序和表型信息的大规模生物样本库。例如英国生物样本库(https://www.ukbiobank.ac.uk/)和美国“我们所有人”研究计划(https://allofus.nih.gov/)。我们的最终目标是医疗系统能够将基因组信息与病历相结合。要加强人类遗传变异研究,我们还有许多工作要做。尽管对不同背景的人开展研究将有望揭示生物学机理和健康差异原因,但目前参与基因组研究的研究人员和参与者仍大多是欧洲血统。缺乏多样性会妨碍生物学研究,加剧已经很严重的健康差距,而且让我们怀疑基因组研究中获得的多基因风险评分、诊断和治疗方法可否平等惠及所有人群。对不同血统背景的人开展研究可揭示出基因组变异是如何在人群层面造成以下各方面的差异:疾病易感性、药物疗效和基因组研究指导下的临床诊断准确性。通过此类研究,我们发现了非洲血统特异性APOL1变异体,该变异体有助于避免非洲昏睡病,但却增加了肾衰竭风险;在美国的非洲血统非糖尿病性肾衰竭患者中,上述变异体是70%病例的原因。此外,SLC16A11的2型糖尿病风险单倍型存在于大约一半的美洲原住民中,而在欧洲或非洲血统的人中则很少,对于墨西哥裔美国人高出欧洲裔美国人的2型糖尿病患病率,上述SLC16A11单倍型可解释约20%的差异。基因组研究还表明,PCSK9失活突变在非洲血统的人中比在其他人群中更常见;上述突变可降低胆固醇水平和心脏病风险,它为药物研发提供了新启示。我们正在实施几项举措从之前参与比例较低的人群吸引更多研究人员和参与者。例如,非洲人类遗传与健康(Human Heredity and Health in Africa,H3Africa)计划(https://h3africa.org/)建立了泛非实验室联盟,该联盟确保了500多名非洲科学家可获得基因组技术,招募了60,000多名研究参与者,并建立了一个生物信息学网络和三个区域生物样本资源库。我们早该采取措施缩小在参与基因组研究方面的差距;采取这些措施之后,预计精准医学带来的益处将被更公平地分享。基因组测序技术使遗传病的诊断取得迅速进展,但其在研发和验证治疗方面面临较大挑战。对于一些孟德尔疾病,我们已在详细了解其病理生理学之后研发出分子靶向药物。例如,1989年发现CFTR基因之后,我们已在此基础上开展研究,并研发出可用于90%囊性纤维化患者的安全、有效的分子靶向药物。但研发成功此类方法可能需要数十年时间,而且不能推广到确切分子原因尚且未知的数千种其他遗传病。直接针对基因的有效治疗策略具有重要优势。经过多年的起伏,基因治疗正取得一些巨大成功,例如在脊髓性肌萎缩和血友病领域。这类研究的步伐在未来可能会大大加快,而精准基因组编辑技术如今提供了新的治疗途径。过去8年间,CRISPR(规律成簇的间隔短回文重复序列)-Cas9(CRISPR相关蛋白9)技术已成为研究和改变基因组的可及和适用工具。CRISPR-Cas9可产生触发位点特异性DNA修复的靶向DNA断裂,从而诱导基因组编辑。二代技术还可采用不需要修复DNA断裂的核苷酸碱基编辑程序,进而控制基因的转录输出或改变基因组序列。随着这些技术的不断成熟,高效、准确改变细胞基因组的可能性日益增加。继工程核酸酶之后,CRISPR-Cas9工具使我们能够高效敲除或编辑细胞或模式生物的几乎任何基因,因而加快了基因组研究的步伐。基于CRISPR-Cas9的多项临床试验正在进行中或预计将很快启动。尽管Cas9工程细胞尚未在较大规模上证明其有效性,但早期试验结果提示,此类细胞稳定,且不会在人体内引起急性不良反应,尽管长期安全性尚待确定。目前的应用领域主要是单基因病,我们可对适当的细胞进行离体基因编辑,例如镰状细胞性贫血患者的骨髓造血干细胞。目前正探索开发可将基因编辑器靶向递送到体内适当组织的递送系统。基因组技术的进展将继续大力推动基础科学向前发展,而且其中有些是我们无法预见的。现在的受训科研人员已经无法想象,在无法快速、自由获取大量基因组、转录组和染色质标记数据(而且我们正越来越多地获取单细胞数据)的情况下,当年的人类生物学研究是如何进行的。此类数据集使我们有机会获取通过复杂计算分析才能得到的生物学知识,所有生物学家都需要为此做好准备。对人类遗传变异及其生物学重要性的理解也将取得进展,这将为国际常见病联盟(International Common Disease Alliance)的医学机制图谱(Maps to Mechanisms to Medicine)愿景(https://www.icda.bio/)奠定基础。我们通过寡核苷酸技术或基因编辑技术在体内靶向基因突变的能力不断增强,这应该可以使得许多孟德尔疾病得到治疗,甚至治愈。但我们仍然面临许多不确定性,并且并非所有重大问题都可以仅靠科学来解答。例如,我们如何确保不同人群公平、包容地获得研究机会,以及获得基因组革命带来的治疗获益?我们如何平衡科学进步和新出现的伦理问题,例如可否将基因组编辑技术用于可遗传的基因编辑?我们如何在保护参与者隐私和尊重文化传统的同时,保持曾推动基因组科学的数据共享精神?这些问题凸显为何在未来50年间,美国国家医学院将比以往任何时候都更有存在的必要。