2030年的精准医疗|未来十年,改变医疗保健的七大机遇
导语:
生物技术尤其是基因测序技术的飞速发展,为精准医疗的发展创造了条件。目前,基因检测、诊断、治疗等相关技术已取得了很大的突破。近期,曾领导人类基因组计划的美国国立卫生研究院(NIH)主任Francis S. Collins博士联合美国All of Us测序计划首席执行官Joshua C. Denny博士在Cell发表评论文章“Precision medicine in 2030—seven ways to transform healthcare”,展望了未来十年精准医疗的持续发展以及改变医疗保健的七大机遇。
测序中国对原文进行了编译,以飨读者。
文章发表于Cell
精准医疗通过考虑个体在遗传、环境和生活习惯等方面的差异,有望进一步改善人类健康状况。在未来十年中,精准医疗将继续改变医疗保健领域,并在以下关键领域得以拓展:庞大的队列研究、人工智能(AI)、常规临床基因组学、表型学和环境以及在不同人群中的价值回报。
自2003年完成第一个人类基因组测序以来,临床医生一直期望以数据驱动的医疗保健领域的变革。分子和表型研究的新发现将带来更精确的诊断,更合理的治疗和更有效的疾病预防。2011年,美国国家研究委员会的特设委员会根据新兴的精准医疗领域提出了“人类疾病新分类法”的理念。
如今,发展精准医疗的某些承诺已经实现。目前,研究人员通常使用医疗数据作为发现、识别癌症和许多其他常见及罕见疾病的基因组基础,并引入分子靶向疗法,以及利用新的机器学习方法来掌握大规模计算能力。同时我们也开始从精准医疗中获益。
也许没有比COVID-19大流行更能说明精准医疗的重要性了。COVID-19疫情爆发后,基因组学和分子技术成为确定病原体、开发诊断和治疗方法以及创建候选疫苗的关键。快速分析得到的病例报告暴露出COVID-19可引起患者的巨大健康差异,并强调了获得对影响健康的社会决定因素有更详细了解的重要性。大型机构基于医疗保健数据迅速构建了庞大的数据库,用于快速调查风险因素和结果,证明了整合医疗保健数据的强大功能。
在这场波及全球的疫情中,从现有研究队列中收集数据可以进行快速基因组分析,确定与疾病易感性和患者预后相关的基因位点。此外,COVID-19还需要注意纵向队列研究,以识别急性传染病的临床和生物学危险因素以及长期后遗症。目前,应对COVID-19疫情的许多工作都是基于精准医疗的基本能力。
与此同时,COVID-19疫情也凸显了我们对精确医疗更快更深入发展的需求。在本文中,我们提出了可加速实现精准医学愿景的七个机遇,并阐述了其影响。
图1.2030年精准医疗的七大机遇。来源:Cell
01
庞大的、可互相操作的纵向队列研究
在过去的20年里,“UK Biobank”、“the Million Veteran Program”、“FinnGen”和“All of Us”等国家级队列研究通过基因组、实验室分析、生活方式评估以及健康结果的纵向随访,积累了大量的人群数据。获得数据的深度和广度是惊人的,发现各个医学领域的机会也是如此。
为了最大限度地发挥这些资源的作用,一种“开放科学”的方法应运而生。例如,UK Biobank已经向来自80个国家的19,000多名“纯粹的研究人员”敞开了大门,研究人员可以在首次登录的两个小时内开始使用“All of Us”研究计划的数据云。
该领域下一步的目标很明确:让研究人员更轻松地合并来自多个队列的数据。目前,这需要辛苦的人工表型判断和建立包括各个队列专家在内的大型联盟。幸运的是,大家正在努力推进这一进程,例如全球基因组学与健康联盟(GA4GH)等组织正致力于开发和协调通用的数据模型和文件格式,以促进队列研究协作和互操作性。由于认识到队列研究对合作的需求,国际十万人以上队列联盟(IHCC)汇集了43个国家的100多个队列,参与者超过5000多万,比目前最大的单个队列大了近两个数量级,很难评估这项工作将给全球研究工作带来怎样巨大的影响。
表1:展望未来十年精准医疗将如何影响临床医学和研究。
02
提高科学研究的多样性与包容性
当今生物医学事业面临的最大挑战(也是机遇)之一是研究参与者缺乏多样性。在1已发表的全基因组关联研究(GWAS)中,只有不到3%的参与者为非洲裔、西班牙裔或拉丁美洲裔,而86%的临床试验参与者是白人。缺乏多样性的研究有可能加剧健康差异,使可能适用于所有人的生物学研究成果不具有普适性。
随着数据深度的提升,研究人员有机会采用更具体的措施调整针对不同种族的研究,特别是“种族”将大量的社会、文化、政治、地理和生物因素融合在一起,并可以保证系统性的种族特征。在研究和临床护理中,常规收集健康的社会决定因素,再结合对环境影响、习惯和遗传的更精确检测,可以提供更合理的、基于病因的调整,并产生更好的风险分层和治疗方法。
除了增加研究对象的多样性,生物医学研究人员的多样性也应受到重视。更加多样化的研究团队(包括文化、祖先、信仰、科学背景和方法学等方面)可以带来对创新、信任和文化敏感性的更多了解,更有可能提出与不同受众有关的问题,并最终提供更好的研究策略。
随着国际合作的发展,研究人员还需要考虑国际合作的道德规范,并轮换领导、作者和资源,以确保研究使发展中国家和更有利的国家受益。建立国际基础设施和科学设施,而不仅仅是获取样本和数据,将产生促进健康和能力发展的长期效益。
03
大数据与人工智能
大数据和人工智能(AI)可以解决此前难以解决的问题,例如搜索优化、语言翻译、图像解释和自动驾驶。许多积累的生物医学数据集都可以满足大数据的 ''5 V’s’标准 :数据量大(voluminous)、高速(high velocity)、多样(many varieties)、显著的可变性(significant variability)和内在价值(intrinsic value)。但AI在医学上的应用受到了大型通用结构化数据集(不可用)的限制。
展望未来,生物医学数据集将越来越适合分析。临床数据(包括图像、记录和实时监测数据,分子技术(其中以基因组学为主)以及可提供高分辨率数据流的设备和可穿戴设备的可用性的增长,将大大扩展先前同等规模下无法获得的表型数据和环境数据的可用性。同时,基于基因组、表型和环境预测因子,机器学习方法的应用也可能开发新的疾病分类方法。
04
常规临床基因组学指导预防、诊断和治疗
目前,临床基因组分析通常用于评估某些癌症或疑似罕见遗传病,许多常用的检测只评估少数基因位点。展望未来,全基因组方法将成为了解、预防、检测和治疗常见病和罕见疾病的常规早期步骤。
基因组研究作为靶向方法一种更便宜、更有效的替代方法,其应用可使越来越多的罕见病被诊断出来。早期基因组测序可以解决诊断难题并发现“隐藏”的孟德尔遗传病,例如不明原因的肾脏疾病、非典型糖尿病或不明原因的发育迟缓等。基因测序为部分孟德尔遗传病指出了可以显著改善健康状况的特定新疗法和筛查策略,例如建议携带HNF1A突变或具有肝/肾衰竭特殊特征的年轻糖尿病患者使用磺酰脲类药物。
在过去的十年中,多项研究表明,许多常见疾病(例如糖尿病或高血压)都可能与成千上万个基因位点的遗传风险相关联。这些结果通常是通过对数十万名参与者的数据进行收集的大规模遗传研究发现的。虽然这些基因位点中许多可能具有非常小的遗传效应(odds ratios <1.01),但它们明确了疾病发病机制中可能有显著的治疗意义的途径。此外,将遗传变异加权聚合为多基因风险评分可以实现与罕见的孟德尔遗传病变异体相似的预测。同时,多基因风险评分的使用可以对传统筛查方法可能遗漏的个体进行风险分层,从而确定新的治疗或筛查人群。
基于此,我们预计将发现更多常见疾病的多种遗传原因和靶向疗法,这有利于为患者及其家庭提供更具体的治疗和预防策略。此外,我们很可能还会发现许多遗传疾病的严重程度、外显率和表现度都受到不同遗传变异、生活方式和环境相互作用严重程度的影响。典型例子包括伴有囊性纤维化的不同类型的CFTR突变、具有α-1抗胰蛋白酶缺乏症的SERPINA1突变,这两种突变都可能因为遗传变异、生活习惯(例如吸烟)和暴露(例如肝炎病毒的合并感染),在不同的年龄具有不同的表现。
因此,常规测序将为二次研究分析提供有价值的数据集,从而推动人们更全面地了解疾病的外显率、变异致病性以及影响给定遗传变异可变表达性的因素,也将因此发现更多由偶然变异致病的患者。美国医学遗传学和基因组学学院已鉴定出59个基因,这些患者应该考虑偶然发现的变异。这些基因包括遗传性癌症综合征、心肌疾病和潜在的致命性心律失常,因此可以采取措施降低其风险。如今,约3%的患者携带致病性变异,其中绝大多数患者此前并不知道。随着基因组知识的增加,可操作基因的数量和受影响人群的比例将显著增加。
此外,药物基因组学可以提高药物疗效,减少不良事件,降低成本。在2009年的一次采访中,Francis S. Collins发表了这样的评论:“如果每个人的DNA序列都已经在他们的医疗记录中,我们只需点击鼠标就可以找到需要的所有信息,那么,将这些信息纳入药物处方的门槛就会大大降低。”十多年过去了,基因组学指导的治疗还有很长的路要走。虽然基因组学指导的疗法正在成为一些癌症的护理标准,但由于缺乏“基因组学支持的”电子健康记录(EHRs)、遗传学和治疗建议的复杂性以及缺乏明确证据,使用胚系药物基因突变只被少数美国医疗中心采用来指导处方。来自临床药物基因组学实施联盟的综合证据和建议显示,支持复杂决策支持的EHR,而制定通用的数据标准可加速基因组学应用。
05
EHRs作为表型和基因组研究的数据来源
详细的表型、暴露和健康结果评估是所有纵向队列的研究关键。许多地区和国家研究队列使用的EHRs和其他健康数据,可提供了长达数十年的现有疾病和治疗信息,这些信息可以进一步用于研究,且用途正在逐渐扩大。
例如,一项研究表明参与者在平均约8年的随访中平均接受了190多项临床笔记,14项放射学研究和700多项实验室检测(Robinson等人,2018)。发现特定内表型(例如心脏射血分数)或新兴表型(例如COVID-19),罕见和特定表型(例如下颌骨坏死)或了解疾病特定表现(例如支气管扩张)的能力 需要访问完整的EHR数据。
基于EHR的研究已经为一些大型临床相关基因组研究提供了帮助,其中一些队列超过100万个体。通过系统收集健康相关信息,EHRs 可提供表型和数据,并助力新的研究设计,这些通常是无法在科研收集中获得的。例如,一项研究表明,参与者在平均8年的随访中,平均有190多份临床记录、14份放射学研究和700多份实验室检测。发现特定的表型(例如心脏射血分数)或新出现的表型(例如COVID-19)、罕见的表型(例如颌骨骨坏死),或了解疾病的特定表现(例如支气管扩张),通常需要获得完整的EHR数据。
EHR数据需要整理和统一,并能反映临床和保险方面的偏差。诸如临床记录或影像数据之类的非结构化EHR数据,通常需要自然语言处理或机器学习等高级方法才能在大规模群体应用中发挥作用。虽然所有这些工具的可用性和适用性都越来越高,能够提供在规模、深度和细节上获取数据的途径,但这对于纯研究收集的数据是不可行的。
临床EHR数据还可以与参与者提供的研究数据相结合,以提供更完整的患者预后图。“UK Biobank”和“All ofUs”等国家研究队列均整合了这两种数据源。此外,随着临床基因测序的增长,来自临床护理的基因型数量将迅速增长。许多基因组研究可能不再需要单独的收集生物样本来进行大规模的遗传研究,研究型生物样本的收集可以转向检测其他生物标志物、细胞游离DNA、暴露和表观基因组学。
06
用于临床和研究更多样化、
更高分辨率的表型组学和环境暴露数据
在未来十年中,使用不同方法检测临床表型环境暴露和生活方式的科研和临床应用将持续增长。伴随着监测活动、物理测量和暴露可穿戴设备使用的增加,获取与健康需求、国家生命统计和地理空间资源相关的数据将变得更容易。此外,我们可以将研究更多地集中在其他方法未涵盖的要素上,从而减轻参与者的负担。进行许多临床测量(例如单导程心电图和血氧饱和度)的活动监视器正变得越来越便宜,并且可以轻松地与提供者共享数据。
由于患者生命的绝大部分时间是在医疗保健系统之外度过的,可穿戴设备和其他患者提供的信息可完善EHR,提升远程医疗能力,这在COVID-19疫情期间首次得到了大规模验证。此外,这些工具的集成可能会产生一种转变:大多数与健康相关的数据都是在医疗保健环境之外获得的。
虽然有明确的证据表明营养对健康有影响,但饮食也是一种环境暴露,在许多临床实践和许多研究中经常被忽略。当对其进行评估时,通常是通过偶发性和繁琐的调查(研究)或敷衍性的总结性问题(在大多数临床情况下)进行。用与饭店的数据连接上传,实验室和微生物组评估,或将机器学习应用于食品成像来代替饮食评估,将可以提供更可行、更全面的饮食习惯信息。未来,精准营养作为一种“药物”,将为治疗和预防疾病提供强大的新手段。
07
隐私、参与者信任和回报价值
精准医疗的应用依赖于广泛的人群参与,而广泛参与需要信任、隐私保护和对参与者的价值回报。但科学并不总是值得信赖的,也不总是平等地尊重所有参与者。透明度、真诚互动以及将参与者纳入研究治理可以提高信任度,并确保一个更具思想性和文化敏感性的方向。All of Us从一开始就让参与者参与了各级治理,并通过为参与者提供尽可能多的研究数据来寻求价值回报。
此外,参与者需要相信数据的安全性和隐私性。高度公开的数据泄露,担心被重新识别, 对于某些类型信息可用性的相关法律问题,都是具有挑战性的问题。与参与者清晰坦诚的沟通对于建立信任至关重要,同时,对数据的法律保护和确保信息系统安全的技术方法也具有重要作用。
结 语
支持精准医学的技术正在变革医疗保健,为诸如囊性纤维化和脊髓性肌萎缩等罕见疾病开发了转化性分子治疗方法。此外,基因组研究促进了高脂血症的新药开发。
随着COVID-19的流行,科学已成为对现有医学威胁的最佳答案。但是,我们要提醒人们,医学进步的好处并不总是惠及所有人。在接下来的十年中,生物医学方法、计算算法和高分辨率数据的可用性将大大增加。实施一项需要国际合作的大胆计划,以吸引不同群体的参与者和科学家,深入分析人群,获得丰富的临床和研究数据,并通过真正的学习型医疗保健系统将这种知识应用于临床实践中,将帮助我们实现使精准医疗面向所有人的愿景。
参考文献
Denny, J. C., & Collins, F. S. (2021). Precision medicine in 2030-seven ways to transform healthcare. Cell, 184(6), 1415–1419. https://doi.org/10.1016/j.cell.2021.01.015