癌症新方法 | 从多区域肿瘤测序数据中检测癌症重复进化
一、成果短讯:
2018年8月31日,英国癌症研究所进化与癌症中心的Giulio Caravagna的研究团队在国际期刊Nature Methods 发表了题为“Detecting repeated cancer evolution from multiregion tumor sequencing data”的研究成果,开发了从多区域肿瘤测序数据中检测癌症重复进化的方法。
原文题目及作者见上图
二、内容简介:
患者体内和不同患者之间基因组变化的反复演替反映了都反映了重复的进化过程,这对于预测癌症的进展是非常有价值的。虽然多区域测序允许推断肿瘤中一些基因组变化的时间顺序,但是对患者的重复进化的可靠的鉴定仍然是一个挑战。作者开发了一种基于转移学习的机器学习方法,使我们能够克服癌症演变和数据中噪声的随机效应,并确定癌症队列中隐藏的进化模式。当应用于来自肺癌,乳腺癌,肾癌和结肠直肠癌的多区域测序数据集(来自178名患者的768个样本)时,我们的方法检测到患者亚组中的重复进化轨迹,其在单样本群组中再现(n = 2,935)。我们的方法提供了一种根据肿瘤进化方式对患者进行分类的方法,以及对疾病进展预期的影响。
肿瘤学面临的最大挑战是肿瘤随着时间的推移而发生变化,从良性发展到恶性,转变为转移性,并对某些疗法产生耐药性。这通过涉及癌细胞及其微环境的克隆进化过程发生,并导致肿瘤内异质性(ITH)。ITH通过提供可以发生适应的表型变异的底物来促成癌症的致命结果。一个基本问题是,是否有可能预测癌症的下一个进化“步骤”。Stephen Jay首先提出的关于物种进化的可预测性问题,这也是肿瘤学的核心。
克隆进化是由随机突变,遗传漂变和非随机选择相互作用引起的,这导致数据中的复杂模式并且由于随机性而限制了肿瘤的可预测性。然而,组织病理学分期和分子标记物的预后表明,至少在一定程度啥上,肿瘤的演变是可预测的。此外,尽管癌症进化有随机性,但是微环境,上位性和谱系限制可能可以预测肿瘤取样后有限的一组进化步骤。实际上,基于单样本横截面数据的已有的方法已揭示癌症患者队列中基因组事件的重复序列。
最近的研究使用了多区域测序,通过系统发育分析确定肿瘤中体细胞畸变的部分顺序。然而,在大多数情况下克隆的改变不能被安排,并且来自不同患者的系统发育树通常看起来明显不同。尽管洞察重复进化轨迹对患者分类和癌症进展的预测具有重要意义,但由于目前技术不足和生物变异性等因素,无法对患者的重复进化轨迹进行强有力的推断。
本文研究者们利用了这样一个事实,即不同患者的肿瘤可以代表同一进化过程的多个实例。他们设计了一种称为癌症重复进化的方法(REVOLVER),该方法通过使用称为转移学习(TL)的机器学习方法联合分析来自许多患者的多区域测序数据。REVOLVER联合推断多个患者进化模型,目的是提高其结构相关性。该方法利用多个独立的噪声观测(即单个患者)和患者之间的“传输”信息去噪数据,突出隐藏的进化模式(图1)。个体模型仍然可以解释每个患者的数据,同时突出显示类似进化的肿瘤亚组。
三、实验结果:
图1 | 使用转移学习识别癌症多区域测序数据的重复进化
图2 | 方法的综合测试和生物学验证
图3 | 肺癌的重复进化轨迹
图4 | 乳腺癌的重复进化轨迹
图5 | 对具有重复进化轨迹的单样本横截面群组进行分类
四、原文学习: