《自然》:癌症液体活检大突破!UCSD科学家首次在大规模样本中证实,利用人工智能分析血液微生物DNA...
微生物无处不在,与人体健康也有着千丝万缕的联系。比如不久前,奇点糕就介绍了基因毒性大肠杆菌在肿瘤中留下的“指纹”。其它不少癌症,也跟微生物关系紧密。
近日,加州大学圣地亚哥分校的Gregory D. Poore和Rob Knight等使用机器学习分析了癌症基因组图谱(TCGA)中来自微生物的基因片段,发现仅靠这些微生物基因,就可以很好地区分出不同的癌种。
甚至于一般靠ctDNA无法检测的Ia~IIc期肿瘤,或者缺乏可检测基因组改变的肿瘤,也能通过血液中的微生物基因也能很好的识别出来。
这一研究发表在Nature上[1]。
(来自pxfuel.com)
人体中有不少肿瘤都跟微生物密切相关,比如幽门螺杆菌和胃癌、HPV和宫颈癌、肠道菌群和结肠癌等等。或许它们也可以用来诊断癌症。
研究人员对TCGA中,来自10481名患者,涉及33个癌种的18116份全基因组和全转录组数据进行了重新分析。此前也有人在TCGA的数据中研究过EBV、HPV等特定微生物与癌症的关系[2,3],也有人进行过小规模的系统性研究[4]。但大规模的系统性研究,这还是第一次。
在TCGA总共6.4万亿个测序结果中,有7.2%并非人类的基因,其中的35.2%来自细菌、古细菌或病毒,12.6%可以确定到属。
不同癌症中来自微生物的DNA比例和可以确定到属的比例
在不同肿瘤中,检测到的微生物类型存在很大差别,比如HPV与宫颈癌、头颈癌有关,一些梭菌属的细菌和胃肠道的癌症相关等等。不少肿瘤样本中的微生物都来自肿瘤生长的部位,像结肠癌中检测到的微生物DNA,大多就来自粪便菌群。
分析中,研究人员还发现了一种新的与结肠癌相关的细菌——费氏杆菌,它的存在可以很好的把结肠癌和其它癌症区分开来。
结肠癌中的细菌大多来自粪便菌群
利用这些数据,研究人员训练了机器学习模型来区分癌症的类型和分期。在判断参与者有没有患癌症,患的是哪种癌症上,基于组织微生物的机器学习模型表现十分良好,曲线下面积大多在0.9以上。
对肾上腺皮质癌的曲线下面积达到了0.9999以上,接近完全准确
不过对于肿瘤的分期,微生物DNA的区分效果并不好,仅能在结肠癌、胃腺癌和肾透明细胞癌中区分I期和IV期肿瘤,对于其它肿瘤类型的分期都无法区分,也无法区分II期、III期的肿瘤。
由于TCGA中采集样品的时候并没有严格控制微生物污染,表皮葡萄球菌、痤疮丙酸杆菌、分歧杆菌等微生物经常混入TCGA的样本中[5],研究人员又通过最严格的生物信息学净化处理排除了这些污染的影响,只留下了肯定来自组织样本的大约10%的微生物数据。而仅靠这10%的微生物数据,机器学习模型也足以区分出不同的癌症患者了。
肿瘤组织里的微生物特征可以很好的区分各种癌症,但要是用于检测就有些多此一举了。那能不能通过血液来检测呢,就像液体活检一样?
研究人员使用同样的方法对TCGA中血液样本的全基因组数据进行了分析。在严格排除了可能存在的微生物污染后,研究人员发现,来自血液的微生物DNA(mbDNA)同样可以区分出很多种癌症,曲线下面积也大多在0.9以上。
而且研究人员发现,对于通过ctDNA无法检测的Ia~IIc期肿瘤和无可检测基因组改变的肿瘤,通过mbDNA也能很好的识别。
通过mbDNA可以很好的区分多种癌症
(FD为全数据,LCR、APCR、PCCR、MSF是依次逐渐严格的去除污染后的结果)
随后,研究人员招募了59位前列腺癌患者、25位肺癌患者和16位黑色素瘤患者,以及69名健康人,采集了他们的血样,使用机器学习模型进行了分析。
在单独区分前列腺癌或肺癌患者和健康人时,机器学习模型分别达到了87.5%和91.5%的准确度,识别出来89.8%和88%的前列腺癌和肺癌患者,对黑色素瘤的判断也有80%的准确度。当把这100名癌症患者和69名健康人混在一起时,机器学习模型也能将其中71%的人正确诊断。
通过血液样本中的微生物,169人中的71%被正确诊断
除了用于癌症诊断外,这一研究还可能改变癌症的治疗。论文作者之一的Sandrine Miller-Montgomery表示:“这种对微生物种群随癌症变化方式的新认识可能会开辟一条全新的治疗途径。我们现在知道微生物在那里,但它们在做什么呢?我们能否操纵或模仿这些微生物来治疗癌症?”
编辑神叨叨
全体奇点糕呕心沥血呕心沥血呕心沥血打造的重磅音频课程《医学趋势50讲》终于上线了。我们一口气帮你同步了全球医学前沿领域最重磅的进展。只需500分钟,让你彻底搞懂最重磅的医学前沿进展。
课程亮点如下:
1、全面:一网打尽最重磅的医学前沿进展。
在这套《医学趋势50讲》中,我们囊括了免疫治疗、干细胞、微生物、人工智能、二代测序,抗癌新药研发等15个重要的前沿领域,帮你将全球最顶尖的科研成果一举收入囊中。
2、紧跟趋势:帮你无缝同步全球认知。
奇点跨学科专业知识团队,依靠强大的自有数据库系统,每天跟踪全球3000多本医学与生命科学领域的重要期刊,实时把握医学前沿科技最强劲的脉搏。和全球认知同步,你不需要费心费力,我们把全球脉动送到你的耳边。
3、有趣易懂:不用绞尽脑汁,就能理解全球医学顶尖难题。
医学和生命科学领域的论文往往晦涩难懂,再加上语言的隔阂,导致很多人对此望而却步。这一次,我们帮你把艰深晦涩的前沿学术调制成清新爽口的科学小品,让你在享受科学之美的同时,轻轻松松理解医学顶尖难题。和全球最聪明的大脑思考同样的问题,你也可以。