华西师兄带你详解机器学习结合生信数据库挖掘发表的Ebiomedicine(IF=6+)文献

作者介绍 :本文作者大可,四川大学华西医院肿瘤中心科研搬砖工,研究兴趣包括机器学习在高维组学问题中的应用,预测模型的开发与验证。已发表多篇生信和机器学习相关sci文章。

编辑校稿:白介素2

各位朋友大家好,今天给大家分享一篇2020年1月最新出炉的一篇机器学习和生信相结合的高分文章 - “Tumour immune cell infiltration and survival after platinum-based chemotherapy in high-grade serous ovarian cancer subtypes: A gene expression-based computational study” 。这篇文章发表在Lancet的子刊Ebiomedicine上,影响因子6.68分。

image.png

这篇文章探究了经过铂类药物治疗后的不同分子亚型的高分化浆液型卵巢癌的肿瘤微环境浸润情况和生存情况,所有的数据和分析都基于TCGA和GEO数据库。总的来说,纯生信无实验验证的高分论文凤鳞毛角,那这篇论文是如何做到呢,让我们一起来看一看吧!

实验目的

肿瘤的免疫浸润情况目前已经越来越多的被证实与肿瘤患者的预后有关,同时,卵巢癌的分子分型也在既往文献中被报道和患者的预后或病理特征有关。这篇文章的主要目的是探索在不同分子分型的铂类药物治疗后的高分化浆液型卵巢癌中免疫组分浸润情况和患者生存的关系。

实验流程

首先,整个研究的流程图如下:

image.png

我们可以看到,总的来说,文章的思路很简单,清楚明了,作者纳入了13个GEO数据集,共2540个经过铂类药物治疗后的卵巢癌患者,用CIBERSORT计算患者的免疫微环境浸润情况,在筛除一些不符合要求的患者后,对数据集的的免疫细胞浸润情况进行单因素生存分析,分别分析了免疫浸润与总生存期和无病生存期的关系,随后纳入单因素分析P值有显著意义的微环境浸润免疫细胞进入多因素生存分析。

使用机器学习连接TCGA和GEO数据

首先,作者用SVM支持向量机,将488例具有完整卵巢癌分子分型的TCGA数据作为训练集,将422例前人已经预测完毕的带分子分型的患者基因表达数据作为验证集,建立机器学习预测模型。发现机器学习所建的模型可以较好的区分出卵巢癌的不同分子分型。因此,作者得以用自己的机器学习模型对所有GEO数据集中的卵巢癌患者的分子亚型情况进行分类。

image.png

利用CIBERSORT鉴定免疫组分

在确定好所有纳入患者的卵巢癌分子分型后,作者利用CIBERSORT计算出每个数据集中患者的免疫细胞浸润情况,并且在不同数据集中进行相互比较。

image.png

生存分析

之后就是大家所熟悉的生存分析环节了,作者将所有数据集中免疫浸润情况汇总,并进行单因素和多因素生存分析,分析不同免疫组分的表达情况与患者的总生存期和无病生存期之间的关系。除此之外,作者还把每一个免疫组分以四分位数作为截断值,比较免疫组分自身的浸润情况能否使患者的总生存和无进展生存期分层。

image.png

同时,作者又做了分子分型的亚组分析,探究不同分子亚型的卵巢癌患者的免疫浸润情况是否有差距。方法学原理和上述相同。

image.png

分层聚类分析

到前面为止,作者的任务似乎已经完成,但为了使故事更加完整,作者根据患者的免疫组分表达差异,又进行了分层聚类分析(hierarchical clustering),详细分析了所有患者免疫组分的表达差异并进行聚类。

image.png

作者对不同聚类进行了生存分析,发现不同免疫浸润模式的患者在总生存期和无进展生存期上有显著的差异。

image.png

免疫检查点和卵巢癌分子分型的关系

最后,作者检查了常见的免疫检查点 PD1/L1,CTL4的表达和卵巢癌患者不同分子分型之间的关系,作者发现,不同免疫检查点的表达差异与免疫型和增殖型的卵巢癌患者的预后相关,提示不同卵巢癌的分子亚型有可能与卵巢癌患者对免疫治疗的不同反应性相关。

image.png

总结

这篇文章所用的技术不难,除了机器学习以外,都是常规的统计学方法和生信技术。笔者认为本文之所以能发上Ebiomedicine的原因有二:一是患者样本量大,作者搜集了TCGA和GEO数据库中所有相关样本,共有2000多例进行分析,使文章的可信度和工作量大幅上升。二是使用了机器学习的方法,根据基因表达程对卵巢癌患者的分子分型分类。这一点是文章的基础。没有机器学习,文章的大样本量根本无从说起。因此,我们可以看出,在生信分析已经相对泛滥的今天,机器学习或许是纯生信文章发表的新出路。

更多交流

(0)

相关推荐

  • 免疫检查点抑制剂治疗卵巢癌,如果有效可期待长期生存

    卵巢癌是发生在卵巢表面细胞上的恶性肿瘤.初期几乎没有自觉症状,也没有有效的检查方法,因此很难早期发现,近半数在病情恶化的情况下被发现.近年来,由于手术方法的进步和抗癌药物的开发,诊断5年后的生存率大幅 ...

  • 卵巢癌:免疫治疗如何破局?

    在复发性卵巢癌中,免疫疗法与化疗,PARP抑制剂和VEGF抑制剂组合均被视为卵巢癌有希望的方案,面临的挑战是要准确地确定哪些患者可以从这些方法中获得更好的效果. 免疫治疗与化疗,PARP抑制剂和VEG ...

  • 肿瘤微环境中的免疫细胞亚群代谢:促癌还是抑癌?

    刘秋燕 第二军医大学免疫学研究所 医学免疫学国家重点实验室 肿瘤是在与机体免疫系统的斗争中发展壮大的,肿瘤微环境是肿瘤与免疫系统斗争中形成的一个强大的保护网,是肿瘤免疫逃逸的前提和保障.肿瘤微环境分为 ...

  • 卵巢癌有不复发的案例吗

    卵巢癌有不复发的案例的,但是不同患者的情况是不同的,其预后发生复发的几率并不低,因此,在患者预后康复期,为了能够降低其复发率,我建议患者可以选择长期吃抗肿瘤中药人参皂苷rg3,它有抑制肿瘤新生血管生长 ...

  • 香料大全带图详解(72种)

    香料是指在烹饪中所用到的香辛味调味品,它们有的含有多种芳香类的物质,有的带有典型的滋味或香气,故在烹饪中运用十分广泛. 1.八角 味道甘甜,内含有挥发油,有强烈而特殊的香气,是卤料的必需品.也常用于制 ...

  • 最全解读!法官带你详解新《民事证据规定》

    最高人民法院司法案例研究院 2020-05-06 2019年12月,最高法院公布修改决定,首次全面地修改2002版证据规定(旧规).施行十余年的旧规历经民诉法三次修改和民诉法解释的出台,部分规定已落后 ...

  • 螺钉、接骨板、张力带,详解骨科3大技术!

    PART. 01 张力带技术 张力带在创伤外科中最常见的应用是张力带钢丝,用于治疗尺骨鹰嘴骨折和髌骨骨折. 01 张力带原理 1.当关节屈曲时,张力侧通过钢丝.克氏针系统,将牵拉的张力转化为骨折端的压 ...

  • 逻辑思维训练500题(带答案)详解

    第一章 假设法 一个真实的假设往往可以让事实呈现眼前,让真理浮出水面.一个人如果做什么事都可以让其思维以这些假设前提为基础,那么他便能真真正正地活在NLP里而不会陷入困境,他的人生也就会有更大地进步和 ...

  • 王德明老师带你详解八卦掌动静内功

    王德明老师带你详解八卦掌动静内功 王德明老师带你详解八卦掌动静内功 展开

  • 七十多种烹饪香料带图详解

    香料是指我们在烹饪中所用到的香辛味调味品,它们有的含有多种芳香类的物质,有的带有典型的滋味或香气,故在烹饪中运用十分广泛.比如制作风味各异的卤菜.麻辣鲜香的火锅.香气四溢的烧烤等等.下面来认识一下常见 ...

  • 名字带「馨」字笔画多一直写不好,唐老师带你详解,写好并不难

    名字带「馨」字笔画多一直写不好,唐老师带你详解,写好并不难

  • 一文详解机器学习中最好用的提升方法:Boosting 与 AdaBoost

    重磅干货,第一时间送达 选自 | towardsdatascience 参与 | Geek AI.Chita 本文经机器之心授权转载,禁二次转载 在 Kaggle 及其它机器学习任务中,集成方法非常流 ...

  • 标准隶书的书写技法(书法带图详解)

    最基础的也是最可靠的. ​​​​​​​​感觉对你有用,请点赞.