【文献精读】挖掘GEO单细胞数据如何发表5分文章?
本文题为Systematic expression analysis of ligand-receptor pairs reveals important cell-to-cell interactions inside glioma,发表于Cell Communication and Signaling杂志,文章的关键在于单细胞测序数据的重新挖掘。随着单细胞测序分析方法的更新迭代,我们可以针对同一份数据得到不同的结论,本文就是在原有文献的基础上,增加了配体-受体互作分析,虽然用的是旧数据,但却得到了新结论。
摘要
主要的结论是识别了scRNA-seq和TCGA脑胶质瘤细胞的16个显著相关的自分泌配体-受体互作对。探索了肿瘤干细胞样细胞CSCs和巨噬细胞的66个配体-受体互作对,一些对预后有显著影响。利用这些配体受体互作对,构建机器学习模型可以精确预测患者预后。
方法
①数据下载:
单细胞GSE89567
TCGA数据中的LGG和GBM
验证集:中国脑胶质瘤基因组图谱CGGA
②配体-受体互作对整理
基于2015年发表的人类细胞配体-受体互作对草图,A draft network of ligand-receptor-mediated multicellular signalling in human。
③统计学检验
monocle2,差异分析MAST,相关性分析使用斯皮尔曼相关系数,机器学习使用XGBoost。
如果需要学习统计学的小伙伴可以关注我们的统计学系列推文哦。
肿瘤异质性描述
此处还是老生常谈的结论,就是肿瘤细胞病人间异质性较大,非肿瘤细胞病人间异质性较小,我们在之前的推文已经多次介绍。
巨噬细胞/小胶质细胞分析
如果你之前关注过巨噬细胞的话,就知道肿瘤相关巨噬细胞TAM在单细胞测序领域会被认为是一种M1和M2亚型的混合状态,即M1型和M2型标志物间存在正相关的关系,这打破了M1和M2是巨噬细胞的两种极端状态的常规认识。
自分泌信号分析
在方法中已经介绍,本文的所有配体-受体互作对来自于一篇文献,因此,此处主核心的问题是如何定义在肿瘤细胞间或者肿瘤细胞与巨噬细胞发生了互作关系。本文认为高表达且具有相关性的配体受体具有互作关系。因此首先使用差异分析,得到候选自分泌互作对,共有186个。随后利用TCGA-LGG,分析配体与受体之间的相关性,最终得到16个自分泌配体受体互作对,富集分析结果表明这16个自分泌配体受体互作对主要参与发育生物学通路等。
CSCs与巨噬细胞间的互作
文章首先利用干细胞标志物定义CSCs,并分析配体受体之间的作用关系,最终得到66个配-受体互作对,部分与LGG生存相关。
机器学习验证
最后,利用这些配体受体互作对,构建机器学习模型可以精确预测患者预后。
总结
本文利用新的分析手段,对于旧的数据得出了新的结论,这带给我们一个启示:不能仅仅关注常规的分析手段,否则只能得到常规的结论;要不断学习新的分析方法,并大胆运用在一些数据上。本文用到的一些较新的分析方法有:配受体互作分析、XGBoost机器学习方法,CSCs的定义等,都可以学习之后,纳入自己的分析流程。另外,本文还强调了文献阅读的重要性,比如本文的前两个结论:肿瘤异质性描述、巨噬细胞/小胶质细胞分析就是基于文献阅读得到的结论。