当你的单细胞亚群都不特异的时候肿么办

做单细胞数据分析,我们当然希望看到一个清晰的降维聚类分群结果,这样才方便做生物学亚群注释,比如前面的例子:人人都能学会的单细胞聚类分群注释  ,第一次分群就非常漂亮!

但那个毕竟是理想情况下,实际上很多单细胞数据集分析到最后,分群其实很勉强,比如2019年11月发表的皮肤单细胞文章,标题是:《Transcriptome landscape of myeloid cells in human skin reveals diversity, rare populations and putative DC progenitors》,链接在:https://doi.org/10.1016/j.jdermsci.2019.11.012,研究者们对10个健康受试者的皮肤样品进行单细胞测序,然后鉴定了 myeloid cell populations.

我看到作者给出了一个重要的单细胞亚群图,如下所示:

初始单细胞分群

可以看到,这个就是普通的降维聚类分群,选取tSNE的坐标,最简单的seurat配色分群,就直接出图了。有很多可以改进的地方,比如umap的可视化这个时候理论上就会比原始的tSNE好很多。

但是这22个原始分群是如何被作者给出来生物学名字的,就很有意思了。如果是从标记基因角度,你很难看出来作者是如何对不同细胞亚群进行生物学注释的:

标记基因气泡图

作者这里的细胞亚群及其大类的定义就很扯淡,内皮细胞可以和免疫细胞并列,其中免疫细胞可以细分为淋巴系和髓系,但是那个树突细胞和巨噬细胞理论上都是myeloid这样的髓系免疫细胞啊,而且这里面的成纤维细胞居然并不是一个大类别,而且也不显示它的通用标记基因。

细分亚群也是如此

上面我们提到了,树突细胞和巨噬细胞理论上都是myeloid这样的髓系免疫细胞,所以作者这里也把它们混起来进行细分亚群,如下所示:

Fig. 2. Re-clustering of macrophages and dendritic cells.

树突细胞和巨噬细胞细分亚群

然后细分的亚群,命名呢,并不是生物学功能命名,而是以单个基因特异性进行命名。但是后续标记基因气泡图又采取了另外的命名方式,如下所示:

  • proliferating genes (sky blue bar),
  • dendritic cell markers (dark blue bar),
  • macrophage markers (black bar),
  • cDC2 markers (orange bar),
  • cDC1 markers (cyan bar),
  • Mw/DC subcluster #0 markers (red bar)
  • Mw/DC subcluster #1 markers (brown bar).
细分亚群的生物学注释

Mw/DC subcluster #5 is a cluster of proliferating DCs and appearing to represent cDC2 progenitors.

而且居然还可以进行差异分析

  • fcDC2 marker gene set (comprising CD1C, CD1E, CD1A, CD11b, CD11c, FCER1A, SIRPA and CLEC10A)
  • cDC1 marker gene set (comprising CLEC9A, CADM1, IDO1 and XCR1).

也是非常的勉强:

勉强进行的差异分析

这个时候我就非常佩服作者讲故事的能力了,无论多么差的数据分析结果,只有能给一个合理的生物学解释,就足以发表了。

灵活拷问

如果是你的数据遇到了如此尴尬的分群,你会怎么办?

另外,作为一个学徒作业吧,想办法拿到这个文章的单细胞转录组数据,走一下我们一直讲解的单细胞转录组数据处理流程,看看能不能拿到比作者漂亮的结果哈!

文末友情推荐

(0)

相关推荐

  • IF 14 非肿瘤的顶刊单细胞套路,亮点在这里!

    探索生信之美,解构每一篇文章的故事 解读高分文章,揭示生信之美~小伙伴们大家好啊,我是风间琉璃.经历了短暂快乐的春节,大家是不是已经回到实验室或者医院继续开始工作了呢?(反正琉璃已经回到临床默默打工了 ...

  • 招聘信息上面都强调有项目经验肿么办

    借第一届生物信息学人才发展大会的契机,我们发布了嘉宾们的系列招聘信息: 基云惠康生物信息工程师招聘启事 给大量有招聘需求的企业及科研单位和我们的十多万生信工程师建立了连接,然后发现一个很有趣的问题:就 ...

  • 真让人纠结:十款中高级家轿各个都很有FAN,肿么办?

    啪!啪!啪!昨天情报员为大家盘点了2017年将要上市的十款全新自主家轿,各位看官不胜欢喜,都暗暗记下了对眼车型的上市时间,每天坐小板凳上,兜里揣着钱,掰着手指头数日子呢. 的确,自主品牌在轿车市场近两 ...

  • 古代名医都具有特异神通

    春秋战国时期的诸子百家中,除了广为人知的道家.儒家.法家.墨家.阴阳家等之外,还有医家. 与其它学说一样,医家同样与道家存在渊源,即医家是以道家道法自然.重德修身.贵性养命为根本理论基础的. 在被中国 ...

  • 构建单细胞亚群网络(类似于细胞通讯分析)

    最近一直在这里细胞通讯分析相关软件工具及原理,看到不同细胞亚群的网络图,就以为是细胞通讯分析. 细胞通讯分析在肿瘤领域的单细胞研究数据处理很常见,因为恶性的肿瘤细胞并不是孤立存在的,它会跟其周围的肿瘤 ...

  • 可视化单细胞亚群的标记基因的5个方法

    好的颜值,人人都爱,是你接触有趣的灵魂的敲门砖.单细胞数据分析也是如此,人人都知道需要降维聚类分群. 有了好的代码,甚至非本专业的财务人员都可以复制粘贴我们写好的的代码,参考前面的例子:人人都能学会的 ...

  • 一篇COVID-19患者支气管肺泡免疫细胞的单细胞亚群标记基因

    最近在整理新冠疫情相关的单细胞文章,尤其是那些提供了数据集的而且还有配套GitHub代码的,超级棒的学习资料. 比如北京大学张泽民教授的实验室发表在 Nat Med. 2020 Jun的文章<S ...

  • 听说你还缺单细胞亚群标记基因

    我们做肿瘤研究的单细胞数据,一般来说初步定义细胞亚群, 第一次分群是通用规则,按照 : immune (CD45+,PTPRC), epithelial/cancer (EpCAM+,EPCAM), ...

  • 单细胞亚群标记基因何止五种可视化方法

    以前我们做了一个投票:可视化单细胞亚群的标记基因的5个方法,下面的5个基础函数相信大家都是已经烂熟于心了: VlnPlot(pbmc, features = c("MS4A1", ...

  • doplot可视化多个单细胞亚群的多个标记基因(2021公开课配套笔记)

    新课发布在B站了,马上有热心的粉丝看完后写了配套笔记: 下面是粉丝linbo的笔记投稿 依旧seurat 官方教程为例 rm(list = ls()) library(Seurat) library( ...