CNS图表复现06—根据CellMarker网站进行人工校验免疫细胞亚群
回顾
我们的CNS图表复现之旅已经开始,前面5讲是;
CNS图表复现01—读入csv文件的表达矩阵构建Seurat对象 CNS图表复现02—Seurat标准流程之聚类分群 CNS图表复现03—单细胞区分免疫细胞和肿瘤细胞 CNS图表复现04—单细胞聚类分群的resolution参数问题 CNS图表复现05—免疫细胞亚群再分类
如果你也想加入交流群,自己去:你要的rmarkdown文献图表复现全套代码来了(单细胞)找到我们的拉群小助手哈。
前面我们得知文章把Macrophage和Monocyte合并起来,把B_cell区分成为两群。而我们的T_cells和NK_cell也需要被合并起来。
首先检查Mast-cells
而 common myeloid progenitor (CMP) 这群细胞呢,在文章并没有出现,不知道是不是会被命名为 Mast-cells,需要相应的生物学背景。
这个时候,根据CellMarker网站进行人工校验,如下所示:
# Human Kidney Mast cell
# http://biocc.hrbmu.edu.cn/CellMarker/search.jsp?quickSearchInfo=mast
genes_to_check = c('ENPP3', 'KIT', 'SLC18A2')
# All on Dotplot
p <- DotPlot(sce, features = genes_to_check,group.by = 'seurat_clusters') + coord_flip()
p
发现就是第7群高表达这些基因,而前面我们的singleR的自动注释步骤把第7群细胞命名为了 common myeloid progenitor (CMP) ,所以它就文章里面的Mast-cells,出图如下:
然后看看B_cell区分成为两群
文章把B_cell区分成为两群,所以我们也区分一下:
前面的singleR的自动注释步骤的B_cell涵盖了Seurat流程的第3,10,13,15,19,21群细胞。
同样的,根据CellMarker网站进行人工校验,如下所示:
genes_to_check = c('CD19', 'CD27','SDC1', 'CD38')
# All on Dotplot
p <- DotPlot(sce, features = genes_to_check,group.by = 'seurat_clusters') + coord_flip()
p
# CD138( SDC1), CD38 # Plasma cell
# CD19, CD27 # memory B cell
出图:
可以看到, 第3和21群高表达CD138( SDC1)基因,所以是Plasma cell,其它B细胞就归类为memory B cell吧,毕竟作者的文章就只有这两个B细胞亚群。
最后检查Macrophage和Monocyte
文章把Macrophage和Monocyte合并起来,但是数量是四千五百个细胞左右,但是我们的Macrophage和Monocyte加起来近5000了,所以里面理论上可以拆出来一些给DC细胞,所以我在CellMarker网站进行人工校验,基因如下:
# CLEC4C, IL3RA, NRP1 # Dendritic cell
# CD1C, CST3, FCER1A # Monocyte derived dendritic cell
genes_to_check = c('CLEC4C', 'IL3RA', 'NRP1','CD1C', 'CST3', 'FCER1A')
# All on Dotplot
p <- DotPlot(sce, features = genes_to_check,group.by = 'seurat_clusters') + coord_flip()
p
确实看到:
第9和13亚群,可以重新被划分为DC细胞,之前属于Monocyte和B细胞。
最后整理分群资料
可以看到,即使是singleR的自动注释后给每个亚群命名了,仍然是需要耗费时间和精力去细致看每个亚群。
# 9,13 Dendritic
# 3,12, Plasma cell
# 7, CMP --> Mast-cells