你愿意为这样发育不全的生命科学奉献一生吗
最近刷单细胞文章,看到了《Tumor and immune reprogramming during immunotherapy in advanced renal cell carcinoma》,这个文献里面有一个非常诡异的降维聚类分群和生物学命名:
我看了看,这个研究里面也就是8个10x的单细胞转录组样品,合起来也就是3.4万个细胞,里面的淋巴系细分为12个亚群,其中8个是可以理解的,分别是:B cells, plasma cells, natural killer T cells, FGFBP2+ and FGFBP2 natural killer cells, regulatory T cells, and memory and effector T helper cells
但是有4个亚群,其实都是CD8 T细胞的细分亚群,可以看到这4个细分亚群的标记基因分别是:
这不是重点啦,问题是作者给这4个CD8的T细胞亚群命名就非常诡异,居然是根据41BB的表达量高低,以及是否高表达MX1基因,分成了4个亚群:
起初我看到这样的命名是懵逼的,这个41BB我完全看不懂啊,所以我去搜索了一下,其实41BB的真正的基因名字是:
还好那个 MX1 (MX Dynamin Like GTPase 1) 基因确实是一个名字,但是这个热图就很很让人费解,有一些是基因名字,有一些是基因的别称。
更让我难受的是,明明细胞亚群应该是按照功能进行划分,naive, memory ,effector,cytotoxic,Exhaustion,其中仅仅是记忆T细胞又可以细分:
TEM:效应记忆T细胞(Effector memory T Cell) TCM:中枢记忆T细胞(Central memory T Cell) Tpm:外周记忆T细胞(Peripheral Memory T Cell) TRM:组织驻留记忆T细胞(Tissue Resident Memory) TSCM:干细胞记忆T细胞(Stem cell memory T cell)
而且这些细胞亚群还有组织特异性,器官特异性,真的是非常的麻烦啊!而且仅仅是T细胞外周耐受模式就有6种:静息-忽视-无能-耗竭-衰老-死亡
其它文章对CD8细胞的细分亚群
2021年5月的文章:《A single-cell map of intratumoral changes during anti-PD1 treatment of patients with breast cancer》
可以看到,这个CD8 T细胞亚群就是按照功能进行划分,naive, memory ,effector,cytotoxic,Exhaustion,非常的清晰。
另外一个,2018年11月的文章:《Defining T Cell States Associated with Response to Checkpoint Immunotherapy in Melanoma》,虽然最开始把CD8 T细胞亚群粗暴的使用 k-means 方法分成2群而已:
CD8_G with increased expression of genes linked to memory, activation, and cell survival (e.g., IL7R, TCF7, REL, FOXP1, FOSL2, and STAT4) CD8_B enriched for genes linked to cell exhaustion (e.g., CD38, HAVCR2, ENTPD1, PDCD1, BATF, LAG3, CTLA4, and PTPN6)
这个 CD8_G 和 CD8_B 就很不容易理解,所以后期研究者重新进行划分细胞亚群,是6个,如下所示:
这个时候,也是按照功能进行划分,naive, memory ,effector,cytotoxic,Exhaustion,但是互相之间有交织:
CD8_1 cells expressed markers of exhaustion and cell cycle (Table S4; similar to G11; Table S1), similar to terminally exhausted CD39+ (ENTPD1) CD8+ T cells from chronic infection with hepatitis C virus (Gupta et al., 2015). CD8_2 cells expressed many of the same exhaustion markers along with heat shock proteins (HSPB1, HSPA1A, and HSPA4) and additional inhibitory receptors (ENTPD1 and KIR2DL4). CD8_3 cells expressed the known exhaustion markers (HAVCR2, CD38, PDCD1, and PTPN6) but lacked heat shock and cell-cycle genes. CD8_4 (CCR7, IL7R, TCF7, TNF, and S100A10) and CD8_6 (SELL, TCF7, LTB, IL7R, FLT3LG, and IL16) cells were consistent with a memory- and/or effector-like phenotype, while CD8_5 cells had the phenotypes of memory and early activated cells (IL6ST, CXCL13, IL7R, and CTLA4)
你想跳坑吗
基因名字是问题,我们勉强可以提供检索以及大数据手段进行校验。但是细胞亚群细分的命名,完全就是各个大佬的文字游戏了,不像数学和物理那样的有定理和公理,这样的学科,你还要坚持吗?或者说,你会让自己的子女继续入坑吗?
其实,我们生物信息学数据分析绝大部分的技能并不是一定要应用到生物学数据分析,至少我就看到了几十位小伙伴使用我们教授的R语言技巧顺利转到了金融,游戏,购物等商业数据分析领域。
文末友情推荐
与十万人一起学生信,你值得拥有下面的学习班: