什么，基因只剩下了三分之一？

2024-06-13 10:30:30

上周的《单细胞图表复现100篇》栏目，我们分享了2个NSCLC的文献，这周六我们应该是要分享4个ccRCC的文献，PPT已经制作完毕！感兴趣的可以推荐下面的会议，准时参加！（会议密码是：1024 ）

其中有一个ccRCC研究它的数据非常的诡异，数据并不是在GEO里面，而是直接网页附件的形式给出来了的！文章标题是：《Progressive immune dysfunction with advancing disease stage in renal cell carcinoma》

我分别处理这两个csv文件，其中第二个文件，也就是这个缺胳膊断腿的数据，普通的降维聚类分群后，拿出来标记基因画个图，代码如下：

library(ggplot2) genes_to_check = c('PTPRC', 'CD3D', 'CD3E', 'CD4','CD8A','CD19', 'CD79A', 'MS4A1' , 'IGHG1', 'MZB1', 'SDC1', 'CD68', 'CD163', 'CD14', 'TPSAB1' , 'TPSB2', # mast cells, 'RCVRN','FPR1' , 'ITGAM' , 'FGF7','MME', 'ACTA2', 'PECAM1', 'VWF', 'EPCAM' , 'KRT19', 'PROM1', 'ALDH1A1' ) library(stringr) p_all_markers <- DotPlot(sce.all.filt, features = genes_to_check, assay='RNA' ) + coord_flip()

p_all_markers ggsave(plot=p_all_markers, filename="first_check_all_marker_by_seurat_cluster.pdf",width = 12)

结果，提示我：

Warning message: In FetchData(object = object, vars = features, cells = cells) : The following requested variables were not found (10 out of 20 shown): CD3D, CD3E, CD4, CD19, CD79A, MS4A1, IGHG1, CD68, CD163, TPSAB1

也就是说，一大半的基因都是缺失的，如下所示的：

一大半的基因都是缺失的

可以看到标志着免疫细胞的PTPRC基因仍然是在，而且上皮细胞的EPCAM也没有问题，所以勉勉强强是可以分群的。

而另外一个基因数量正常的数据集，结果如下所示：

基因数量正常的数据集

就比较容易划分亚群，不过缺失了三分之二基因的单细胞转录组数据集也不是不可以分群，因为绝大部分单细胞亚群都并不是只有一个标记基因。肿瘤常用的第一次分群是通用规则是：

immune (CD45+,PTPRC),
epithelial/cancer (EpCAM+,EPCAM),
stromal (CD10+,MME,fibo or CD31+,PECAM1,endo)

对于缺胳膊断腿数据集，仍然是可以做出来第一层次的降维聚类分群，如下所示：

缺胳膊断腿数据集的第一层次的降维聚类分群

对于正常数据集，如下所示：

正常的第一层次的降维聚类分群

因为基因齐全，所以可以把髓系里面的处于细胞增殖期的小亚群都独立出来。

但是，总体上来说，这两个数据集做出来第一层次的降维聚类分群居然都是符合要求的，文章使用的是tsne的展现方式，如下所示：

文章使用的是tsne的展现方式

可以看到，从细胞比例考虑，同样的是T细胞最多，髓系其次，然后肿瘤细胞非常稀少。

这就很有意思了：

单细胞转录组数据我们需要追求基因数量的尽可能多吗？
是不是其它平台，比如BD虽然在基因数量上面会逊色于10X，但其实也并不重要呢？

学徒作业

去gencode数据库拿到最新的人类的gtf文件，仅仅是挑选蛋白编码基因即可，约2万个，然后把基因名字按照字母顺序排好，取前面的三分之一，对它进行一些基因分布特征的检验，比如是否集中于某条染色体，或者其它一切你能想到的检验。

文末友情推荐

与十万人一起学生信，你值得拥有下面的学习班：

赞 (0)

单细胞Marker基因可示化包Nebulosa

与传统的转录组测序相比,单细胞测序技术噪声很大,使得单细胞转录组数据包含大量的dropout事件(导致基因表达量为0或接近0),即使是一些标记(Marker)基因也有可能表达量很低.当在使用其对聚类的 ...
《遗愿清单》｜如果生命只剩下一年，你有哪些想做的事？

如果说,爱在记忆消逝前, 是一对老年夫妻虐狗的旅行, 那么,遗愿清单就是两个老年挚友的遗愿旅行. 这两部关于死亡的电影我都很喜欢. 如果生命只剩下一年, 你有哪些想做的事? 生命的意义是什么? 你活 ...
金国造就“靖康之耻”，看南宋是如何报复，700万金人只剩下10万

鉴证历史挖掘历史真相,找寻千百年前的奇闻逸趣!探索历史真相.还原史实本身!带你一起回味经典历史!让我们一起鉴证历史! 公众号 [来源:历史君 ] 宣和七年即金天会三年(1125年)八月,金朝名将完颜 ...
这个大洲曾有34个社会主义国家, 现在只剩下一个, 而且很发达

从世界历史来看,二战后,苏联模式的快速成功,苏联短短几年内成为超级大国,让世界看到了苏联模式的强大生命力.于是世界社会主义国家如雨后春笋般的产生,现在我们熟知的有东欧十几个社会主义国家,还有东亚.东南 ...
一位年仅48岁的省级干部，在医院查出肺癌，只剩下6个月的寿命，家人们正抱头痛哭，可他却拉着老婆跑去个地方，4年后，这人依然活的好好的。这地方您家附近也有，就是公园，他每天来到这晒太阳、跑步锻炼，身体状

游史记发布时间:2021-04-30 12:19:27 一位年仅48岁的省级干部,在医院查出肺癌,只剩下6个月的寿命,家人们正抱头痛哭,可他却拉着老婆跑去个地方,4年后,这人依然活的好好的.这地方您 ...
娱乐圈最穷巨星，没豪车也没别墅，只剩下最朴素的80多所希望小学

娱乐圈最穷巨星,没豪车也没别墅,只剩下最朴素的80多所希望小学在娱乐圈中,一般比较有的名气的明星基本都会对公益有所关注,一方面也是贡献自己的力量,毕竟是社会的公众人物:另一方面当然也是想树立好自己的 ...
拿走脏话，我们就只剩下拳头和枪了

美国斯坦福大学英语文学博士梅丽莎·莫尔在其<脏话简史>一书中说过:"拿走脏话,我们就只剩下拳头和枪了." 在莫尔看来,脏话是一个独特的棱镜,透过它可以了解历史,人们骂人 ...
生活不止眼前的苟且，但却只剩下了苟且

早上,看到河两岸的桃花开的正艳,忍不住停下脚步,拿起手机"咔咔"拍下几张美照,留下这晚春的最后一抹倩影. 在这暖风吹绿杨柳岸,桃色艳艳惹人怜的美好季节,我们却只能放弃蠢蠢欲动,想一 ...
熊芳 || 我只剩下两个伤感的词

新诗选刊封面人物熊芳,女,87年生,湖南桃源人,曾参加<人民文学>第五届"新浪潮"诗会,组诗见于<人民文学>& ...
苏联鼎盛时期的7万辆坦克装甲车，如今只剩下1万辆，战力不到三成

曾几何时,苏联的钢铁洪流,是西方国家最为忌惮的东西.鼎盛时期的苏联,一次普通的演习,就能调动上万辆坦克出战.而这一次次演习对西方来说,无异于心灵上的打击. 然而,正所谓好汉不提当年勇.1991年苏联解 ...