不同组织器官的小鼠内皮细胞的单细胞转录图谱超详细解读
希望所有学员都可以站在生信技能树的舞台上发光发热!
文献解读:
小鼠内皮细胞的单细胞转录图谱
摘要
各种组织中上皮细胞(Endothelial cells, EC) 的异质性依然没有被完全解析。研究构建了来自于11个小鼠组织中的超过32000个单上皮细胞的转录组数据的图谱,并识别到78个上皮细胞亚集,包括健康组织中的==Aqp7+小肠==(肠道)==毛细血管及健康组织中的生成血管==血管生成==EC细胞。来自于大脑/精巢==睾丸==,肝脏/脾脏,小肠/大肠以及骨骼肌/心脏的上皮细胞表达部分成对的基因==成对表达部分重叠marker基因==。动脉,静脉以及淋巴管的上皮细胞中在更多的组织中共享的标志物比异构的毛细血管还要多与异质性毛细血管ECs相比,动脉、静脉及淋巴管ECs在更多的组织共享更多的marker基因。来自于不同血管床(动脉,毛细血管,静脉,淋巴管)的ECs展示出不同组织之间的转录组相似性,但导致上皮细胞异质性的是组织类型,而不是血管类型。代谢转录组分析解释了ECs相似的组织分类的现象以及单独的组织中组织之间和血管床之间的ECs以一种组织类型依赖的模式展现出的异质性代谢基因的特征。EC图谱的分类使得在公共scRNA-seq数据集中识别EC亚类成为可能,并提供了一种有效的发现工具以及资源价值。
背景介绍
上皮细胞组连接了血管,对于氧气的运输,免疫细胞运输以及将垃圾废物送入或者移除组织中来说是非常重要的。然而,单个组织中的ECs在单个细胞水平上是否存在差异,以及差异的程度如何,以及在特定的血管床中的ECs在不同的组织中是否是异质的依然未知。一些单细胞RNA测序(scRNA-seq)的研究已经在单个组织中研究过EC的异质性。最近,多个小鼠组织的单细胞图谱已经对ECs进行了剖析,但是没有将关注EC异质性作为主要目标。多个组织的一个单细胞EC转录组图谱可以促进我们对组织内部和组织之间的EC差异性的理解。因此,本研究从11个成年小鼠的组织中提取scRNA进行测序。为了增加资源的价值,我们将本研究中用到的数据集公开到https://www.vibcancer.be/software-tools/ec-atlas.
结果
EC图谱的构建
为了高效从多种小鼠的组织中分离出ECs,我们优化了EC的分离和纯化流程(下图A)。一共对39182个细胞进行测序,而且每个细胞平均获得86766个reads,测序饱和度为93%,每个细胞平均有1308个基因。==对所有细胞进行降维聚类分群后,根据marker基因的表达保留ECs(Pecam1, Cdh5),同时根据marker基因剔除污染的SMCs(Acta2), Fibroblast(Col1a1)及红细胞(Hba-a1, Hba-a2, Hbb-bs)。最终获得了来自11个组织的32, 567个ECs(测序饱和度为83%)
来自于不用组织中的EC表现出显著的转录组异质性(下图B)。
通过基于秩积的方法==(rank product-based method==)来识别每个组织中富集的EC marker基因。发现前10个标记基因的热图分析揭示了来自于每个组织中的不同特征,除了比目鱼肌和指伸长骨骼肌,表达出重叠的标记基因Top10 marker基因的热图分析显示,除了比目鱼肌和趾长伸肌骨骼肌表达重叠的marker基因外,每个组织具有不同的ECs 签名集(下图C)。
值得注意的是,其中的一些top marker基因仅仅在来自于单一一种组织上皮细胞中表达(Pglyrp1, Lcn2, and Tmem100分别在大脑,睾丸以及肺中表达),而其他的EC标记基因(Fabp4, Aqp7, Nkx2-3)在一个==两个==或者多个组织中保守表达(下图D)。大部分的标记基因都会在来自于特定组织中的==很大一部分==上皮细胞表达。来自于一种以上的组织的上皮细胞的共有标记基因的表达引出了一个问题,这些ECs基因是否在表型上相关。
血管上皮细胞组织间异质性
为了研究不同组织之间的EC异质性,使用层次聚类与多尺度自举采样来进行相互补充。这个分析揭示了来自于特定组织中的上皮细胞(精巢和大脑,干仗==肝脏==和脾脏,小肠和结肠,骨骼肌和比目鱼肌以及EDL)在进化树图==树状图==中聚到了一起,这表明转录组特征的部分重叠(下图A)。
为了解释EC组织分组的现象,我们使用从MSigDB中挑选出来的615个血管相关的基因集列表来进行基因集差异分析==(GSVA==)。排名前10 表达的基因集的热图分析揭示了来自于这些组织中的上皮细胞高表达涉及到不同生物过程的基因集(如下图B,只截取了全图的部分)。
转录因子网络分析
为了研究驱动不同上皮细胞表型的差异性的潜在分子机制,我们使用了单细胞调节网络推断和聚类(sing-cell regulatory network inference and clustering, SCENIC)。该分析预测,来自于不同组织的ECs上调表达不同的转录因子网络。例如,Foxq1 和 Hoxd9调控子分别在大脑和精巢的上皮细胞表达上调,而肺上皮细胞中则富集了Foxf1网络,骨骼肌上皮细胞中Pparg网络的活性增加(下图C)。
组织内部血管床的异质性
本研究通过基于图像的方法分别对每个组织中的ECs进行亚分类,从而对组织内部的EC异质性进行进一步探究。我们展示了每个组织特异性的EC类群的前20个或者前50个标记基因进行,每个组织唯一分子标识(unique molecular identifiers,UMIs)以及基因的数量,以及每个EC亚群的相对比例。每个组织特异性的EC亚群都被提供了一个特异性的注释(H1代表每个心脏亚群等,如下图所示)。
为了获得不同上皮细胞亚群在血管树上的位置,我们进行了拟时间分析来预测这些亚类的分化轨迹。该分析预测了从大动脉到毛细血管,再到静脉的分化轨迹。为了将EC亚类的 位置与拟时间分化轨迹进行匹配,我们主要关注的是大脑的ECs,因为我们使用了动脉,毛细血管以及静脉的上皮细胞,从大脑上皮细胞的单细胞转录组数据集中进行识别,或者是基于之前已有的研究来进行分析(结果如下图B所示,展示的是脑EC表型的假时间轨迹)。
本研究估算了不同血管床的ECs之间的异同(动脉,毛细血管,静脉,淋巴管),这些血管床由大量的ECs,而且分布在不同的组织中(如下图A所示)。
对于每个组织,我们将所有的类群汇集为以下一些EC表型:(1)动脉ECs(包括大动脉和动脉的EC亚型);(2)毛细血管EC(所有的毛细血管EC亚型);(3)静脉EC(大静脉和静脉EC亚型),以及(4)淋巴ECs(所有的淋巴EC亚型)。两个血管床的ECs表达的基因(毛细血管-动脉以及毛细血管-静脉ECs),以及仅仅局限在一些组织中的ECs,被排除在外(如下图B所示)。
在>=80%的组织中,median rank<35的标记基因被认为是保守的血管床标记。当使用在25%的组织(对应1或2个组织)中发现的median rank 小于20的组织特异性血管床标记物进行分析时,我们发现毛细血管的炎症特异性标记物多于淋巴管。(如下图D所示)
在探究来自于不同组织中的血管床(动脉,毛细血管,静脉,淋巴管)中转录组水平上的相似性时,发现动脉ECs的转录组特征在不同的组织之间是十分相似的,但是不同于毛细血管,静脉或者淋巴管上皮细胞的转录组特征。类似的发现也在毛细血管,静脉以及淋巴管ECs中发现(如下图E所示)。
组织内分析特化的EC表型
在肠道中鉴定到了一部分(5.6%,23.2%)毛细血管内皮细胞,其中涉及甘油和脂肪酸的摄取和代谢的基因转录水平升高(Aqp7, Tcf15, Cd36, Fabp5)(如下图A所示)。
在大脑中识别到一小簇脉络丛毛细血管上皮细胞,其特征为高表达标记基因Plvap。
代谢基因组织之间EC异质性
通过对代谢相关基因的分析,由层次聚类和多尺度自助重采样补充分析方法得到的分析结果与ECs的组织分组结果类似,这与使用代谢基因(第一张图A)与非代谢基因(下面第二张图A)的得到的结果一致,表明代谢转录组特征对ECs的表型分组贡献最大。
讨论
该研究识别到了重要的标记基因,这些标记基因在来自于大脑,精巢以及肺的ECs中大量富集。来自于其他组织中(心脏,比目鱼肌,结肠,肝脏,脾脏,肾脏以及趾长伸肌)的ECs至少共享两个或者更多的重要标记基因。
基于部分重叠转录组特征和共同推断的生物学特征,该提出了一种新的功能或解剖学相关组织(脑/睾丸、肝/脾脏、小肠/结肠和骨骼肌/心脏)的内皮细胞分类。
在所有被分析的组织中,来自每个血管床(动脉、毛细血管、静脉、淋巴)的内皮细胞在Jaccard相似性分析中聚集在一起,这意味着,在整个组织中,来自每个血管床的内皮细胞比来自另一个血管床的内皮细胞更相似。
研究鉴定出了高度特化的EC表型,如肠Madcam1+静脉ECs和Aqp7+毛细血管ECs以及脑脉络膜丛ECs。
作为scRNA-seq分析的另一个表型解读,本研究探索了来自不同组织中不同血管床的ECs是否以及在何种程度上也表现出其代谢转录组特征的异质性。
该研究EC Atlas taxon- omy在小鼠组织公开的scRNA-seq数据集中注释EC的有效性,这不仅为不同组织中不同EC表型的分子特征提供了丰富的资源,而且也为其他数据集中表型未知的EC的识别提供了一个可靠的参考技术。
文末友情推荐
做教学我们是认真的,如果你对我们的马拉松授课(直播一个月互动教学)有疑问,可以看完我们从2000多个提问互动交流里面精选的200个问答! 2021第二期_生信入门班_微信群答疑整理,以及 2021第二期_数据挖掘班_微信群答疑笔记
与十万人一起学生信,你值得拥有下面的学习班: