纯生信新冠思路:单细胞测序分析口腔粘膜ACE2表达
今天跟大家分享的是2020年02月24日发表在International Journal of Oral Science (IF=2.75)杂志上的文章High expression of ACE2 receptor of 2019-nCoV on the epithelial cells of oral mucosa。在文章中作者基于TCGA和FANTOM5 CAGE公共数据库发现ACE2可以在口腔粘膜呈现高表达,并通过单细胞转录组数据进一步验证ACE2高度富集于舌头的上皮细胞,这些发现为为牙科临床实践以及日常生活中的预防策略提供了证据。
High expression of ACE2 receptor of 2019-nCoV on the epithelial cells of oral mucosa
2019-nCoV ACE2受体:口腔黏膜上皮细胞中高表达
一. 为什么要研究ACE2?
答:ACE2是2019-nCoV的主要宿主细胞受体,它在病毒进入细胞介导感染发挥着至关重要的作用。
1. ACE2在人体哪些部位,这些部位就可能成为病毒攻击的目标。
2. 因此明确ACE2的组织分布,有助于判断病毒的可能致病机制,为临床治疗提供理论指导。
二. 分析流程
三. 结果解读
1.基于Bulk RNA-seq数据发现口腔粘膜组织表达ACE2
作者从TCGA数据库中获取13种器官癌旁组织(695例)的RNA-seq数据以进一步探索ACE2在不同器官中分布情况。图1a显示ACE2在13种器官中均表达(包括口腔),且表1更加详细展示了不同器官的样本数量,ACE2的平均表达量及标准差。此外,作者通过另一个公开数据库「哺乳动物基因组cap分析的功能注释(FANTOM5 CAGE)」验证口腔粘膜中可以表达ACE2(图1b)。
为了进一步探索在ACE2在口腔中的表达部位,根据TCGA的临床信息将口腔组织划分为舌体(Oral tongue),舌根(Floor of mouth),舌基底部(Base of tongue)和其他部位(Other sites)。图1c展示了ACE2在以上4种口腔部位的表达情况。此外,相比其他(除舌体外),舌体(Oral tongue)具有更高表达量的ACE2,作者表明可能由于样本量过小导致统计学上无差异(P=0.062)。
图1.基于公开数据库分析Bulk RNA-seq
2.基于ScRNA-Seq数据发现ACE2高表达于舌头中上皮细胞
利用独立数据的单细胞转录组数据进一步鉴定和确认表达ACE2的细胞组成和在口腔中的比例。通过10× Genomics进行对四名患者的组织样本进行单细胞捕获,进一步数据质控和细胞过滤后得到22,969个细胞,并鉴定了7种细胞类型(图2a)。包括上皮细胞(marker基因包括SFN,KRT6A和KRT10),成纤维细胞(marker基因包括FAP,PDPN,COL1A2,DCN,COL3A1,COL6A1),T细胞(marker基因包括CD2,CD3D,CD3E和CD3G),巨噬细胞(marker基因包括CD163,CSF1R,CD68和FCGR2A),肥大细胞(marker基因包括包括CMA1,MS4A2,TPSAB1,TPSB2),B细胞(marker基因包括SLAMF7,FCRL5和CD79A)和内皮细胞(marker基因包括PECAM1,VWF和ENG)。图2b以热图形式进一步展示了7种胞的主要marker基因的表达。
通过ScRNA-Seq数据,作者验证了ACE2在口腔组织(0.52%为ACE2-阳性细胞)中表达,且ACE2在口腔舌中的表达高于颊和牙龈组织(口腔舌中95.86%为ACE2-阳性细胞)(图2c-d)。图2e显示ACE2在不仅上皮细胞中高度富集(1.19%),在其他细胞中均有表达,如T细胞(<0.5%),B细胞(<0.5%)和成纤维细胞(<0.5%)。此外,图2f表明约93.38%的ACE2-阳性细胞为上皮细胞。以上结果表明,ACE2可以在口腔粘膜上表达,且该受体在舌头的上皮细胞中高度富集。。这些发现初步解释了口腔是2019-nCoV感染易感性潜在高风险的基本机制,并为牙科临床实践以及日常生活中的预防策略提供了证据。
图2.基于独立队列的口腔ScRNA-seq分析
四. 拓展延伸
GEPIA[1]给我们带来不少启发,既然ACE2是2019-nCoV的主要宿主细胞受体,它在病毒进入细胞介导感染发挥着至关重要的作用,那么ACE2在肿瘤和正常组织中的表达量是否有所不同呢?
ACE2在肿瘤和正常组织中的表达量如下:
除了肿瘤和正常组织这一比较之外,男性和女性?亦或者是不同组织之间的比较也可以展开系列研究。
此外,根据不完全统计,截止2020年3月3日[2]:
发表在5分以下期刊上的论文总共约有600余篇,这类论文多数是没有第一手临床样本和资料,通过建模进行疫情预测或者对前期的研究进行拓展和剖析
发表在5-10分期刊上的论文约有150篇,这类论文拥有第一手临床资料,通常是对病例的临床特征进行表征,包括影像学检测和核酸判定;
发表在10-30分期刊上的论文约有40篇,这类论文相对来说就比较困难,不仅需要第一手临床样本进行鉴定和检测,而且还需要一定的实验进行验证;
发表在CNS主刊上的论文有8篇,CNS主刊类文章主要是一些病毒性专家或者结构生物学大牛表的,研究内容较为全面,而且研究比较深入,难度系数很大。
发表在Lancet和NEJM期刊上的论文有41篇,大部分从流行病学和病理医学进行陈述。这类论文多是各国疾控中心的专家或者传染病领域的顶级大牛发表,不仅要第一时间获得临床资料,而且还要对疫情的发展和防控做出一定的预判。
如何在这波热度还未退去之前,利用现有的资源做一些工作呢?建议大家可以从如下两个方面入手:
生信数据分析
具体而言,可以从开源数据分析不同健康组织中ACE2”的分布,或者是从某一个特定的部位,比如说肾脏,来解释一些临床中新冠治疗遇到的问题;
如果能拿到一些小样本的数据送去做RNAseq,然后拿回来分析;不仅可以做一些轻症重症的比较,还可以横向比较自己的样本和其他地区的样本的区别;
此外,之前有文章[3]指出,分了不同的新冠家族,大家也可以随着这篇文章的数据进行进一步的分析;
临床数据分析
上面的分析也说得很详细了,大型数据都在大牛或者CDC手里;我们可以做什么呢?比如说观察到一些罕见部位的感染,取得详细的影像资料,可以考虑写一篇letter或者是case report;还可以比较不同亚组的疗效,疾病严重程度和其他检查检验结果(血常规,血生化,炎性指标,病理组织中特定蛋白的变化等)
顺便说一下,AJE润色的公司在免费为2019-nCoV研究论文进行润色或者是翻译!
AJE已免费润色或翻译128篇2019-nCoV研究论文
参考引文