科研 | Gut:通过单细胞RNA测序分析原发性胃腺癌的转录异质性(国人佳作)
编译:小北,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
论文ID
原名:Dissecting transcriptional heterogeneity in primary gastric adenocarcinoma by single cell RNA sequencing
译名:通过单细胞RNA测序分析原发性胃腺癌的转录异质性
期刊:Gut
影响因子:17.943
发表时间:2020年6月12日
作者:刘彦教授和刘炳教授
单位:中国人民解放军总医院第五医学中心
DOI:10.1136/gutjnl-2019-320368.
背景介绍
肿瘤的异质性包括形态学的异质性和基因组的异质性,由于其具有准确诊断和个性化治疗的一系列挑战,仍然是肿瘤研究的一个热点。胃腺癌(GA)是异质性肿瘤的一个典型代表,其典型特征是多样的亚型和临床表现。近年来,形态学异质性很长时间来一直是一些肿瘤级别和预报分类系统。依据结构性非典型腺和GA粘膜的分化程度,Lauren分类方法将GA划分为肠型和弥散型。后者又被描述为中度组织学病例。GA特异性的形成腺体结构并且表现出不同的分化程度,逐步通过连续病理阶段发育,例如慢性胃炎(CG)、萎缩、肠上皮化生和异型增生。弥散型的GA表现出低分化的转态,以低分化的浸润生长为特征,表现出侵袭行为和差的预后。另一个基于组织病理学导向的WHO分类将GA诊断划分为乳头状、管状的、黏蛋白的以及极少粘连性癌。尽管这些方法应用直接简单,病理结果由于客观判别和复合体背景因素(幽门螺杆菌、人类疱疹病毒第四型)而变化。此外,与胃癌生物学行为相关的表型表达的分子基础尚不明确,限制了对肿瘤异质性的分析。
高通量测序技术的发展加快了对人类肿瘤分子图谱的研究步伐,此外已经证实在分子水平研究肿瘤的行为对于分析异质性非常重要。截止目前,大规模基因组和转录组的研究已经描述了GA在基因层面和表观层面的异质性,同时TCGA、新加坡和亚洲癌症研究小组亚型等分子图谱的研究进一步拓展了对GA的基础研究,TCGA基因型提出一个新的分子分类,将GA划分为四个亚型:EBV-阳性的肿瘤、微卫星不稳定肿瘤、基因组稳定的肿瘤以及染色体不稳定的肿瘤。本研究系统阐释了四个亚型的分子特征并且首次揭示EBV感染是GA划分的重要因素。然而这些研究依赖于整体组织的数据并且遮挡住了不同亚群之间的分子特征,这将限制对肿瘤异质性捕获的能力同时阻碍了对GA的准确诊断。
单细胞RNA测序(scRNA-seq)技术的发展以及微流体技术能够同时表示数以万计细胞的转录水平。该方法可以对生物组织中细胞特征进行无差别分析并且能够广泛的应用于包括肿瘤免疫异质性在内的肿瘤生态系统的分析。另一方面,在放大内窥镜中靶向活组织检查仍然是GA诊断最准确的方法,可以让临床医生观察病变并且获取在富集肿瘤细胞的组织。单细胞转录组实验结合内窥镜活检将促进对GA病理的准确诊断。
在本研究中,研究者通过scRNA-seq对GA进行了无差别的系统转录图谱绘制,发现了不同的GA病理亚型。单细胞的研究旨在揭示GA异质性的分子图谱,对于GA的临床诊断和预后非常重要。
结果
不同GA类型的单细胞转录图谱
为了研究各种病变的胃粘膜中的细胞群体以及相关的分子特征,5个肠组织学的GA样本(感染EBV)、3个混合组织学的GA样本、1个弥散型组织学的GA样本以及3个非癌样本进行了scRNA-seq实验(图1A、B)。已登记的病人全是最新被诊断的,并且没有其他肿瘤。病人在手术前均未进行化疗或者放疗。这些参与者的临床特征包括幽门螺杆菌感染、EBV感染以及病理特征和依据Lauren对肿瘤分类(表1)。在移除低质量的细胞后,27,677个细胞进行生物学分析,这些细胞内中位值基因为1227,每个细胞含3809个转录本。经过常规的基因表达和PCA分析后,研究者利用基于图形的集簇分析将细胞划分为14个集簇。这些集簇通过标记基因发现有9个熟知的细胞系(图1C-E):上皮(10,411个细胞,37.6%,由EPCAM、KRT18、KRT8标记);腔壁细胞(215个细胞, 0.8%,由ATP4A标记);内分泌细胞(486个细胞, 1.8%,由CHGA标记);B细胞(6131个细胞, 22.1%,由MS4A1和CD79A标记);T细胞(6819个细胞,24.6%,由CD2、CD3D、CD3E标记);巨噬细胞(1053个细胞, 3.8%,由CD14标记);肥大细胞(527个细胞,1.9%,由CPA3标记);成纤维细胞(1116个细胞,4.0%,由ACTA2和COL1A2标记);内皮细胞(919个细胞,3.3%,由ENG和VWF标记)。每个细胞系的比例在不同的样本中是变化的(图1F)。
癌和非癌上皮的分类
为了区分癌性上皮和非癌性上皮,研究者对TCGA胃癌数据库肿瘤和正常组织之间每个细胞差异表达基因的初始恶性和非恶性进行评分。假定的肿瘤和非肿瘤上皮细胞利用K均值集簇算法起始分值进行了确定。由于包括非上皮细胞,TCGA整体组织的起始识别是有差别的。研究者进一步在癌和非癌上皮细胞中确定了差异表达的基因,重新计算了分值并进行分类。研究者重复试验直到结果稳定,最终确定了5,635个癌上皮细胞和4,776个非癌上皮细胞(图2A-C)。一组肿瘤特异的基因(图2D-F)包括CLDN4、CLDN7、TFF3、REG4在癌上皮中是高表达的。非癌上皮中的细胞高表达与胃粘液和消化酶分泌相关的标记基因,例如MUC5AC、GKN1、PGC、LIPF(图2D-F)。为了揭示癌上皮与非癌上皮的分子差异,研究者进行了基因的富集分析(GSEA)。与非癌上皮相比,癌上皮富集的通路主要是肿瘤坏死因子-α/NFKB、KRAS以及白介素-6/Janus激酶/信号转导/转录激活因子(图2G),同时也有癌症发生发展过程中的关键富集基因,如MYC靶基因以及EMT、血管生成(图2G)。
从非肿瘤胃粘膜上分离得到的96.9%的上皮作为对照被划分为非癌组,证实了研究方法的可靠性。研究者发现从切片肿瘤样本中得到的上皮约79.7%(5367/6734)被划分为恶性的,而手术切除样本中只有29.4%(224/762)的上皮是恶性的。这一差异提示内窥镜活检对肿瘤恶性的诊断更加准确。每个样本中癌上皮和非癌上皮的比例在附录S3D中。
研究中同样在每个细胞中依据整个染色体间隔的平滑表达谱定义了拷贝数突变(CNVs)。计算机的方法已经在单细胞分析中应用于确定肿瘤细胞。正如所料,在非癌细胞中仅4/4776表现出异常的CNV信号。然而只有25%的癌细胞表现出高水平的CNV。这些发现支撑了TCGA分析的结果,通过外显子测序大部分GA样本具有较低的CNV信号提示基于CNV信号确定肿瘤细胞不适用于GA。
转录图谱发现在主要细胞、颈部细胞和胃癌前化生中的关系
图3 非恶性上皮细胞簇和细胞类型之间的潜在转移。
GA肿瘤细胞转录图谱的异质性
研究者对5635个肿瘤细胞进行了集簇分析发现五个主要的细胞亚群(C1-C5)。依据Lauren的组织病理学说类型以及背景因素(EBV感染)进行分组(图4A)。研究者同样观察到C1-C5的比例在9个病人中变化(图4C)。C1构成了弥散样本类型(DGC)96.9%的肿瘤细胞,而C2来自97.1%的肠型样本(IGC)(图4B),C3包含混合型(MGC)和肠型样本的混合体(图4B),C4主要来自一个肠型的GC样本(IGC3),C5包含EBV+病人的细胞(IGC5)(图4B)。通过比较基因表达图谱(图4D)研究者发现C1/C2/C3与Lauren分类中三个景点的亚群一致,与C1/C2/C3相比C4/C5是两个新的细胞群具有不同的分子特征(图4A)。
GA中经典Lauren组织病理学的分子特征
研究者接下来探究了C1、C2以及C3中科的分子特征(图5A),C1高表达在胃上皮细胞中广泛表达的一些基因,如CLDN18和TFF2(图5B),但是这些基因很少在C2中被检测到。相反,C2中表现出类似小肠的分子特征,由肠细胞标记物APOA1和FABP2广泛表达支撑(图5C),这些结果也由KRT20和CLDN18的免疫印迹确定。C3并不表现出明显的分子特征,但是部分表达C1和C2的标记物,提示它作为C1和C2的一个中间物,而不是C1和C2的混合。此外,研究者观察到分化的分值在三个亚群中变化(图5D)。PHGR1、KRT20和MDK的表达水平在C2中表达最高,在C3中适中,在C1中最低(图5E)。这些结果说明C1代表未分化状态的亚群而C2代表分化的恶性细胞,具有成熟肠上皮细胞的特征,C3代表C1和C2之间的中间态。研究者的结果解释了在单细胞水平不同Lauren组织病理学类型独特的分子特征。
GA-FG-CCP的转录图谱
C4中肿瘤细胞主要来自肠型GA样本中IGC3(图4C)。H&E染色结果说明肿瘤位点定位在胃底腺,主要由分化相当的细胞构成。研究者的scRNA-seq数据表明C4广泛表达主要细胞的标记物例如LIPF、PGC以及PGA3(图6B),并且表现出适中的分化分值(图5D)。研究者在C4中确定了一些特异表达的基因,一些报道RNF43参与Wnt/β-catenin信号通路(图6B),GO富集分析证实在C4中显著的基因在调节生长和Wnt/β-catenin信号通路中富集(图6C)。免疫荧光染色实验表明这些细胞在胃腺基底部占主导地位并且与MUC6和PGA3高度共表达(图6D)。C4中组织病理学说的结果以及表型表达图谱与GA-FG-CCP的细胞特征高度一致。
为了进一步确定GA-FG-CCP的结果研究者探究了是否GA-FG-CCP存在于公共转录组数据库中。应用“非监督非负矩阵分解(NMF)”分析TCGA STAD数据组中肠型病人的86集簇。在NMF确定的四个集簇中,研究者发现集簇3(n=11)高表达C4亚簇特异的基因,但是很少表达肠细胞标记物(图6E)。C4特异基因的平均表达在集簇3中也表达最高(图6F)。有趣的是,Wnt/β-catenin信号通路中的关键信号转导分子CTNNB1在集簇3中显著高表达(图6G)。与GA-FG-CCP分子特征相似的集簇利用新加坡数据组也被确定。研究者在GDC数据库中进一步检测了GA-FG-CCP的组织病理学图像。有趣的是,大多数肿瘤组织样本(n=10)其典型的特征是分化的基底腺柱状细胞,这与IGC3中的组织病理学结果一致。综上,研究者在单细胞水平发现GA-FG-CCP的分子特征并且证实其在整体转录数据库中存在,进一步加深了胃癌分子和细胞多样性的理解。
EBV+的肿瘤细胞高度表达免疫免疫的关键基因
C5亚簇几乎包含EBV感染肠型病人IGC5中全部的细胞(图7A、4C)。C5中大多数的细胞具有特异的分子学特征:高表达Ly6家族成员例如LY6K以及MHC-II的基因(HLA-DPA1和HLA-DPB1)(图7B),这些基因都与免疫反应紧密相连。GO富集分析也表明这一亚群表现出高水平的免疫相关信号通路,例如IFN-α反应、抗原加工和呈递(图7D),提示在免疫细胞和肿瘤细胞之间存在细胞与细胞之间的交流。免疫染色实验证实了HLA家族II分子与LY6K在EBV+中表达水平更高(图7E)。TCGA整体测序结果也表明HLA家族II分子在EBV+样本中高表达(图7G)。此外,研究者比较了在EBV+和EBV-病人中B细胞的细胞周期,发现EBV感染的B细胞在IGC5中具有更多的周期细胞(S期和G2M期)(图7H)。总之,研究者发现了EBV感染GA病人恶性细胞的特异分子特征,强调了EBV诊断对于GA组织学分型的必要性。
更多推荐
1 高分综述 | Trends in Biotechnology: 单细胞分辨率下利用空间转录组揭示器官分子结构(国人佳作)