胃癌类器官
写在前面
你现在看到的是文献俱乐部2019年笔记分享第一弹,我将会在春节7天连续分享,目录如下:
2019年2月份第1周(总第53周)胃癌类器官
2019年2月份第2周(总第54周)测173个成年人的大脑的102个基因
2019年2月份第3周(总第55周)2.5万汉族人的GWAS乳腺癌风险基因
因为学业需要,我阅读的大量文献都是NGS组学相关,所以会涉及到很多数据处理,而这些文献基于的生物信息学数据处理技巧,我都在过去的5年里以各种形式分享讲解过,也有系列视频,希望你可以在方便的时候再次学习一遍,查漏补缺。也欢迎推荐给有需要的朋友
学习笔记目录
3.一万人陪你学习GEO数据库挖掘知识(公益视频听课笔4.记分享)
……期待有你……
如果,你不仅仅是对NGS组学应用文献感兴趣,也欢迎加入我们文献阅读小组分享自己的主页领域文献。
今天是大年初五,给大家带来的是胃癌类器官,希望你能学到知识。
值得注意的是,这篇文献其实我很久之前就发布过解读,而且还录制视频了,见:
2019年2月份第1周文献分享(总第53周) 胃癌的类器官研究(附视频)
文章发表于stem.2018.09.016,标题是:A Comprehensive Human Gastric Cancer Organoid Biobank Captures Tumor Subtype Heterogeneity and Enables Therapeutic Screening 本研究主要是完成了一个 a primary gastric cancer organoid (GCO) biobank ,包括34个病人的63个部位,主要是:
normal, dysplastic, cancer, and lymph node metastases
而且通过形态学,WES和RNA-seq数据说明了其研究团队构建的类器官可以比较好的模拟其对应的肿瘤,包括 regional heterogeneity and subclonal architecture ,即使是长期培养的类器官也是如此。
值得注意的是在作者发表这个研究之前,已经有两个关于胃癌类器官的研究了。
We performed exome and transcriptome sequencing of 46 tumor organoids derived from 34 patients, encompassing 4 EBV, 5 MSI, 14 intestinal, 7 mixed, and 4 diffuse type GCs.
也就是说有 17个病人的normal细胞培养得到的类器官,而且有部分病人是培养了多个类器官。
Gastric cancer (GC)背景知识
2014年 7月23日,《自然》(Nature)杂志在线发表了一项重要研究发现:作为美国癌症基因组图集(TCGA)计划的一部分,研究者通过对295份原发性胃癌样本进行分子评估,鉴定出了4种胃癌分子亚型。研究者认为,这将为胃癌患者分层和靶向治疗临床试验提供广阔的应用前景。
TCGA研究者发现的4种胃癌分子分型具体如下:
①爱泼斯坦-巴尔(Epstein-Barr)病毒(EBV)阳性型肿瘤:约占胃癌的9%,表现为较高频率的PIK3CA基因突变和DNA极度超甲基化,以及JAK2、CD274(也称PD-L1)和PDCD1LG2(也称PD-L2)基因扩增。
②微卫星不稳定(MSI)型:约占22%,表现为重复DNA序列突变增加,包括编码靶向致癌信号蛋白的基因突变。
③基因稳定(GS)型:约占20%,其组织学变异弥漫且丰富,RHOA基因突变或RHO家族GTP酶活化蛋白基因融合现象多见。
④染色体不稳定(CIN)型:此类肿瘤占胃癌的比例近一半,表现为显著异倍体性及受体酪氨酸激酶的局部扩增。
而且它们的分子特性大不一样,比如:
enrichment of RNF43 and ARID1A mutations in MSI
ARID1A and PIK3CA mutations in EBV
TP53 mutation and oncogenic amplification in intestinal type (CIN)
CDH1, RHOA mutation, or ARHGAP fusion in diffuse type (GS) GCs.
但是呢,GC的细胞系不好,缺点太多,所以作者的研究团队才致力于培养类器官,为精准医疗添砖加瓦!
注意一些简称:
AO, organoids from normal antrum;
AF, normal antrum frozen tissue;
BO, organoids from normal body;
TO, tumor organoids
TOL, tumor organoids in long-term culture;
TF, paired tumor frozen tissue
T2O, tumor organoids from a second region.
关于EBV latent genes
文章里面提到了:EBV latent genes (EBERs, EBNA1, and LMPs) and lytic genes
EB病毒 (Epstein-Barr virus,EBV)是Epstein和Barr于1964年首次成功地将Burkitt非洲儿童淋巴瘤细胞通过体外悬浮培养而建株,在性病医院临床上并在建株细胞涂片中用电镜观察到疱疹病毒颗粒
人体感染EBV后能诱生抗EBNA抗体,抗EA抗体,抗VCA抗体及抗MA抗体。已证明抗MA抗原的抗体能中和EBV。
(EBV)潜伏膜蛋白2(IMP2)中富含T、B细胞多表位肽段基因
鼻咽癌中EB病毒编码的LMP1调控mTOR信号通路
实验纳入的测序数据
这些数据都在 EGAS00001003145 需要申请才能下载重新分析,可以看到是130个WES数据和131个转录组数据,详情如下:
从实验设计的角度来说,这个课题组做的很好。
类器官的肿瘤突变全景图
有趣的是,这里作者没有展示其培养的类器官与其每个类器官对应的肿瘤的somatic的SNVs的overlap情况,而是直接展示那46个类器官的WES的突变情况,这里作者选择的是Somatic mutation SNV - Strelka 流程,结果如下:
作者给出的描述是,这些类器官来源的癌症病人的亚型与其测序获得的突变情况是吻合的。
然后作者使用了FACETS算法
来计算类器官的WES数据的CNV情况
,如下:
也是描述了一下这个CNV是合理的,比较奇怪的是这样的数据展现在正文,但是却把类器官与癌症的比较放在附件,而且把突变的全局overlap情况避而不谈。
类器官能较好的模拟其对应的癌症
重要的是数据是 Oncoplot of somatic cancer driver alterations in 46 gastric cancer organoids and their
corresponding 44 frozen tumor tissue, 如下图:
看得出来作者为了凑成这样的图也不容易,只能是挑选重要的基因来展示,而且对于那些肿瘤纯度过低的病人来说,也得不到较好的一致性。
这个时候我非常怀疑,不同实验室所谓培养得到的类器官的稳定性,可靠性了!!!但是类器官本身是学界大佬提出来的,而且是NCS级别的工作,年度技术,应该不会跟那个心肌干细胞那样尴尬吧。
类器官长期培养仍然可以保持病人的肿瘤突变特性
比较了类器官在长期培养工程中的somatic变异位点的变化,韦恩图显示如下;
很明显可以看到,TO和TOL几乎没有变化,也就是说长期培养不会导致肿瘤类器官新的突变的产生。
当然,作者还秀了另外一个维度,CNV和VAF的,也是说明TO和TOL几乎没有变化,如图:
这个数据结果就非常理想了,很多时候把同样的DNA材料建库两次测序得到的结果一致性其实都还没有他们这样的TO和TOL要好。
转录组表达数据
首先可以看到所有病人的类器官的转录组表达量是符合TCGA数据库规则的,如下:
作者之所以挑选这些基因集的这些基因来进行展示,是基于其对GC这个癌症的背景知识的理解。
类器官及其对应的原位癌症样品的表达量差异主要是类器官表达量下降的很严重,近3000个显著下调基因却只有区区41个上调,如下图:
很明显看到类器官和肿瘤样本是很容易区分开来的,所以可以使用combat来去除这个组间差异。
第一轮combat去除批次效应,发现有20个类器官成功的与其对应的原位肿瘤聚类啦,但是也有21个失败了,也发现21个失败的类器官肿瘤纯度显著低于那20个成功的。如下图:
对剩下的21个类器官的表达矩阵进行进行第而轮combat去除批次效应,发现又有8个可以聚在一起啦。
为了说明类器官在培养的过程中并没有造成转录水平的变化,作者展示了同一个病人的不同培养时间的类器官的表达量相关性散点图,如下:
作者也对RNA-SEQ数据找了变异位点,Mutation analysis of the RNA sequencing (RNA-seq) data also serves to validate mutations detected by exome sequencing (Table S4).
生信分析流程
本文关于生物信息学分析部分的参数及流程列的非常详细!
首先看WES数据分析的文字描述,如下:
然后看其流程图,主要是软件:
当然,也有详细参数:
视频讲解在:https://www.bilibili.com/video/av32774725 【生信技能树】生信小技巧第二季