编译:夕夕,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
导读
RNA测序(RNAseq)是生命科学领域最常用的技术之一,已广泛用于癌症研究,药物开发以及癌症诊断和预后。在各种生物学和技术问题的推动下,RNAseq的技术已从批量RNAseq,激光捕获的微解剖RNAseq和单细胞RNAseq迅速发展到数字空间RNA分析,空间转录组学和直接原位测序。这些不同的技术在临床肿瘤学领域具有其独特的优势,劣势和适用场景。 为了指导癌症研究人员为他们的生物学问题选择最合适的RNAseq技术,作者将讨论这些技术,其特点和在癌症中的临床应用。作者将帮助癌症研究人员了解RNA测序技术的区别并将他们将以应用。原名:Changing Technologies of RNA Sequencing and Their Applications in Clinical Oncology
译名:不断变化的RNA测序技术及其在临床肿瘤学中的应用
期刊:frontiers in Oncology
IF: 4.28
发表时间:2020.4
通讯作者:Xinmin Li,Bin Liu
通讯作者单位: 美国加州大学洛杉矶分校基因组学与生物信息学技术中心病理与实验室医学系;中国医科大学附属肿瘤医院
DOI号:10.3389/fonc.2020.00447
自十多年前开发的RNAseq技术以来,它已经成为生命科学领域中一种流行的基因组学工具并且几乎在各个方面影响了研究人员对基因组功能的理解。超过60%的二代测序项目中都是用了RNA测序,包括全基因组测序,全外显子测序,甲基化测序,染色质免疫共沉淀测序和ATAC-seq。在人类癌症研究中,RNA测序是最常见的研究基因组的技术手段,用于了解人类癌症中转录本变化情况和分子途径的变化。RNA测序主要包含四个关键步骤:总RNA提取,文库构建,测序和数据分析。研究人员所研究的生物学问题和RNA质量将决定所用的文库类型,试剂盒类型,测序类型和测序深度(图1)。
基于研究人员所研究的生物学问题,可以应用两种RNA测序。第一类数字表达谱,目的是通过鉴定差异表达基因,了解其涉及的生物学过程的分子机制或指导诊断和治疗。单端测序技术适用于这种类型的RNA测序分析,通常测序数据量需要达到20-30百万reads。文库制备方法通常采用ploy-A RNA提取法。第二类是转录组测序,他不仅能实现数字表达谱分析的目的,还增加了可变剪接,点突变,新基因和新转录本鉴定等分析内容。转录组分析主要是双端测序,通常使用去除rRNA的文库制备方法。ENCODE指南提供了有关批量RNA测序方法的各种技术细节,可用于参考并将其用作标准,以协助设计临床RNA测序实验。RNA测序技术是用于癌症研究和临床应用的经济高效的工具。如今,RNA测序技术在临床领域主要用于新融合基因的发现,设计panel并诊断融合基因可用于癌症的诊断治疗。使用RNA测序检测与癌症有关的融合基因就是一个很好的例子,该研究采用了近7000个癌症样本检测激酶基因融合。这项研究具有直接的临床意义,因为这项研究发现了很多新颖的激酶基因融合现象。其他几项研究也表明新的基因融合有益于新的治疗手段的开发。例如,全转录组测序发现的新的FGFR基因融合,对治疗具有FGFR融合癌症患者具有重要意义。基于RNA的融合基因panel是转化为常规临床应用的首批RNA测序技术之一。Foundation One Heme是经过临床验证的panel,可用于检测265个癌症中发生基因融合现象的基因,包括FLT3,NPM1,CEBPA,BCRABL1,KIT,IDH2,IDH1,JAK2,MPL,PML-RARA和MLL。通过panel检测到的融合基因和通过靶向DNA测序进行验证。医生可根据其结果确定目标治疗方案,预后和肿瘤亚型分类。另一种临床应用是NEO Genomics提供的Lung NGS Fusion Profile,该应用可检测六个基因。在非小细胞肺癌(NSCLC)中,检测到ALK,NTRK,RET和ROS1的基因融合体的频率分别约为4%,6%,1、2%和1-2%。 带有这种基因融合的患者可能对几种特定的激酶抑制剂有反应。RNAseq的另一个关键临床应用是使用全转录组分析发现生物标志物。 这些生物标志物可用于癌症的诊断,预后和预测。 通过使用微阵列,QRT-PCR和其他经典方法的临床实用性已得到公认,并已广泛用于常规临床实践中。此外,对基于RNAseq和基于微阵列的技术的系统评估表明,与微阵列相比,RNAseq在表征癌症方面表现更好。全转录组分析也可用于指导治疗。在早期的综合临床测序研究中确立了其在癌症中的可行性和临床实用性,该研究涉及患有复发性或难治性癌症的年轻人。这项研究在46%的患者中发现了可行性,其中一些因此改变了治疗方案。 后来,有研究人员证明了转录组数据在表征转移性肿瘤和癌症治疗中的广泛用途。基于RNA测序的分析与基于DNA的分析或其他经典临床方法相比具有许多优势,包括有关碱基对的精确详细信息,检测可变剪接的能力,等位基因特异性表达,新型基因融合,非编码RNA和新型RNA。RNAseq数据将提供有关癌症相关基因改变的更完整视图,并且有足够的证据支持这种观点。例如,RNAseq在一部分乳腺癌患者中鉴定出了BRCA1的转录本,而传统基因组分析却错过了该转录本。有研究人员发现受体酪氨酸激酶(ROS1)基因融合与TMEM106B的新型融合伴侣有关,但标准FISH或PCR方法却忽略了该融合; RNAseq分析发现转化生长因子-β(TGF-β)I型受体(TGFBR1)的种系等位基因特异性表达(ASE)与结肠癌风险增加相关。基于RNAseq的研究还显示,长非编码RNA和miRNA在肺鳞癌和腺癌中具有预后潜力。大量RNAseq仅揭示了所研究组织的平均基因表达谱。 大多数肿瘤包含异质细胞群,包括恶性细胞,免疫细胞,成纤维细胞和血管细胞。 这种异质性不仅存在于来自多个患者的相同肿瘤类型中,而且还存在于来自各个患者的各种肿瘤中。 来自肿瘤组织的平均基因表达谱可能会削弱来自特定细胞类型的真实信号,从而驱动肿瘤发生或对治疗产生抵抗力。 例如,当标记仅在特定细胞类型中存在时,大量RNAseq对生物标记的发现可能具有较低的检测灵敏度。 这一弱点可以通过以下各节中讨论的替代RNAseq技术来解决。目前已经发了很多其他方法来克服转录组测序的弊端。其中最简单的方法就是激光捕获纤维切割转录组测序(LCM-RNAseq)。LCM-RNAseq的关键步骤是对目标细胞进行激光捕获显微切割,接着进行正常的转录组测序,见图2。LCM-RNAseq主要使用FFPE样本,但是FFPE具有提取RNA含量少且质量低的缺点,显微切割步骤还会进一步降低RNA完整性。因此,有必要考虑两个关键因素来优化LCM-RNAseq的流程:1)优化纤维切割步骤来最大化减少RNA的损害;2)使用合适的RNAseq文库构建试剂盒来降低RNA的降解。例如,SMARTer Stranded Total RNA-seq试剂盒。这个试剂盒具有内置的CRIPR/CAS9介导的rRNA消耗步骤,无需独立的rRNA消耗步骤。
由于FFPE样本是临床样本的巨大资源,因此进一步完善和改善现有的LCM-RNAseq方案可能对肿瘤研究产生深远影响。最近,开发了几种新的LCM-RNAseq方法来解决显微切割FFPE样本降解RNA质量的弊端。有研究人员可通过改进预扩增步骤,从10个显微切割细胞中获得可靠的测序数据,可以灵敏的检测肿瘤组织中的细胞异质性。由于技术的限制,LCM-RNAseq在癌症中的应用相对有限。LCM-RNAseq在癌症中的首次应用是在肺癌的正常组织和浸润性腺癌模型中进行的。该研究确定了LCM-RNAseq在六名患者中的初步可行性,其目的是鉴定肺癌进展的生物标志物。最近的几项研究结果,重点说明如何使用LCM-RNAseq数据分析癌症中多种细胞类型特异性基因表达谱。最近有一项研究显示,使用LCM-RNAseq技术分析了人类胶质母细胞瘤(BGM)六个特定组织区室的表达谱。 这些不同的隔室具有相互连接的复杂网络,并创建了一个复杂的微环境,不断发出激活细胞迁移并促进癌细胞存活和增殖的信号。通过从不同的隔室中分离出细胞特异性基因的表达特征,作者发现假性星形胶质细胞中促血管生成基因和途径的过度表达。这些过表达的基因和途径已知可促进GBM中的细胞存活和浸润性生长,迁移以及对癌症靶向疗法的耐药性。有研究人员观察到假性苍白细胞中的生长因子信号通路与肿瘤核心相比有明显的上调。这些数据结果表明,某些分子事件是具有区域特异性,而不同区域的分子具有相关性。这些发现为开发新疗法和改变BGM患者目前的临床管理提供了潜在的意义。尽管LCM-RNASeq可以揭示细胞群体特异性基因表达谱,但它与两个实际问题相关。首先,LCM-RNAseq过程很耗时,一次只能处理少量细胞。因此,与RNAseq处理的106个细胞相比,从10到100个细胞获得的数据通常不太可靠。其次,RNA含量低且降解度高,因此需要更多的PCR循环。这些问题需要通过进一步的技术改进或替代技术来解决。目前已经有很多技术可以进行单细胞转录组测序。Fluidigm C1微流体系统代表了早期的scRNAseq技术之一。该系统在1天的时间内只能处理96个单细胞。 通过使用改进的Fluidigm IFC芯片,可提高到800个单细胞。最近,主要是基于微滴的单细胞测序系统。其中10X Genomics Chromium 是单细胞测序最受欢迎的系统之一。与LCM-RNAseq相比,Chromium 技术可以在一个实验中快速分析多达10000个单细胞基因表达谱。与其他微滴scRNAseq系统相似,Chromium scRNAseq工作流程如图3所示。scRNAseq的第一个关键步骤是从目标组织或培养的细胞中分离出可行的单个细胞。 然后,使用微流体系统生成成千上万个称为GEM的微滴,这些微滴是被油包围的水性微滴。每个GEM的体积约为2 nl,其中包括用于逆转录(RT)的所有必需试剂,还包含与特定80碱基对(bp)寡核苷酸序列的珠子。该寡核苷酸序列具有多个组成部分,包括用于下一代测序(NGS)的衔接子序列(阅读1),用于识别RNA来源的特定于细胞的10x条形码,用于识别和定量独特的mRNA转录物的随机分子标签以及 寡聚-dT mRNA结合引物。细胞裂解后,珠子上的oligo-dT与释放的mRNA的poly-A尾杂交,然后在微滴内进行RT反应。在此步骤中,将珠子特异性寡核苷酸序列掺入cDNA中,该序列用于将序列读回比对特定细胞。 然后断开GEM,将cDNA汇集在一起,扩增并纯化,然后使用10x Genomics流程制备NGS文库。使用Novaseq对文库进行测序。
肿瘤的关键特征之一是它们的异质性。单细胞转录组测序技术是分析肿瘤异质性的关键手段之一,对肿瘤治疗具有重要作用。一个很好的例子是对转移性乳腺癌细胞系耐药性模型中耐药性的早期研究。 通过分析未经处理的,受压的和耐药性的细胞群,作者证明了耐药性细胞在与微管组织,稳定,细胞粘附和细胞表面信号传导有关的基因中包含特定的RNA变异体。在未经处理或应激的细胞中不存在这种药物耐受性的RNA变异体。特定RNA变体的产生增加了异质性,并确保了少数群体的生存,从而有效地将耐压细胞转化为正常细胞。 单细胞分析也可以为肿瘤治疗提供深刻的线索。由于肿瘤内的异质性,给定的靶向治疗通常可以消除肿瘤细胞的特定亚群,而其他细胞则不受损害。为了克服这一挑战,靶向多种肿瘤亚群的治疗策略至关重要。 有研究人员通过分析转移性肾细胞癌中各种细胞群体中的多种药物靶途径。使用scRNAseq技术成功开发了优化的组合治疗策略,与单一疗法相比,该疗法在体内和体外显示出明显改善的反应。单细胞测序的另一个主要应用是研究肿瘤内部和周围肿瘤的已知细胞类型,亚型和以前未知的细胞类型,并鉴定给定细胞类型的基因特征。这些研究促进了异质肿瘤组织中的复杂途径,并为癌症治疗提供了指导。 本文作者重点介绍如何使用单细胞测序技术来识别T细胞浸润中的新细胞类型和生物标记。T细胞浸润的状态及其特征与不同的预后结果相关,对于免疫疗法的发展及其对癌症临床反应的预测至关重要。如今,单细胞转录组学分析彻底改变了研究人员对癌症生物学的理解,包括肿瘤异质性及其治疗意义。但是,该技术的主要局限性在于mRNA的解读分析。 尽管10X系统可以在单个实验中捕获多达10,000个细胞,但只能从单个细胞中获得数千个独特的转录本。目前,可以通过深度测序,在一定程度上缓解这个问题,但对于完整的转录组分析而言还不够理想。总的来说,RNAseq,LCM-RNAseq和scRNAseq都有一个共同的弱点就是由于这些技术都进行了显微切割或细胞分离,因此会丢失一部分关键信息,从而影响了对细胞功能的理解和病理变化。当前有一种新的空间转录组技术。该技术可以使研究人员在空间上研究整个转录组,从而克服DSP技术的局限性。从理论上来说,它可以提供与转录组测序类似的分析内容和空间内容。空间转录组学采用了一种整合微阵列和10x Genomics的barcode策略。 简要地,将新鲜冷冻的组织切片成像并放置在带图案的带有barcode的oligo-dT微阵列载玻片上。载玻片上的捕获探针包括用于体外转录的T7启动子,用于测序的序列,用于RNA定位的barcode,用于去除扩增重复序列的UMI和用于捕获mRNA的oligo-dT序列。随后提取RNA,该RNA与捕获探针的相邻oligo-dT序列结合。 在cDNA合成过程中,将指示阵列上每个spot位置的空间条形码整合到cDNA中。从该阵列上切下一条双链cDNA链,随后进行文库构建和测序(图4)。由于空间转录组学技术可以在原始组织切片上显示空间解析的整个转录组数据,因此科学家可以选择所有或任意数量的感兴趣基因进行可视化和分析。
空间转录组分析通常适用于新鲜冷冻的哺乳动物组织和新鲜植物组织,并且可能适用于FFPE材料。这项技术在癌症领域的应用仍然受到一定限制。一个重要的应用就是研究肿瘤异质性,这对理解肿瘤的进展和治疗提出了挑战。目前,已有研究机构使用这项技术探索了前列腺癌和黑色素瘤的肿瘤异质性。通过分别剖析前列腺和黑色素瘤中的6750和2200个组织,结果显示组织间和组织内不同区域的异质性。基因表达异质性可能延伸到细胞类型或组织类型之外。例如,例如,邻近肿瘤区域的淋巴区域具有特定的表达模式,紧邻肿瘤区域的非肿瘤组织显示梯度表达模式。这些发现表明,位置依赖性基因的表达是肿瘤微环境中细胞间相互作用的反映,并且肯定会影响免疫细胞的功能和治疗反应。 这是一个值得进一步研究以充分了解肿瘤转移的关键领域。空间转录组学技术也已用于癌症诊断。有研究人员使用公开可用的乳腺癌空间转录组学数据集,结合机器学习技术,区分导管原位癌和浸润性导管癌。通过从已知的DCIS和IDC区域识别空间转录组特点并训练机器学习模型,研究人员对DCIS和IDC的预测准确性达到了95%和91%。 这项初步研究证明了空间转录组学在乳腺癌诊断和亚型表征中的作用。RNAseq的最终目标是在单细胞分辨率下进行简单,可靠,空间分辨的转录组学分析。第四代测序技术,例如原位测序和荧光原位测序具有这种潜力。原位测序是将探针与扩增结合使用以生成原位扩增的靶向测序文库,随后对该文库进行测序。原位测序可同时对多打256个独特的转录本进行测序。该方法仅适用于测序已知基因。荧光原位测序是使用带有测序引物标签的随机六聚体启动原位RT。使用CircLigase将生成的cDNA环化。在RT期间,引入dUTP并使用BS试剂将cDNA与组织交联以防止cDNA扩散。在RCA之后进行测序。尽管ISS和FISSEQ技术各自在检测方面都有自己的优势,但是这些技术仍处于发展的早期阶段,在将其应用于癌症研究和临床应用之前,需要解决许多技术问题。但是,第四代RNAseq提供了直接的原位测序方法。 如果在未来几年内可以解决技术障碍,那么第四代RNAseq可能会成为进行高通量空间转录组学分析的直接方法。
如上所述,在以上RNAseq技术中,每种技术都有自己的优点,缺点和合适的应用场景。作者认为转录组测序将在不久的将来成为临床肿瘤研究的主要选择,单细胞测序的应用将在成本效益更高时得到进一步的发展,具有空间分析内容的技术将成为肿瘤学的最终命运。
更多推荐
1 科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响