科研| Nature Plants:新生RNA的转录后剪切有助于植物广泛保留内含子

编译:秦时明月,编辑:夏甘草、江舜尧。

原创微文,欢迎转发转载。

导读

在高等真核生物尤其是植物中RNA共转录剪切速率,剪切状态和其他RNA加工过程之间的关系一直未被深入研究。本文发现,很多已经完成转录和多聚腺苷化的转录本上特定位置的内含子仍未被剪切。这些转录本会滞留在染色质上,等待内含子剪切完成后才能释放到细胞质中发挥功能。因为这一过程发生在转录后,研究团队称这类内含子为转录后剪切内含子(post-transcriptionally spliced intron, pts-intron)。研究团队对6000多个已发表的拟南芥转录组测序文库分析发现,pts-intron的剪切依赖PRMT5和SKIP等剪切相关蛋白,并受到多种环境信号的调控。此外,拟南芥中大部分内含子滞留事件发生在pts-intron上,暗示了植物中广泛观察到的内含子滞留现象可能是pts-intron受信号调节而剪切受抑制产生的。研究团队推测,植物中带有内含子的全长mRNA转录本大部分不会被翻译成新的蛋白或被降解,而是被储存在细胞核内等待被最终剪切后成熟出核,从而在转录后水平,通过控制剪切来迅速调节成熟mRNA的产生。该研究开发了一种染色质结合的新生RNA全长测序方法,能捕获包括Pol-II延伸过程中的转录本、已转录过polyA位点的read through转录本、以及已完成或正在进行加A的转录本在内的多种RNA转录、剪切和加工中间体,并同时对每个RNA分子上的内含子剪切状态、Pol-II转录位置、polyA位置以及polyA长度等信息进行检测。这为研究人员追踪并研究mRNA转录、剪切和加工的动态过程提供了重要的新工具。

论文ID

原名:Post-transcriptional splicing of nascent RNA contributes to widespread intron retention in plants

译 名:新生RNA的转录后剪切有助于植物广泛保留内含子

期 刊:Nature Plants

IF:13.256

发表时间:2020.06

通讯作者:翟继先

通讯作者单位:南方科技大学

DOI号:10.1038/s41477-020-0688-1

实验设计

本研究使用去除核糖体RNA的染色质结合RNA进行RNA-seq分析。利用纳米孔和PacBio文库构建及测序,然后进行NGS的 RNA文库构建及测序,之后对配对样本间差异保留内含子的NGS RNA-seq数据分析与鉴定、纳米孔序列的碱基定位和绘图,并使用PolyAcaller进行3'Poly(A)的鉴定和长度估计。在3'端过滤拼接中间体,然后确定内含子拼接状态,并进行PacBio数据分析与APA分析。

结果

1 新生全长RNA-seq
为了研究拟南芥中新生RNA分子全谱,研究人员使用全长测序技术同时描绘延长的和多腺苷化的RNA组分(图1a)。通过连接3’接头和逆转录PCR(图1a),提取了拟南芥幼苗染色质结合RNA,并转化为双链cDNA,用于长读长纳米孔测序(图1a)。纳米孔小离子测序的第一次和第二次生物重复分别产生了1000万和760万个原始reads,95%的reads被映射到拟南芥基因组(图1b)。对映射到基因区域的阅读片段分析表明,大多数长阅读片段从5’转录起始点开始,沿着转录过程结束,而通读转录本则移过了多腺苷化位点以及大量多腺苷化全长但未完全剪接的转录本(图1c)。研究人员还观察到RNA 3’端在5’剪接位点有非常强的富集(图1d)。这很可能是由于在剪接反应中捕获了第一次酯交换反应产生的剪接中间产物。外显子最后一个核苷酸的精确3’末端峰也表明,在文库构建过程中RNA几乎没有降解(图1d)。为了获得共转录剪接动力学的准确估计,从进一步的分析中删除了剪接中间体,以及缺失的5’端(可能是由于不完全逆转录)的reads(图1e)。经过过滤,研究人员总共获得了350万个全长clean reads,覆盖了23844个蛋白质编码基因,每个基因的中位数为50个转录本(图1b,f)。研究人员还开发了一个数据分析方式来区分延长的RNA(没有多腺苷化的尾巴)和多腺苷化RNA(有多腺苷化的尾巴),并估计了多腺苷化的尾巴长度。70%的全长clean reads是延长的Pol-II产物,而剩下的30%已经是多腺苷化(图1b)。
图1全长新生RNA序列。a,全长新生RNA序列示意图。b,纳米孔和PacBio测序的基本reads统计。c,一个在过滤前与AT1G01720基因对齐的纳米孔reads的例子。d,内含子5’剪接位点和3’剪接位点附近富集的折叠变化。e,一个经过过滤后与AT1G01720基因对齐的纳米孔reads的例子。f,每个基因(仅蛋白质编码基因)的纳米孔全长clean reads的分布。

2 在拟南芥中,剪接可以共转录方式发生,并且连接在多内含子基因中。

正如之前在其他系统中所显示的那样,捕获全长的延长转录本使研究人员能够研究剪接和延长之间的协调。与果蝇和人类的内含子相比,拟南芥的内含子相对较短,确定拟南芥是否有不同的剪接动力学将是有意义的。研究人员的文库捕获了约230万个全长延长转录本,其中大约20%至少有一个剪接内含子(图2a)。当Pol-II已经转录了超过1100个核苷酸超过3’剪接位点时,超过50%的内含子仍然没有剪接(图2b)。为了进一步证实纳米孔数据的分析结果,研究人员使用另一个流行的测序平台PacBio对染色质结合RNA文库的第三个生物复制进行了测序(图1a,b)。来自PacBio和纳米孔数据的结果高度一致,证实了研究人员的方法在不同的平台和分析方法上是稳定的(图2b)。拟南芥剪接的半饱和值与酵母中报道的更快的剪接速度形成鲜明对比,但与果蝇和人类的剪接速度相似,表明酵母和迄今所研究的三种高等真核生物的剪接动力学存在很大差异。
由于研究人员的全长长读测序方法可以同时跟踪同一转录本上多个内含子的状态,研究人员接下来检查了多个内含子的剪接顺序。对于任何两个相邻的内含子,在大约70%的情况下,上游内含子首先被剪接(图2c)。为了追踪多个内含子的剪接动态,研究人员以所有含有5个内含子的基因为例,发现上游内含子的剪接率高于下游内含子;相当一部分上游内含子在Pol-II转录通过下游内含子之前被剪接(图2d)。研究人员还观察到,特定转录本上的某些内含子在下游内含子被剪接或转录本被多腺苷化后仍然没有剪接。这些结果表明,多内含子的剪接在很大程度上遵循转录的顺序,但一些内含子即使在转录本完全多腺苷化后仍被保留(图2d)。

研究人员还观察到同一转录本上内含子的剪接状态之间存在很强的关联。例如,第一和第二内含子的剪接状态紧密相连(图2d)。在酵母、果蝇和人类中也观察到相邻内含子的协同剪接。这种关联可能是由于先前的剪接事件招募了必要的蛋白质复合物,从而促进了同一转录本上其他内含子的剪接。因此,下游内含子的剪接速度通常比上游内含子的剪接速度快(图2e)。例如,超过50%的第十个内含子在100个核苷酸内剪接,而只有10%的第一个内含子在100个核苷酸内剪接。这些结果表明,早期剪接事件有助于为同一转录本的额外剪接创造更有利的环境,从而使多内含子基因的有效剪接成为可能。

图2剪接可以在拟南芥中以共转录方式发生,并耦合在多内含子基因中。a,染色质上延长的和多腺苷化转录本中的所有未剪接、部分剪接和完全剪接的部分。b,剪接内含子比率与距3’剪接位点的转录距离的分析。c,不同剪接状态的相邻内含子对中不同剪接顺序的频率。d,从具有5个内含子的基因中获得的每个新生转录本中多内含子的剪接状态的可视化。e,剪接内含子比率与不同位置内含子转录距离的分析。

3 染色质上特定位置有未剪接内含子的多腺苷化转录本的高度积累

研究人员还在染色质上检测到高比例的多腺苷化转录本,其中30%的转录本仍然不完全剪接(图1b、2a和3a)。两个纳米孔之间的不完全剪接转录本比率和未剪接内含子比率都高度一致。研究人员还用三个生物重复构建了染色质结合的多腺苷化RNA的RNA-seq文库。未剪接内含子的比率在RNA-seq和纳米孔数据之间也是高度一致的,在三个RNA-seq生物重复中也是一致的(图3b)。此外,大多数未完全剪接的多腺苷化转录本只包含一个或少数未剪接内含子,而其他内含子已被有效剪接(图2d、3a和3c),表明未剪接内含子具有特异性。为了进一步分析染色质结合的多腺苷化RNA中高未剪接率和低未剪接率内含子之间的差异,研究人员使用0.1的终止值将内含子分成两组。对于染色质结合的多腺苷化RNA未剪接率高于0.1的内含子,共转录剪接率要慢得多(图3d),表明这些内含子在多腺苷化后保持未剪接状态。

接下来,研究人员分析了这些不完全剪接的转录本是否可以从染色质中释放出来。研究人员用来自不同细胞组分的多腺苷化RNA构建了下一代测序(NGS)RNA-seq文库,发现染色质结合的多腺苷化RNA中未剪接率高于0.1的内含子在核质和细胞质中几乎检测不到(图3e),这表明含有内含子的转录本在多腺苷化之后仍然与染色质结合。此外,染色质结合的多腺苷化RNA中不完全剪接率较高的基因的RNA积累水平在染色质部分比在核质或细胞质中也明显较高,表明不完全剪接的转录本会保留在染色质上(图3f)。此外,如果这些含有内含子的转录本要从染色质中释放出来,它们可能会成为无义介导的衰退途径的靶标,但研究人员发现,大多数这些未剪接内含子的累积水平在upf1-upf3双突变体中保持相同,这扰乱了衰退途径(图4b),这表明大多数这些不完全剪接的转录本不会被衰退途径降解,这与以前的报道一致,即大多数带有内含子的转录本都没有被衰退途径降解。因此,研究人员的结果表明,不完全剪接转录本的染色质保留是mRNA成熟的重要步骤,这在转录后基因调控中起着关键作用。

图3 染色质上特定位置的未剪接内含子的多腺苷化转录本高度积累。a,染色质结合的多腺苷化转录本中具有完全和部分剪接内含子的基因。b, RNA-seq与纳米孔之间未剪接内含子比率的校正。c,5个内含子基因未剪接内含子比率的热图。d,染色质结合的多腺苷化RNA中不同未剪接率内含子的剪接率与转录距离的分析。e,多腺苷化转录本的未剪接内含子在染色质、核质和细胞质中的比例分布。f,染色质、核质和细胞质转录本丰度的差异。

图4 pts内含子的剪接相关因子和各种环境信号的调控。a,与公共文库中鉴定的WT相比,突变株中pts内含子的比率随内含子保留率的增加而增加。b,染色质结合的多腺苷化中不同非剪接率内含子的Δ非剪接率分布。c,PRMT5中受影响内含子的例子。d,与在公共RNA文库中鉴定的模拟/对照相比,处理中具有更高保留率的内含子的pts内含子比率。e,染色质结合的多腺苷化Δ中不同非剪接率内含子的分布。f,生物钟基因TOC1中冷调控内含子的例子。g,核保留和转录后剪接的模型。

4 pts内含子的剪接相关因子和各种环境信号的调控。

为了确定pts内含子(转录后剪接内含子)的剪接是否在某些突变体中受到影响或受到环境信号的调控,研究人员选择了6521个高质量的公开可用的RNA-seq文库,这些文库分为1512个匹配组,每个样本至少有两个生物重复,包括713组突变体与野生型(WT)和799组处理与模拟/对照,以在全基因组水平上寻找差异保留的内含子。从突变体对WT的分析中,研究人员鉴定了10个突变样本,与它们匹配的WT对照相比,它们有500多个内含子中的保留率增加。这些突变体的相应基因以前都被报道参与剪接,例如PRMT5和 SKIP(图4a)。虽然pts内含子只占所有内含子的28%,但这10组中约80%的IR增强事件发生在pts内含子(图4a)。prmt5和skip突变体强烈地抑制了pts内含子的剪接,而对非pts内含子的影响较小(图4b)。此外,在prmt5或skip突变体中,受影响的内含子的共转录剪接率也比那些未受突变影响的内含子小。PRMT5通过促进19个复合体到剪接体的募集和调节不同基因的前体mRNA剪接,参与多种发育过程,如开花时间控制、逆境反应和昼夜节律。研究人员发现之前在PRMT5中识别的大多数IR位于pts内含子,如AT2G17340(图4c)中的第一个内含子。这些结果表明pts内含子的剪接容易受到PRMT5、SKIP和其他剪接相关蛋白的调控,而正常内含子的剪接对这些因素的依赖性较小。此外,这两组内含子在prmt5和skip突变体中受到影响,彼此之间有很大的不同,这表明pts内含子可以进一步划分为剪接受不同途径调控的亚组。

此外,与对照相比,在各种胁迫处理下保留率增加的大多数内含子也是pts内含子(图4d),这表明pts内含子为植物中观察到的IR事件提供了重要的基础。一些研究表明,快速诱导表达可能导致新生RNA的比例高于成熟的mRNA,因此,内含子衍生的片段比例更高。研究人员分析了观察到的IR增加是否与基因表达上调相关,发现IR增加并没有富集在显示上调表达水平的基因中,这表明研究人员观察到的IR增加并不是由于转录上调过程中新生RNA的快速产生。因此,pts内含子的剪接可以受到各种环境信号的调节。例如,大量pts内含子的剪接在冷热处理后被抑制,这表明剪接受到温度的调节(图4d,e)。此外,依赖温度的IR在温度转换过程中对生物钟基因的表达起着重要的调控作用,这些保留在生物钟基因上的内含子,如TOC1,也大多是pts内含子(图4f)。因此,对pts内含子剪接的动态调控在植物对环境胁迫的反应中可能具有重要作用。

本研究的数据强调了染色质结合RNA的转录后剪接是大量mRNA成熟的重要阶段。研究人员推测,这一阶段可以受到各种剪接因子的调控,并且可以作为基因调控的重要环节,以响应广泛的环境信号。未来在影响pts内含子剪接的突变体(如prmt5和skip)中,对染色质结合RNA以及细胞质RNA的分析将是验证这一概念的关键(图4g)。

结论

本研究发展了一种基于纳米孔的方法来描述染色质结合RNA,该方法能够在全基因组水平上同时检测剪接状态、Pol-II位置和多腺苷化。研究人员发现,在POL-II转录1 kb通过3’剪接位点后,超过一半的内含子仍然没有剪接,这比酵母中报道的剪接速度要慢得多。许多全长的染色质结合的分子是多腺苷化的,但在特定的位置仍然含有未剪接的内含子。这些内含子在细胞质中几乎不存在,并且对无义介导的衰退具有抵抗力,这表明它们在转录本释放到细胞质之前是转录后剪接的,因此研究人员称这些内含子为pts内含子。对大约6500个公共RNA测序文库的分析发现,pts内含子的剪接需要与剪接相关的蛋白如PRMT5和SKIP结合,并且还受到各种环境信号的影响。拟南芥的大部分内含子保留事件发生在pts内含子,这表明染色质结合RNA的转录后剪接是在植物中观察到的广泛内含子保留的一个主要因素,并可能是一种快速产生具有完全剪接功能mRNA的机制。

评论

内含子是基因中不具有编码作用的片段,它会被转录到前体RNA中,但在mRNA加工过程中被剪切掉,而内含子剪切是真核生物mRNA成熟的关键步骤。该研究开发了一种基于纳米孔的方法来分析染色质结合的RNA,该方法能够在拟南芥全基因组范围内同时检测剪接状态,Pol-II位置和聚腺苷化化。pre-mRNA剪接是真核mRNA成熟的基本过程,大多数内含子通过转录共剪接。先前使用合成的pre-mRNA在体外重建剪接事件的研究已经获得了有关剪接位点识别和剪接体组装机制的丰富知识。高通量短读测序技术在新生RNA表征中的应用极大地促进了剪接事件的定量以及对有效Pol-II转录的精确跟踪。然而,由于难以在同一转录本上同时表征剪接事件和转录进程,因此研究剪接和转录之间的协调性仍然具有挑战性。


更多推荐

高分综述 | Trends in Biotechnology: 单细胞分辨率下利用空间转录组揭示器官分子结构(国人佳作)

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐