科研│PLANT J: 全球转录组分析揭示了拟南芥剪接事件的昼夜节律控制

编译:微科盟 Nicole,编辑:微科盟景行、江舜尧。

原创微文,欢迎转发转载。

导读

拟南芥的昼夜节律控制着许多生理和分子过程,使植物能够预测其环境的每日变化。然而,mRNA水平变化如何与共转录/转录后过程(例如剪接)的变化联系起来仍然是研究领域的挑战。本文使用深度转录组测序与生物信息学结合,鉴定新的昼夜节律调控基因和剪接事件,确定了300个内含子保留、8个外显子跳跃、79个3'可变剪切位点、48个5'可变剪切位点以及350个多重注释(不止一种类型)。此外还发现了7和721个新的外显子和内含子。昼夜节律性剪接因子AtSPF30同源物的减少导致钟控的剪接事件的子集的破坏。总而言之,本文的全局生物钟RNA-seq与计算机化的剪接分析工具相结合,为研究生物钟在全局与生物剪接机制之间的相互作用提供了一种新方法。对许多昼夜节律调控的剪接事件的识别,拓宽了目前对昼夜节律调控共转录/转录后层面的理解。

论文ID

原名:Global transcriptome analysis reveals circadian control of splicing events in Arabidopsis thaliana

译名:全球转录组分析揭示了拟南芥剪接事件的昼夜节律控制

期刊:The Plant Journal

IF:6.141

发表时间:2020年7月

通讯作者:Marcelo J Yanovsky

通讯作者单位:阿根廷国家科学技术研究委员会

DOI号:10.1111/tpj.14776

实验设计

结果

1   昼夜节律转录组的全球RNA-seq揭示已知和新的昼夜节律调控的基因

为了分析基因表达的昼夜节律调节,使用培养15天的拟南芥首先在光/暗(LD)12 h:12 h光周期培养,随后转移到恒定光照条件(LL),并在LL培养24小时后每4小时取样1次,持续取样2天,设置2个生物学重复(图1a)。对样品提取总RNA,进行高通量测序,构建了迄今为止植物昼夜节律转录组的最深测序深度。获得了每个基因长度的reads数,并且仅选择了在整个时间过程中的任何时间点中值均高于0.05的reads进行进一步分析(18,503个基因)。

进一步采用了预筛选步骤以排除任何非节律性转录本,然后仅对在整个时间过程中显示出变化的基因(13,256个基因)进行昼夜节律分析。本文应用了Jonckheere-Terpstra-Kendall(JTK)算法,发现总共9,127个基因具有节律性并表现出昼夜节律的表达模式(JTK_cycle,p <0.01和q <0.01;图1b)。为了验证方法的有效性,通过qPCR验证已知核心生物钟基因的表达模式(图1d-k),与转录组结果一致。

然后对昼夜节律变化的数据集进行了GO分析,结果表明钟控基因(clock-controlled genes,CCG)参与了多种生物过程,包括但不限于免疫反应、激素信号传导、光信号传导、代谢和光合作用,这与以前的报道一致。幅度直方图分析显示,大多数转录本的相对振幅低于3,而少数生物钟转录本的振幅较高,包括核心生物钟基因,与哺乳动物和果蝇中已知的基因一致。

对昼夜节律调节基因的相分布分析表明,25.9%(2364个基因)在LL10-12处表达较高,而24.66%(2251个基因)在LL22-LL0处表达较高。这些分别对应于LD 12 h:12 h光周期的昼夜转换(图1b)。在LL10-12达到峰值的基因参与了96个生物学过程(p <0.05),包括对应激、免疫应答、脂质代谢、信号传导和蛋白质过程的响应。在LL22-0处达到峰值的基因参与了146个生物学过程,包括RNA修饰/加工、芥子油苷的生物合成、碳水化合物代谢、线粒体/细胞内转运和核糖体生物发生。

通过将数据集与之前研究中全局拟南芥昼夜节律基因表达数据集进行比较发现与Covington + Edwards组合基因列表(DS1)重合率为41.67%(3,803个基因),与Hsu&Harmer数据集(DS2)重合率为49.76%。在所有3个数据集中共发现2,763个基因(30.27%)表达循环(图2a)。通过合并这3个数据集,发现迄今已有超过37.29%的拟南芥基因被昼夜节律调控。

图1.全局昼夜节律基因表达(a)实验条件示意图。 (b)来自昼夜节律实验的全局logCPM基因表达的相位排序热图。 (c)整体基因表达的相位直方图。 (d-k)核心生物钟基因的RT-qPCR验证(黑色,实线)和RNA-seq迹线(灰色,虚线)(d)CCA1、(e)LHY、(f)RVE8、(g)PRR9、(h)PRR7、(i)PRR5、(j)TOC1和(k)ELF3。、CCA1:生物钟控制关联1(Clock Control Associated 1,AT2G46830)。 LHY:晚伸长的次胚轴(Late Elongated Hypocotyl,AT1G01060)。 RVE8:Reveille 8(AT3G09600)。 PRR9:伪响应调节器9(Pseudo Response Regulator 9,AT2G46790)。 PRR7:伪响应调节器7(Pseudo Response Regulator 7,AT5G02810)。 PRR5:伪响应调节器5(Pseudo Response Regulator 5,AT5G24470)。 TOC1:CAB表达计时1(Timing of CAB Expression 1,AT5G61380)。 ELF3:早期开花3(Early Flowering 3,AT2G25930)。

2   新的生物钟转录本

本文数据集还揭示了以前的两项全局研究尚未发现的新的生物钟调控基因(图2a)。由于所使用的技术在基因组覆盖率上的差异,本文发现了3545个新的昼夜节律基因。GO分析显示,与翻译、核糖体生物发生和RNA代谢相关(图2b)。应当指出,其中某些基因之前研究中有报道,例如,昼夜节律相关基因CAB2。

有趣的是,146个跨越许多家族的转录因子(TF)是新型CCG的一部分,包括bZIP、bHLH、与MADS box相关、WRKY、MYB和NAC等(图2c)。这些TFs基因表达模式的RNA-seq数据见图2d。这些基因的进一步研究可能会为生物钟如何调节基因表达的新见解。

图2. 新的昼夜节律基因和特定的基因家族(a) Venn图显示RNA-seq昼夜节律基因表达(RNA-seq-LL)与Covington+ Edwards综合数据集(DS1)和Hsu & Harmer数据集(DS2)。(b) 新的昼夜节律基因相关的生物过程(BP)。(c-d)新的转录因子基因。(c) 显示昼夜节律数据集的新基因和所有已知转录因子基因之间的比较的Venn图。(d)146个新的转录因子基因的logCPM基因表达的相位排序热图。DS1:数据集1。DS2:数据集2。CPM:百万分之计数。

3   昼夜节律调节其他剪切事件

本文将RNA-seq与TAIR10参考基因组进行比对,用于检测和量化剪切事件,按照基因表达进行了剪切事件的节奏分析。使用这种方法,结合AtRTD2注释,发现了3976个钟控的剪切事件(CCE)。尤其是300个内含子保留(IR)、40个外显子跳跃、78个5'可变剪切位点(Alt5's)、113个3'可变剪切位点(Alt3's)以及470个多重同时涉及一种以上的可变剪切(AS)事件类型,发现22个未定义的和1720个新的外显子以及1233个新的内含子,以上都是有节律变化的,并且表现出昼夜节律的表达模式,相对幅度> 0.15。为了提高严格性,应用了额外的过滤步骤,计算了剪切入百分比(PSI)和内含子保留百分比(PIR)指数。本文保留了在所有分析的时间点上,PSI / PIR(dPSI / PIR)变化超过5%的昼夜节律的事件。这导致总共1513个事件对应于1169个基因,分为以下几类:79个Alt3、48个Alt5、300个 IR,8个 ES,350个多重事件(图3a)以及7个新的外显子和721个新的内含子(图3b)。有趣的是,本研究还揭示了617个CCG的外显子和/或内含子可变剪切在一天中也受到生物钟调节。另一方面,还有552个基因的表达不受昼夜节律调节,但8510个CCG没有可检测的可变剪切事件(CCE)。总共有652个基因具有新的外显子/内含子事件,69个Alt3′s,48个Alt5′s,286个IR,8个ES和292个多重事件。

对该数据集进行了GO分析,结果表明钟控的剪切事件(CCE)的基因包括参与初级代谢(GO:0044283)、氮代谢(GO:0006807和GO:0034641)、核酸代谢(GO:0006139和GO:0090304)、RNA/mRNA处理(GO:0016070、GO:0006396、GO:0006397、GO:0016071)、脂质代谢(GO:0006644、GO:0009245、GO:0046493和GO:0008654)、开花(GO:0009909和GO:0009910)和RNA剪切(GO:0000375、GO:0000377、GO:0008380)。

为了验证方法的有效性,本研究从数据集中检查了2个剪切事件的表达模式,并通过半定量(sq)RT-PCR和SDS-PAGE对其进行了验证。然后通过qPCR进一步证实了结果,均获得了与RNA-seq分析流程数据所产生的模式相匹配的结果(图3e-h)。验证了COL2基因的内含子保留剪切事件(IR-AT3G02380:E002–width 143bp)和光周期和开花调节因子CONSTANS的同源物。这些是先前已有研究的,因此可以作为阳性对照。根据生物信息学分析IR在光/暗周期的白天之前出现,并且在白天/夜晚转换时达到峰值,如RNA-seq和PIR模式(图3e)所示。通过sqRT-PCR,SDS-PAGE和qPCR(图3f)进行的分析证明了使用的生物信息学分析的有效性。此外,本研究结果在CT36处显示出一个IR峰值,这完全符合之前的研究,并进一步验证了我们的本文分析流程。此外,本研究还验证了A / N-InvC基因的IR事件(IR-AT3G06500:E015- width 81bp,图3g-h)。该基因在根、枝叶和花中表达,并编码位于线粒体中的碱性/中性转化酶。该基因的突变导致芽生长减少。保留该内含子会导致蛋白翻译提前中止,出现少了123个氨基酸残基的截短的蛋白质。

图3. 生物钟控制元件分析(a)生物钟控制的按类型(alt 3'ss、alt 5'ss、ES、IR和multiple)注释事件的分布。(b) 新的(非注释的)生物钟控制的外显子和内显子事件的分布。(c-d)logCPM生物钟控制剪接事件的相位排序热图按类型表达:(c)注释事件(alt 3'ss,alt 5'ss,ES,IR和multiple),(d)非注释事件(exonic和intronic)。(e-f)符合性评估的验证。(e)PIR标准化为COL2 E2的最大值。(f)COL2 E2 IR事件的qPCR验证(**p<0.01)。(g) PIR标准化为A/N-INvC E15的最大值。(h)A/N-INvC E15 IR事件的qPCR验证(**p<0.01)。COL2:CONSTANS like 2(At3g02380)。A/N-INvC:碱性/中性转化酶C(Alkaline/Neutral Invertase C,AT3G06500)。

4   多个拼接调控因子处于生物钟控制下

本文认为这种对可变剪切的昼夜节律控制可能至少部分是由于对剪切的基本昼夜节律的控制。为了检验这个假设,本文列举了所有已知的剪切调控因子,包括SR、hnRNP、核心剪切体蛋白、剪切体装配的调控因子、特定snRNP的成分以及一些调节SR蛋白功能的激酶。然后,将其与Covington + Edwards数据集(DS1)、Hsu&Harmer数据集(DS2)和本文的数据集进行比较。在这426个与剪切相关的基因中,有31个在所有3个数据集中都是有节奏性表达(图4a),本研究认为这31个拼接调控因子将是最重要的节律调控因子。

这些基因之一AT2G02570,先前已被描述为哺乳动物运动神经元生存(SMN)的同源物,其控制剪切体的组装。但是, BlastP搜索显示,AT2G02570与剪接因子30(SPF30,例如NP_005862.1)密切相关。SPF30是剪接体组装所需的SMN旁系同源物,SMN还包含Tudor域。该结构域与形成参与剪接过程的环的Sm核糖核蛋白具有亲和力。基于越来越多的证据表明,选择性剪接不仅受SR和hnRNP辅助因子的调节,还受核心剪接体组分或蛋白水平或活性的改变的调节,因此本文决定进一步研究AT2G02570(本文称为AtSPF30)的生物学功能。

5   AtSPF30影响生物钟调节事件

为了研究AtSPF30在CCE调节中的作用,首先通过qPCR验证了其有节奏的转录模式(图4b-d),并利用2个不同的T-DNA插入突变体(atspf30-1和atspf30-2,图5a)进行分析。纯合突变体植物在形态上与野生型非常相似(图5a)。对生物钟调节的输出、叶片运动和开花的表征显示Col-0与突变体之间的叶片运动周期无显着差异(图5b),并且测试了不同光周期(LL、LD和SD;图5c)。

图4. 昼夜节律调节的剪接因子和AtSPF30(a) Venn图显示了稳定的节律变化基因(在本研究的RNA-seq数据集以及DS1和DS2上循环的基因)和剪接相关基因之间的比较。(b-d)AtSPF30表达模式来自:(b)Mockler Dairnal web server,LL23\u LDHH数据集,(c)来自昼夜节律RNA序列的标准化计数(本研究),以及(d)qPCR数据(每个时间点3个生物复制)。AtSPF30:拟南芥剪接因子30(Arabidopsis thaliana Splicing Factor 30,AT2G02570)。

图5. AtSPF30等位基因、叶片昼夜运动和开花表型(a)AtSPF30基因模型。白色三角形表示突变等位基因atspf30-1(SALK_052016C)和atspf30-2(SALK_081292C)的T-DNA插入位点。红色和绿色箭头表示引物结合位点。显示了野生型(Col-0)、atspf30-1和atspf30-2(从左到右)的代表性图像。(b) 显示Col-0(黑色)和atspf30-1(蓝色)在转移至LL 144小时(6天)后的昼夜节律叶角图。(c)在LL、SD和LD光周期中,以1cm抽薹时的莲座叶数测量的开花时间AtSPF30:拟南芥剪接因子30(AT2G02570)。LL:连续光照。SD:短日照。LD:长日照。

与在相同条件下生长的Col-0植物相比,在恒定光照下生长的atspf30-1突变植物的RNA-seq分析显示286个改变的剪切事件(| FC |> 1.5,p <0.05,q <0.05和dPSI / PIR > 5%;图6a)。在野生型植物中,最丰富的AS事件是与3'可变剪切位点(Alt3's;33%)相关的事件,然后是内含子保留(IR;32%),5'可变剪切位点(Alt5's;22%)相关的事件和外显子跳跃(ES;13%)。但是,在atspf30-1突变体中改变的AS事件中,发现IR事件的比例相对于野生型植物的频率有所增加,3'alt事件和5'alt事件相对有所降低(图6a-b )。有趣的是,这些事件中有32个也在PCE / PIR过滤的CCE子集中(图6c)。分析spf30-1与Col-0的这32个事件的dPSI / PIR,本文假设整个昼夜节律期间,atspf30-1上的内含子保留率也会高于野生型水平。考虑到这一点,选择了一个既受AtSPF30突变影响又受钟控且在CT16处具有峰值相位的IR事件进行验证(图6d-f)。qPCR定量显示,缺乏功能的AtSPF30会影响整个昼夜节律中AT5G17670:E006的整体含量,而不会影响节奏模式(图6f)。因此,在发生这种剪切事件的情况下,AtSPF30既调节内含子保留的基线水平,又调节其整体振幅。

图6.在atspf30-1中CCEs被错误调控(a-b)atspf30-1受影响事件的分布。(a) 按类型(alt 3'ss、alt 5'ss、ES和IR)分类的注释事件,(b)非注释事件(外显子和内显子)。(c)显示所有生物钟控制元件(CCE)和受atspf30-1影响的拼接事件之间的比较的Venn图。(d)比较AT5G17670基因座区域Col-0(蓝色)和atspf30-1(黑色)的RNA-sesq数据的读取密度直方图。红色矩形区域表示IR事件的读取密度区域。AT5G17670基因模型显示在图的底部。(e)AT5G17670:E006事件的PIR图。(f) AT5G17670:E006在Col-0(黑色)和atspf30-1(蓝色)中的qPCR。

讨论

AS在植物中高度流行,影响超过60%含内含子基因的前体mRNA。许多基因响应环境的发展和变化(例如光照和温度)发生AS。越来越多的证据表明AS会影响生物钟,而影响剪切体相关成分的突变会改变昼夜节律。此外,在果蝇、小鼠和人类细胞系中进行的研究已经确定了生物钟在控制剪切过程中的作用。但是,目前尚无任何植物物种对AS的钟控程度的全局性转录组学研究。一项使用GeneChip AtTILE1切片阵列技术的全局研究分析内含子显示共有499个基因包含内含子变化。本研究使用了NGS Illumina mRNA-seq技术,避免了微阵列探针的技术问题。通过将高分辨率的mRNA-seq与本研究开发的生物信息学相结合,在分析剪切事件的同时考虑了潜在的基因表达水平,找到300个内含子保留、8个外显子跳跃、79个3'可变剪切位点、48个5'可变剪切位点以及350个多重注释(不止一种类型)(图3a)受到昼夜节律的调控。还分别发现了7和721个新的外显子和内含子事件。有趣的是,在发现的646个含有循环内含子的基因中,只有35个与Hazen等人报道的499个重叠(7%,占499个中的35个)。

越来越多的证据表明,剪切可能通过共转录进行拼接。此外,发现CTS是在包括人类、果蝇和酵母的不同物种中剪切的主要模式。最近发现这也发生在拟南芥中。这些发现表明,对于昼夜节律基因,组成性剪切也将以昼夜节律的方式发生,因为它将以共转录方式发生。有趣的是,研究表明在拟南芥幼苗中,很大比例的选择性剪切事件是通过共转录确定的。本问找到了与617个CCG相对应的810个CCE。其中,只有175个CCE(21.6%)与各自的CCG相匹配。此外,发现在基因表达水平上没有可检测到的昼夜节律调节的703个CCE。以上结果表明,尽管剪切主要在拟南芥中共转录,但是AS的昼夜节律调节很大程度上独立于昼夜节律基因表达。昼夜节律时间RNA测序分析可以提供有关此问题的进一步见解。

本文还发现,钟控的剪切因子AT2G02570在突变时会影响一部分AS事件。该基因先前已被鉴定为SMN同源物。SMN编码生存运动神经元蛋白,是一种剪切体复合物成分,当突变时,会引起常染色体隐性隐性脊髓性肌萎缩。但是本文生物信息学分析表明,AT2G02570与SPF30密切相关(图S8)。AtSPF30突变体atspf30-1中发现286个AS事件发生改变。这与以前的报道一致,表明核心剪切体成分或蛋白质水平或活性的变化可调节剪切体装配的动力学,从而可调节其他剪切。

CCEs与atspf30-1数据集之间的比较显示,受AtSPF30突变体影响的286个事件中有32个事件属于PSI / PIR过滤的CCE子集。此外,对这些剪切事件的仔细检查表明是通过增加总体保留水平而优先影响了IR事件。实际上qPCR分析表明,尽管与Col-0观察到的模式相似,但AT5G17670:E015的IR在所有测定的时间点都较高(图6f)。表明对AS进行昼夜节律控制是多因素的,因为即使SPF30通过调制幅度和整体水平(即更高的IR)做出贡献,但在缺少SPF30时仍会继续潜在的节律变化。

除了AtSPF30,在所有已知的昼夜节律数据集中还发现了30种与剪切相关的蛋白质也处于昼夜节律的调控下(图4a),其对AS的昼夜控制的贡献尚待确定,应进一步研究。对这些由昼夜节律控制的剪切相关因素的调节可能导致剪切事件的时间特定的微调。尽管许多研究显示非冗余的剪切因子在突变时会影响生物钟,本研究没有发现证据表明昼夜节律调节剪切因子和相关蛋白会导致核心生物钟成分发生AS改变,但它们的作用是作为输出(CCG)影响其他变化(CCE)。

剪切因子也受到生物钟剪切事件的影响。本文分析显示了57个与剪切相关的基因,这些基因也在剪切水平上受到调节。将来对这些剪切事件的生物学功能进行详细研究将有助于更好地了解生物钟如何调节可变剪切,反之亦然。

长链非编码RNA(lncRNA)是另一种可以调节AS的反式作用因子。例如由核斑点RNA结合蛋白(NSR)和AS竞争者长链非编码RNA(ASCO-lncRNA)构成的AS调节环:ASCO-lncRNA可以结合AtNSR并与AS目标有效竞争,从而调节IR。此外,已有研究表明lncRNA可以被生物钟调节,并且反过来,一些lncRNAs也靶向核心生物钟成分。总的来说,这使lncRNA成为一个有趣的研究方向。但是,本文无法分析反义蛋白质编码基因/非编码基因的调控。这仍然是未来研究中一个有趣的方向。

之前研究已经证明核心生物钟组件高度敏感性,并且在环境扰动下会经历AS。此外,环境干扰似乎比生物钟本身更能调制核心生物钟组件的AS。综上所述,这表明核心生物钟的AS调制主要通过其输入路径(在环境扰动之后)进行,而对AS的昼夜节律控制主要保留给输出路径的调制。但是必须指出,这项工作中报告的CCE数量非常保守,并且随着昼夜节律研究的测序深度增加,将来可能会增加。诸如Pacific Biosystems或Oxford Nanopore新型技术的出现,很可能会在不久的将来在全局实现可靠的转录亚型的定量分析。


1  科研│PLANT PHYSIOL:昼夜节律生物钟对大麦转录组的影响

2  科研 |INT J MOL SCI:水稻转录数据系统分析其对冷胁迫的响应和昼夜节律揭示与多种生物过程相关的分子网络

不来关注一波嘛

END

(0)

相关推荐