科研 | PLANT PHYSIOL:两种拟南芥生态型对磷酸盐饥饿的非编码转录组响应

编译:晨晨,编辑:景行、江舜尧。

原创微文,欢迎转发转载。

导读

植物基因组编码区有很强的保护,不同植物物种的根的结构差异很大,相同物种不同的生态型之间也存在差异。不同生态型植株的非编码RNA进化迅速,能调控植物对环境的响应,已知几种长非编码RNA(lncRNA)可以调控基因表达。Columbia (Col)和Landsberg erecta (Ler)生态型的根对磷酸盐饥饿响应不同。本研究比较了二者在早期磷酸盐饥饿下的根尖转录组(mRNAs、lncRNAs和小RNA),鉴定到不同生态型中有数千个DNA水平上高度保守的lncRNA。与编码基因相比,很多lncRNAs在一个生态型中有特异转录,在不同生态型中有不依赖于磷酸盐的差异转录。进一步对其表征,并研究了它们与siRNA的关系。结果表明675个lncRNA在这两种生态型中差异表达,其中包括根生长响应关键调控因子的反义RNA。在Col型根生长过程中,至少有两种与生态型相关的lncRNA调控主根生长。lncRNA NPC48基因表达的下调与RNA-seq实验说明根生长和转运功能具有潜在联系。通过对非编码转录组的研究,研究者发现了生态型特异的lncRNA介导根顶端调控。非编码基因组可能具有不同生态型根部在土壤环境中的适应机制。

论文ID

原名:Landscape of the non-coding transcriptome response of two Arabidopsis ecotypes to phosphate starvation

译名:两种拟南芥生态型对磷酸盐饥饿的非编码转录组响应

期刊:Plant Physiology

IF:6.902

发表时间:2020年5月

通讯作者:Thomas Blein, Martin Crespi

通讯作者单位:巴黎萨克雷大学,植物科学研究所

DOI号:10.1104/pp.20.00446

实验设计

结果

1  Columbia(Col)和Landsberg(Ler)根尖转录组

使用低浓度磷酸盐(10µM)处理根尖分别在0、1和2h取样并进行全转录组分析。在Col和Ler根尖中分别鉴定到5313和6408个未被描述过的假基因(图1A),这些假基因主要为非编码RNA:占Col型非编码RNA的76%,占Ler型非编码RNA的77%。其中,生态型特异的基因中,非编码RNA数量(图1C)多于编码RNA(图1B和C),尤其是基因间lncRNA基因(占总lncRNA的52%)多于天然反义转录物NATs (占总NATs的34%,图1D和E)。总之,与编码基因相比,非编码基因的表达更具有生态型特异性。

研究分析了Ler的假基因是否对应于Ler基因组数据缺失的部分或Col基因组重排部分。在7537个基因中,Col和Ler中分别只有41和53个基因与另一个生态型中的缺失基因相对应(图2A),说明除了SNPs外,假基因占据很大保守的一部分。两种生态型的转录本的差异可能是由于基因调节子的下调、启动子区序列差异,或差异表达位点远距离处的重排引起的。

图1. 两种生态型的转录本的鉴定。A,两种生态型中预测的编码和非编码转录本的数目。B-E,每个生态型预测的编码(B)或非编码(C)转录本,后者分为两类:反义(NAT:自然反义RNA, D)或基因间(lincRNA,E)。

2  根尖lncRNA表达基因的进化分析

研究人员计算了拟南芥的不同基因中的SNPs积累量(图2B)。与编码基因相比,TEs有更多的SNPs,非NAT lncRNA和结构RNA基因含有的SNPs量中等。相比之下,SNPs的含量与NAT lncRNA和编码基因的含量相似。为研究大规模的序列进化关系,使用PhastCons分值(0-1)代表种间的核苷酸保守性(图2C)。结构RNA基因具有很强的保守性(得分1),而转座子序列不保守(平均值为0)。编码基因得分位于两个极端值之间(约0.5)。非NAT lncRNA的得分在编码基因和转座子基因之间(平均值约为0.3)。然而,NAT lncRNA与编码基因的保守性相同。这些结果进一步说明了NAT lncRNA基因受强烈约束,而基因间非编码基因具有很大变化。

图2. DNA水平的转录本特征。A,检测两种生态型中先前未鉴定的预测转录本的DNA序列(在90%的RNA长度上至少有90%的序列一致性)。绝大多数RNA来自于两种生态型的共有DNA区域。B,根据1001个基因组项目的数据,每种类型的转录本每100 bp的SNPs积累量。C,每种类型转录本根据基因组位置相对于其他注释的植物物种间的保守性,以PhasCons平均值表示。在B和C中,NAT代表天然的反义RNA,而非NAT表示不依赖于注释类型而在其他DNA链上没有任何转录本重叠的转录本。

3  少数lncRNA转录本与sRNA的生成位点发生共定位

在动植物体中,lncRNA位点与产生sRNA的区域能发生共定位。因此,研究人员鉴定了lncRNA位点能否产生sRNA。结果表明,只有小部分lncRNA位点能产生sRNA,与phasiRNA或miRNA的前体重叠。

研究人员分析了每种生态型的siRNA与lncRNA的潜在联系。大多数lncRNA不能导致siRNA的积累。这一点在生态型特异的lncRNA中也成立,因为大多数不能产生siRNA(图3A)。因此,生态型之间的lncRNA差异与lncRNA编码位点产生siRNA无关。

然后,研究者想知道在这两种生态型之间是否会出现不同的sRNA加工。首先观察了只在一种情况下积累sRNA的lncRNA:(1)lncRNA只能在一种生态类型中产生siRNA,而在两种生态类型中都被检测为lncRNA(Ler长而Col长而Col小,反之亦然,分别为113和240个基因)和(2)只在一种生态类型中产生siRNA但在另一种生态类型中被检测为lncRNA的基因座(Ler长而Col小,反之亦然,分别为57和47个基因)。众所周知,21/22-nt siRNAs作用于基因转录物,而24-nt siRNAs介导染色质修饰。因此,一个生态型中给定基因的累积siRNAs大小的差异可能表明另一个生态型中转录后(21/22 nt)或表观遗传(24 nt)调控的改变。在积累siRNA的lncRNA基因中,很大一部分在两个生态型中积累了相同的大小(siRNA 21/22-nt为591,siRNA 24-nt为391),或者仅在一个生态型中产生siRNA(21/22-nt为367,24-nt为316,图3B)。在1694个积累lncRNA的基因中,只有29个siRNA基因积累了257个不同大小的lncRNA。因此,在不同生态型之间不能确定转录后相互作用或转录调控的主要变化。

最后,对两种生态型之间的sRNA的特异性进行了研究。首先,在产生21/22-nt siRNAs的7个lncRNA基因中,只有2个属于Ler型。其次,在191个miRNA中,Col和Ler型分别有23和12个特异miRNA。第三,分析了在编码区或非编码区基因中的21/22-nt siRNAs或24-nt siRNAs的特异表达。Ler型产生大量特异的21/22-nt siRNAs(图3C和E),而Col型有大量的24-nt siRNAs(图3D和F),这些位点可能与转录后调控和表观调控有关。

总的来说,这两种生态型的非编码转录组的主要差异与lncRNAs有关,而与siRNA无关,尽管在某些情况下,siRNA可能参与了生态型特异性调控。

图3. lncRNA是小RNA的前体。lncRNA的组成是Col和Ler转录组的主要特异性差异。A到F,检测作为每种类型小RNA (1RPM水平)前体的共有的和生态型特异性的转录本:A,非编码转录本,如siRNAs或长RNA。B,两种生态型中检测到的非编码转录本的主要siRNA大小的分布。两组中siRNA的大小没有明显变化。C,非编码RNA如21-nt和22-nt的siRNAs前体。D,非编码RNA为24nt siRNAs前体。E,编码RNA为21-nt和22-nt-siRNAs的前体。F,编码RNA为24nt-siRNAs的前体。

4  在磷酸盐缺乏的早期,不同生态型之间转录本的积累差异

Col型根在低磷酸盐处理前期生长受阻,而Ler型的根能持续生长为检测磷酸盐缺乏对根的影响,比较了两种生态型的表达谱。编码基因中,有3315个基因在两个生态型动力学上差异表达,有2504个基因在两种生态型的至少两个动力学点上差异表达(图4A)。两种生态型的差异表达基因数目在胁迫动力学中相似。然而,只有55个磷酸盐胁迫响应基因与生态型有关(图4A)。在Col型和Ler型中,分别有1566和1749个基因上调。不同生态型之间的非编码基因有明显的表达差异(图4B)。两种生态型中有675个非编码基因差异表达,有70个在不同时间点上差异表达。lncRNA和NATs有明显的差异表达(图4C、D)。与Ler相比,Col型中有146个lncRNA、236个NATs显著上调;与Col型相比,Ler有106个lncRNA、187个NATs显著上调。

RT-qPCR验证了Col、Coler105 和Ler中RNA-seq的14个基因间lncRNA差异表达基因,结果有14个lncRNA差异表达(图5A、B)。Col 和Coler105型的表达水平相似。在12个差异表达基因中,检测到中等水平的表达(8个具有统计学显著性,图5A、B)。

一个有意思的可能性是,在Ler和Col基因组中,lncRNA的特异性表达可能与磷酸盐饥饿响应调节子有关。研究人员能鉴定到两个特异的Ler磷酸盐转运体AT5G43370/PHT1.2基因反义lncRNAs,在Ler中的表达量高于Col。Ler中磷酸盐转运体表达量的增加可能与Pi的吸收增加有关。第二种情况,研究人员发现,Col中的NAT RNA与SPX4互补,SPX是一个磷酸盐响应的关键调节子,在Col中的表达量低于Ler。在其它情况下,研究人员观察到两个持续编码转录本有差异表达,说明不同生态型的表达谱可能与反式效应有关。

图4. 生态型和动力学影响的差异表达基因。A到D,编码基因和非编码基因在磷酸盐饥饿处理期间的生态型和动力学差异表达基因统计分析。差异表达的基因可以根据他们与基因型有关影响、动态影响、以及它们之间的互作分组。在确定全局分布后,基因分类为编码(A)和非编码(B)转录本。在非编码基因中,分类为其反义链注释(C)或基因间(D)转录本。

图5. RT-qPCR验证Col、Ler、Coler105和Col与Ler杂交型根尖lncRNAs的表达水平。A、Col中lncRNA表达增加;B、Ler中lncRNA表达增加。

5 不同生态型之间小RNA的差异积累

研究人员分析了磷酸盐饥饿胁迫下21/22 nt和24 nt小RNA的差异积累情况。鉴定了在两种生态型中,共有416个编码基因,211个非编码基因积累了不同的21/22-nt siRNAs。其中,Ler含298个编码基因,83个lincRNAs,40个NATs;Col中有118个编码基因,49个lincRNAs, 39个NATs。与Col相比,siRNAs表达上调的Ler有更多24-nt siRNAs基因积累。其中,Ler含758个编码基因,189个lincRNAs,67个NATs;Col中有391个编码基因,104个lincRNAs, 69个NATs。

两种生态型中有38个miRNAs基因差异表达。有趣的是,miR399和miR397家族在Ler中特异积累,这些miRNAs与磷酸酶(PHO2) 和氮限制适应转录本有关,其编码蛋白与磷酸盐转运体PHT1;4的降解有关。在Ler中,miR399和miR397的含量高可能导致PHO2和NLA的降低、以及PHT1;4的增加。如果影响Pi转运体的翻译后修饰不存在,这些基因表达上调能增加Pi的吸收。然而,不同生态型的PHO2、NLA和PHT1;4的转录本积累量无差别,说明PHO2和NLA的启动子活性能补偿Ler中这些miRNA积累量的增加。

6 lncRNA表达的错误调控影响了Col主根的生长

不同生态型的lncRNAs表达模式不同,这一点可能与根的生长调控有关。研究人员选取了不同生态型之间差异表达的5个lncRNAs基因:NPC15、NPC34、NPC43、NPC48和 NPC72,研究其对Col主根生长的影响。RNA-seq结果表明,NPC15、NPC43和NPC72在Col中高表达,NPC34、和NPC48在Ler中低表达(图6A)。研究人员分析了Col x Ler杂交一代F1的lncRNA表达谱,使用RT-qPCR证实了NPC15、NPC43和NPC72的RNA-seq结果(图6B)。未检测到NPC43基因的差异表达,可能是因为该基因位点反义转录本的的共同积累。不同生态型lncRNA的差异表达可能与基因位点的改变有关。在Ler v8中,NPC15位点有2417个核苷酸插入。Ler v7和v8基因组中,NPC72完全缺失。因此,这些位点的基因组修饰可能是Ler的NPC15和NPC72表达模式特异的原因。

为检测lncRNAs对表型的影响,在Col的5个基因中嵌入强启动子,检测基因过表达对根生长和磷酸盐胁迫的影响。对照组中,与Col相比,只有NPC48和NPC72过表达阻止了根的生长(图7A和B)。T-DNA插入到NPC48和NPC7位点的5”端,这些株系的lncRNAs发生过表达(图7C)。而在低磷酸盐胁迫下,Col的不同株系之间根的长度差别不大。对照组和低磷酸盐处理组的根生长比例强调了转基因植株对磷酸盐敏感性具有差异。

在对照组中,NPC48和NPC72表达下调菌株显著降低了根的生长。在低磷酸盐处理组则不影响根的生长。可能是由于在对照组条件下,突变体中Pi起部分限制作用。因此,研究人员质疑这些表型是否将根生长停滞与对磷酸盐缺乏的过度敏感或改变Pi的感应系统相关联。以下情况则不然:1)在对照条件下,已知的磷酸盐缺乏标记在根中没有下调,2)这些标记在这些株系中与Col型有相同程度的表达。然后,利用LRPs和低Pi状态下与主根生长受限有关的转录因子STOP1基因研究了局部Pi信号响应。在lpr1/lpr2和stop1突变体中,lncRNA的表达水平无明显差别(图7C)。在NPC48和NPC72中,LPR1/LPR2途径的表达水平也无明显差异。

为进一步研究NPC48的功能,对Col型过表达NPC48菌株进行了RNA-seq(图8)。在158个差异表达基因中,有140个编码基因上调且大多数与NPC48的表达量增加有关(图8A、B)。NPC48过表达菌株中的大多数非编码基因下调,包括2个lncRNA和15个NATs。进一步分析表明,下调基因与生态型和磷酸盐处理不相关(图8C、D),这些差异表达基因中,有一些与营养物质运输和根毛生长相关的基因,如ABCB3 、CPL1和JAL22;也有一些主根生长调节子基因,如RGF7、BIG、RPK2和CASP5发生上调。差异表达基因富含铁缺乏时相关的调节基因。因此,研究人员进一步分析了NPC48过表达是否改变看铁相关的表型:1)改变铁反应相关的基因表达2)培养基中铁浓度的改变导致根生长的显著变化。然而,NPC48的错误调控没有改变Fe相关的反应。

总之,确定生态型相关的lncRNA能加快主根生长的调节子的进一步研究。然而,在Ler和Col中过表达NPC48对其转录组的影响不同,一些与转运、生长调控和根毛相关的功能基因由于生态型特异的lncRNA错误调控而发生下调。

图6. Col和Ler中一些lncRNAs的表达水平。A,Col和Ler在早期磷酸盐胁迫时lncRNAs的表达谱,在Col和Ler中各时间点的5个选择的lincRNAs均有差异表达。B,Col、Ler、Coler105及Col与Ler杂交体在高磷酸盐条件下生长的11天时,植株根中相应lincRNAs的表达水平。

图7. 过表达lincRNAs的NPC48和NPC72影响根的生长。A,不同基因型和磷酸盐条件下生长11天的主根平均长度。B,各基因型在高磷酸盐条件下播种11天后根系代表图。C,NPC48和NPC72表达下调株系在高磷酸盐条件下生长11天时的表达水平。

图8.过表达NPC48的植株中的差异表达基因。在Col和35S:NPC48-1中有显著差异表达的基因数:A,140个编码基因,B,18个非编码基因。C和D,Venn图表示35S:NPC48-1中差异表达基因如何与Col、Ler之或磷酸盐饥饿动力学中发现的差异表达基因相关,分为编码(C)和非编码(D)基因。

讨论

直到现在,转录组多集中于蛋白编码基因而忽视了lncRNA。非编码基因组序列或表达谱的改变比蛋白序列的关键调节者对表型的影响小。目前普遍认为lncRNA在生物体发育和环境适应中起着重要作用。本研究对两株拟南芥的RNA-seq数据进行分析,发现有成千个未被描述的低水平表达lncRNA。与编码基因相比,很多lncRNA基因在Col或Ler中差异或特异表达。其它研究表明,物种间的差异与非编码基因相关。如大约45%的人类疾病与非编码区SNPs有关。SNPs直接影响lncRNA基因表达水平。lncRNA基因是遗传研究的一个不可重要因素。

令人惊讶的是,很少有生态型特异性lncRNAs与特定DNA序列的删除相吻合(图3)。此外,研究人员提出,一个lncRNA差异表达是由于lncRNA的转录速率或稳定性发生了变化,这些变化可能与启动子中的插入或删除的多态性和/或lncRNA远处位点的重排(如转座子插入)有关。由于lncRNAs可以抑制或激活其他基因的转录,在两个生态型之间观察到的表达多态性也可以导致对靶基因的顺式-局部或反式-末端作用的级联作用。值得注意的是,大多数鉴定的生态型特异性lncRNAs并不与siRNAs共定位,因此不能反映不同生态型的一个假定基因的沉默差异。这表明lncRNA本身或其转录本身与靶基因表达的定量调控有关。

研究人员通过RT-qPCR证实了12个lincRNAs的表达水平与RNA-seq的数据相一致(图5)。等位基因特异性表达影响植物的产量。拟南芥在开花时间和磷酸盐的获取中体现出杂交优势。因为lncRNAs仍能修饰染色质而改变基因表达,研究人员对Col和Ler的杂交一代进行了表达分析。与亲本相比,F1代中的12个差异表达基因加性表达。这一结果与玉米F1代的lncRNAs加性表达相一致。

已有研究表明,19个拟南芥生态型中,在每个生态型中鉴定到至少有70个附属基因。为应对胁迫,附属基因能部分被解释生态型中的不同差异。本研究发现lncRNAs有较低的选择压力(图2),结果进一步证实了附属基因在应对环境变化中起着相似的作用。

根尖在感应外环境中起着重要作用。在两种生态型中,编码基因表达有差异的数目相似,而lncRNAs和siRNAs差异表达的数目有明显的不同。在磷酸盐不同处理中差异表达的编码基因,有四分之一的在两种生态型中也差异表达。对于非编码基因,有八分之一的在两种生态型中差异表达(图4),说明生态型特异的磷酸盐响应主要来自于基因组的编码区。然而,在早期胁迫过程中,lncRNAs仍能通过染色质构象的改变影响植物对胁迫的响应。

在Pi缺乏两周的拟南芥中,约2000个mRNA能在植物体中移动这些mRNA能在根和茎之间移动表明这些移动的mRNAs可能广泛作为调控生长、细胞分化和适应胁迫的特异信号分子。这些lncRNAs具有3′polyA尾和5′帽子,可能参与了木质部或韧皮部的信号反应。

总的来说,深入分析拟南芥两种生态型的非编码转录组确定了生态型特异表达的lncRNAs,编码基因和非编码基因发生共同调控,这种共调控可能与生长在不同土壤环境中的生态型的调控机制的进化有关。本研究表明两种生态型相关的lncRNAs可能与调控主根生长有关。


更多推荐

1  科研 |INT J MOL SCI:水稻转录数据系统分析其对冷胁迫的响应和昼夜节律揭示与多种生物过程相关的分子网络

科研 |CHEMOSPHERE:不同耐性红麻品种对Cd胁迫的响应机制(国人佳作)

END

(0)

相关推荐