科研 |Commun Biol:甜瓜比较基因组揭示逆转录转座子在基因表达中的作用
编译:YQ,编辑:景行、江舜尧。
原创微文,欢迎转发转载。
甜瓜是重要经济作物,起源于印度或亚洲其他国家,其果实表型发生了许多自然变异,尤其在果实成熟生理方面,包括呼吸跃变果实型(成熟时产生乙烯并呼吸骤停)和非呼吸跃变型果实类型。鉴于乙烯对果实贮藏期和成熟期性状的调节作用,对产生乙烯的分子机制进行研究具有重要意义。
论文ID
原名:Comparative genomics of muskmelon reveals a potential role for retrotransposons in the modification of gene expression
译名:甜瓜比较基因组揭示逆转录转座子在基因表达中的作用
期刊:Communications Biology
IF:4.165
发表时间:2020年8月
通讯作者:Hiroshi Ezura
通讯作者单位:日本筑波大学生命与环境科学学院
DOI号:10.1038/s42003-020-01172-0
实验设计
结果
本研究选择甜瓜品种Harukei-3(一种日本高级甜瓜),外观如图1a所示。与Pacbio相比,ONT测序产生更多长序列片段,N50=8.6Mb(图1b)。基于Bionano测序后获得80条scaffolds,N50=17.5Mb。基于Pacbio测序,利用最终的28条scaffolds构建12条染色体序列,与先前研究的连锁图谱进行比较时完全共线(图1d),表明组装是正确的。对Harukei-3和DHL92进行基因组比对,大部分比对结果呈共线性,而有部分染色体易位(图1e)。此外,Harukei-3基因组显示一个大的序列重复(>120kb,在5号和9号染色体)。
为研究基因组的基因信息,对Harukei-3序列进行基因预测。使用ONT RNA-seq获得接近全长的mRNA分子序列,共鉴定出33829个蛋白编码基因(33314个核基因+515个细胞器基因)。然后,利用BLAST比对分析Harukei-3和DHL92基因组的同源关系(图2a)。Harukei-3的33314个核基因中,24747个与DHL92直系同源,1203个基因是CNV和PAP的候选基因。将一个共有的基因标识附加到Harukei-3基因组的24,747个直向同源基因上(一个以“MELO3C”字符串开头,以“. jh1”字符串结尾的基因标识),以帮助在甜瓜基因组中保持一致的基因命名(图2b)。
图1 Harukei-3甜瓜全基因组组装。a,Harukei-3甜瓜果实外观;b,ONT和PacBio测序长度分布图;c,染色体图谱;d,基因组与连锁图谱的比较;e,Harukei-3和DHL92基因组共线性比对。
图2 Harukei-3和DHL92的基因组比较。a,比较基因组圈图。蓝线表示直系同源,灰线表示同源基因,紫线表示串联重复序列,红线表示拷贝数变异和插入/缺失多态性,橙线表示未锚定的基因;b,Harukei-3基因ID的重命名,MELO3C表示与DHL92的同源基因。
2 果实成熟基因的共表达分析
由于Harukei-3果实在成熟过程中产生乙烯,本研究选择乙烯相关基因进行分析(图3a)。RNA-seq共鉴定27687个基因,权基因组相关网络分析(WGCNA)鉴定60个共表达簇。其中,成熟果实中乙烯相关基因(CmACO1、CmETR1/2、CmNOR-NAC)表达上调(图3b)。共表达分析中一个特定的果实成熟表达簇包括乙烯相关基因、81个NAC结构域蛋白,42个MADS-box转录因子(图4a)。这一基因簇的中心域,有一个花器官发育的关键调节因子AGAMOUS(MELO3C019694),这一基因也是调控果实成熟的候选QTL。分析MELO3C019694的基因序列,发现其上游启动子区域含两个含末端重复序列的逆转录转座子(图4b)。在这个基因周围,有两个逆转录转座子相关蛋白编码基因,其中MELO.jh102711.1编码蛋白具有逆转录转座子Gag结构域、逆转录天门冬氨酰蛋白酶结构域、逆转录结构域。而且,MELO3C019694和邻近的逆转录转座蛋白基因表现相似的表达模式,在成熟果实中表达水平最高(图4c)。
图3 Harukei-3甜瓜组织的RNA-seq数据集。a,采样部位;b,果实成熟相关基因的表达模式。
图4 果实成熟关键调控因子MELO3C001864启动子区域的逆转录转座子鉴定。a,含果实成熟相关基因的共表达基因簇;b,MELO3C019694周围的编码基因;c,MELO3C019694和邻近逆转录转座子相关基因的组织表达模式。
3 逆转录转座子PAP和GAG序列表达
Harukei-3基因组的上游启动子序列中存在末端重复的逆转录转座子,此外本研究发现Harukei-3和DHL92基因组中1203个假定CNV和PAP候选基因,富集显示这些基因与逆转录转座功能相关。Harukei-3和其他甜瓜基因组比对表明这些逆转录转座子序列中有插入/缺失多态性,其中一些位点保守存在(如MELOjh102304.1),一些位点只存在于特定的甜瓜基因组(如MELOjh102711.1、MELOjh033067.1)(图5a)。聚类分析表明品种Natsukei-1和Fuyukei与Harukei-3相似,它们有相同的起源(图5b)。相比下亚洲品种Awamidori、Ougon-9、JSS6与Harukei-3关系较远。这表明逆转录转座子的PAP与品种间遗传关系相关。分析415个逆转录转座子的GAG序列的组织表达模式,160个序列在果实成熟时表达水平最高(图5c)。其中MELO.jh033067.1仅在网纹甜瓜中存在,且在成熟果实中的表达量高于其他基因。59.4%的果实成熟诱导的GAG序列基因表现相似的表达模式(图5d)。
图5.PAP和果实成熟诱导的逆转录转座子序列表达。a,甜瓜基因组间415个逆转录转座子的插入/缺失多态性;b,基于插入/缺失多态性对10个甜瓜基因组进行聚类;c,果实成熟诱导的GAG序列的表达;d,GAG序列与其邻近基因表达相关性。
4 热诱导逆转录转座子GAG序列的表达
研究表明植物逆转录转座子相关序列的表达在非生物和生物胁迫时上调。为研究Harukei-3逆转录转座子相关序列的环境响应,本研究对温室内生长的植物从初夏到深秋每周收集的叶片样本进行转录组分析。在仲夏时期生长的Harukei-3植株表现严重热胁迫损伤,而在较凉爽时叶片较厚,呈浓绿,瓜果更甜(图6a)。对18棵植株进行75个时间点RNA-seq,WGCNA共表达分析表明逆转录转座子与hsp20热休克蛋白共表达(图6b-c)。胁迫响应调节因子(AtABF3、AtDEAR2)也与GAG序列共表达(图6c-d),表明仲夏生长的甜瓜除受到热胁迫外,还受干旱胁迫。因此,一些逆转录转座子GAG序列对非生物胁迫(如热胁迫)有响应。
图6. 7-11月温室中反转座子Gag样序列的转录反应。a,无胁迫或热胁迫条件下的Harukei-3甜瓜植株。每周用打孔机收集叶盘。从7月到11月,总共从18个独立的Harukei-3植物中获得了75个RNA序列数据。B,在与反转座子Gag样序列共表达的基因中进行基因组间序列分析。共表达数据集是基于温室中获得的75叶RNA-seq数据。c,热休克蛋白基因在基因中高度富集。Gag样序列与非生物胁迫相关基因的共表达。Gag样序列和非生物胁迫相关基因在一个簇中共同表达(用红色虚线圆圈表示)。d,温室中基因表达的变化。两个反转座子Gag样序列的表达模式与非生物胁迫相关基因如AtABF3样和AtHSP21样的表达模式一起显示。
结论
本研究基于比较基因组表明甜瓜基因组的逆转录转座子GAG序列存在大量PAP。研究表明植物LTR逆转录转座子分为gypsy和copia类,表现应激性转录,如乙烯应激诱导辣椒逆转录转座子表达。若逆转录转座子插入启动子区域,可能会影响顺式作用元件,进而改变下游基因转录。因此,有可能逆转录转座子区域携带顺式作用或增强子元件,可诱导果实成熟诱导基因的表达。乙烯的产生可能间接驱动GAG序列转录。在植物中乙烯的生物合成在非生物胁迫下响应,包括热胁迫。拟南芥中逆转录转座子的热诱导转录通过小干扰RNA调控,因此甜瓜LTR逆转录转座子中也可能存在一种表观遗传调控机制。这一机制不仅是瓜类植物基因组多样化的驱动力,也可能是其他植物基因组多样化的驱动力。
MELO3C019694jh1是番茄催熟调节因子的一个同源基因,研究表明该基因在法国甜瓜品种Vedrantais的表达水平高于西班牙品种Pielde Sapo。该基因可能是果实成熟的调控因子,因为它与已知的乙烯相关果实成熟基因CmACO1和CmNOR-NAC共表达。由于Vedrantais和Pielde Sapo分别是呼吸跃变甜瓜和非呼吸跃变甜瓜,其基因表达水平差异不仅与果实缝合有关,还与成熟行为(如乙烯产生)有关。考虑到该基因启动子区域的逆转录转座子在某些瓜类基因组中缺失,这种逆转录转座子的插入可能涉及瓜类品种间基因表达水平的变化。使用基因组编辑或比较转录组学方法可阐明该LTR逆转录转座子在果实成熟过程中的具体作用。
更多推荐
1 高分综述 | Trends in Biotechnology: 单细胞分辨率下利用空间转录组揭示器官分子结构(国人佳作)