科研 |Commun Biol:甜瓜比较基因组揭示逆转录转座子在基因表达中的作用

编译:YQ,编辑:景行、江舜尧。

原创微文,欢迎转发转载。

导读

甜瓜是重要经济作物,起源于印度或亚洲其他国家,其果实表型发生了许多自然变异,尤其在果实成熟生理方面,包括呼吸跃变果实型(成熟时产生乙烯并呼吸骤停)和非呼吸跃变型果实类型。鉴于乙烯对果实贮藏期和成熟期性状的调节作用,对产生乙烯的分子机制进行研究具有重要意义。

甜瓜基因组由12条染色体组成,基因组大小~454Mb。第一个甜瓜全基因组是DHL92,包括337Mb的核苷酸序列和79.6Mb的模糊碱基(NNN),包含29980个蛋白编码基因,而目前甜瓜基因组的结构变异,尤其是拷贝数变异(CNV)和插入/缺失多态性(PAP)的研究较少。本研究采用ONT(牛津纳米孔技术)全长基因组测序结合BioNano光学测序和Illumina高通量测序方法,构建半呼吸跃变日本网纹甜瓜(Cucumis melo var. reticulatus)的全基因组序列。基于ONT全长转录组测序鉴定出33829个蛋白编码基因,识别PAP及逆转录转座子位点。结合比较基因组和转录组分析,本研究认为逆转录转座子在甜瓜基因组遗传变异过程中基因表达的修饰和果实成熟诱导基因的进化发挥作用。

论文ID

原名:Comparative genomics of muskmelon reveals a potential role for retrotransposons in the modification of gene expression

译名:甜瓜比较基因组揭示逆转录转座子在基因表达中的作用

期刊:Communications Biology

IF:4.165

发表时间:2020年8月

通讯作者:Hiroshi Ezura

通讯作者单位:日本筑波大学生命与环境科学学院

DOI号:10.1038/s42003-020-01172-0

实验设计

结果

1 甜瓜基因组的组装和比较

本研究选择甜瓜品种Harukei-3(一种日本高级甜瓜),外观如图1a所示。与Pacbio相比,ONT测序产生更多长序列片段,N50=8.6Mb(图1b)。基于Bionano测序后获得80条scaffolds,N50=17.5Mb。基于Pacbio测序,利用最终的28条scaffolds构建12条染色体序列,与先前研究的连锁图谱进行比较时完全共线(图1d),表明组装是正确的。对Harukei-3和DHL92进行基因组比对,大部分比对结果呈共线性,而有部分染色体易位(图1e)。此外,Harukei-3基因组显示一个大的序列重复(>120kb,在5号和9号染色体)。

为研究基因组的基因信息,对Harukei-3序列进行基因预测。使用ONT RNA-seq获得接近全长的mRNA分子序列,共鉴定出33829个蛋白编码基因(33314个核基因+515个细胞器基因)。然后,利用BLAST比对分析Harukei-3和DHL92基因组的同源关系(图2a)。Harukei-3的33314个核基因中,24747个与DHL92直系同源,1203个基因是CNV和PAP的候选基因。将一个共有的基因标识附加到Harukei-3基因组的24,747个直向同源基因上(一个以“MELO3C”字符串开头,以“. jh1”字符串结尾的基因标识),以帮助在甜瓜基因组中保持一致的基因命名(图2b)。

图1 Harukei-3甜瓜全基因组组装。a,Harukei-3甜瓜果实外观;b,ONT和PacBio测序长度分布图;c,染色体图谱;d,基因组与连锁图谱的比较;e,Harukei-3和DHL92基因组共线性比对。

图2 Harukei-3和DHL92的基因组比较。a,比较基因组圈图。蓝线表示直系同源,灰线表示同源基因,紫线表示串联重复序列,红线表示拷贝数变异和插入/缺失多态性,橙线表示未锚定的基因;b,Harukei-3基因ID的重命名,MELO3C表示与DHL92的同源基因。

2 果实成熟基因的共表达分析

由于Harukei-3果实在成熟过程中产生乙烯,本研究选择乙烯相关基因进行分析(图3a)。RNA-seq共鉴定27687个基因,权基因组相关网络分析(WGCNA)鉴定60个共表达簇。其中,成熟果实中乙烯相关基因(CmACO1、CmETR1/2、CmNOR-NAC)表达上调(图3b)。共表达分析中一个特定的果实成熟表达簇包括乙烯相关基因、81个NAC结构域蛋白,42个MADS-box转录因子(图4a)。这一基因簇的中心域,有一个花器官发育的关键调节因子AGAMOUS(MELO3C019694),这一基因也是调控果实成熟的候选QTL。分析MELO3C019694的基因序列,发现其上游启动子区域含两个含末端重复序列的逆转录转座子(图4b)。在这个基因周围,有两个逆转录转座子相关蛋白编码基因,其中MELO.jh102711.1编码蛋白具有逆转录转座子Gag结构域、逆转录天门冬氨酰蛋白酶结构域、逆转录结构域。而且,MELO3C019694和邻近的逆转录转座蛋白基因表现相似的表达模式,在成熟果实中表达水平最高(图4c)。

图3 Harukei-3甜瓜组织的RNA-seq数据集。a,采样部位;b,果实成熟相关基因的表达模式。

图4 果实成熟关键调控因子MELO3C001864启动子区域的逆转录转座子鉴定。a,含果实成熟相关基因的共表达基因簇;b,MELO3C019694周围的编码基因;c,MELO3C019694和邻近逆转录转座子相关基因的组织表达模式。

3 逆转录转座子PAP和GAG序列表达

Harukei-3基因组的上游启动子序列中存在末端重复的逆转录转座子,此外本研究发现Harukei-3和DHL92基因组中1203个假定CNV和PAP候选基因,富集显示这些基因与逆转录转座功能相关。Harukei-3和其他甜瓜基因组比对表明这些逆转录转座子序列中有插入/缺失多态性,其中一些位点保守存在(如MELOjh102304.1),一些位点只存在于特定的甜瓜基因组(如MELOjh102711.1、MELOjh033067.1)(图5a)。聚类分析表明品种Natsukei-1和Fuyukei与Harukei-3相似,它们有相同的起源(图5b)。相比下亚洲品种Awamidori、Ougon-9、JSS6与Harukei-3关系较远。这表明逆转录转座子的PAP与品种间遗传关系相关。分析415个逆转录转座子的GAG序列的组织表达模式,160个序列在果实成熟时表达水平最高(图5c)。其中MELO.jh033067.1仅在网纹甜瓜中存在,且在成熟果实中的表达量高于其他基因。59.4%的果实成熟诱导的GAG序列基因表现相似的表达模式(图5d)。

图5.PAP和果实成熟诱导的逆转录转座子序列表达。a,甜瓜基因组间415个逆转录转座子的插入/缺失多态性;b,基于插入/缺失多态性对10个甜瓜基因组进行聚类;c,果实成熟诱导的GAG序列的表达;d,GAG序列与其邻近基因表达相关性。

4  热诱导逆转录转座子GAG序列的表达

研究表明植物逆转录转座子相关序列的表达在非生物和生物胁迫时上调。为研究Harukei-3逆转录转座子相关序列的环境响应,本研究对温室内生长的植物从初夏到深秋每周收集的叶片样本进行转录组分析。在仲夏时期生长的Harukei-3植株表现严重热胁迫损伤,而在较凉爽时叶片较厚,呈浓绿,瓜果更甜(图6a)。对18棵植株进行75个时间点RNA-seq,WGCNA共表达分析表明逆转录转座子与hsp20热休克蛋白共表达(图6b-c)。胁迫响应调节因子(AtABF3、AtDEAR2)也与GAG序列共表达(图6c-d),表明仲夏生长的甜瓜除受到热胁迫外,还受干旱胁迫。因此,一些逆转录转座子GAG序列对非生物胁迫(如热胁迫)有响应。

图6. 7-11月温室中反转座子Gag样序列的转录反应。a,无胁迫或热胁迫条件下的Harukei-3甜瓜植株。每周用打孔机收集叶盘。从7月到11月,总共从18个独立的Harukei-3植物中获得了75个RNA序列数据。B,在与反转座子Gag样序列共表达的基因中进行基因组间序列分析。共表达数据集是基于温室中获得的75叶RNA-seq数据。c,热休克蛋白基因在基因中高度富集。Gag样序列与非生物胁迫相关基因的共表达。Gag样序列和非生物胁迫相关基因在一个簇中共同表达(用红色虚线圆圈表示)。d,温室中基因表达的变化。两个反转座子Gag样序列的表达模式与非生物胁迫相关基因如AtABF3样和AtHSP21样的表达模式一起显示。

结论

本研究基于比较基因组表明甜瓜基因组的逆转录转座子GAG序列存在大量PAP。研究表明植物LTR逆转录转座子分为gypsy和copia类,表现应激性转录,如乙烯应激诱导辣椒逆转录转座子表达。若逆转录转座子插入启动子区域,可能会影响顺式作用元件,进而改变下游基因转录。因此,有可能逆转录转座子区域携带顺式作用或增强子元件,可诱导果实成熟诱导基因的表达。乙烯的产生可能间接驱动GAG序列转录。在植物中乙烯的生物合成在非生物胁迫下响应,包括热胁迫。拟南芥中逆转录转座子的热诱导转录通过小干扰RNA调控,因此甜瓜LTR逆转录转座子中也可能存在一种表观遗传调控机制。这一机制不仅是瓜类植物基因组多样化的驱动力,也可能是其他植物基因组多样化的驱动力。

MELO3C019694jh1是番茄催熟调节因子的一个同源基因,研究表明该基因在法国甜瓜品种Vedrantais的表达水平高于西班牙品种Pielde Sapo。该基因可能是果实成熟的调控因子,因为它与已知的乙烯相关果实成熟基因CmACO1和CmNOR-NAC共表达。由于Vedrantais和Pielde Sapo分别是呼吸跃变甜瓜和非呼吸跃变甜瓜,其基因表达水平差异不仅与果实缝合有关,还与成熟行为(如乙烯产生)有关。考虑到该基因启动子区域的逆转录转座子在某些瓜类基因组中缺失,这种逆转录转座子的插入可能涉及瓜类品种间基因表达水平的变化。使用基因组编辑或比较转录组学方法可阐明该LTR逆转录转座子在果实成熟过程中的具体作用。


更多推荐

高分综述 | Trends in Biotechnology: 单细胞分辨率下利用空间转录组揭示器官分子结构(国人佳作)

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐

  • 不想再用慢病毒了,我还有什么别的选择吗?piggyBac transposon

    慢病毒可快速.高效的将目的基因整合到宿主细胞基因组,非常适合用于构建稳转细胞株.但慢病毒也有缺点,即使是稳转细胞株,可能会随着传代次数的增加而慢慢丢失干扰或者过表达的效率.其中可能是原因是在多克隆稳转 ...

  • 小麦白粉菌Effector

    小麦白粉菌Effector

  • “基因书写”能破CRISPR局限?这家顶级风投孵化的新锐或将改写遗传病的未来|独家专访

    从 1963 年美国分子生物学家.诺贝尔生理学/医学奖获得者 Joshua Lederberg 第一次提出 "基因交换" 和"基因优化"概念开始,科学界和医学界 ...

  • 实验发现 新冠病毒可把自身片段逆转录进我们的基因

    majer @ 2021.05.13 , 12:51 人类的基因组是一个大坟场,里面到处都是曾经困扰我们祖先的病毒的基因片段.如果麻省理工学院研究人员的最新研究经受住了质疑,那么新冠病毒很可能也会加入 ...

  • Piggybac转座子载体是什么?

    在我们研究某种疾病的发病机制或者某种药物的作用靶点时,经常需要建立目的基因过表达或基因敲除的细胞模型,目前构建稳转细胞株及部分敲除细胞株最常用的方式之一是慢病毒法,慢病毒因其可以转染几乎所有种类的细胞 ...

  • 哺乳动物基因表达piggyBac载体

    PiggyBac载体系统可以非常高效地把外源DNA插入哺乳动物细胞的基因组,该系统技术简单,可利用质粒转染(非病毒转导)把您所感兴趣的基因长期稳定地整合到靶细胞基因组. 该系统来源于piggyBac转 ...

  • 哺乳动物基因表达Tol2载体是什么?

    Tol2载体系统能高效地将外源DNA插入宿主细胞基因组中.该系统技术简单,利用质粒转染(非病毒转导)将目的基因永久整合到宿主基因组中. 该系统来源于Tol2转座子,它最初是从硬骨鱼青鳉鱼(Oryzia ...

  • 生命源于不确定的偶然性,演化中的“噪音”造就了多样性

    从猿到人的演化历程   "不确定性"可能是生命与非生命物体最根本的区别.所有非生命的东西,不管是化学系统,还是物理系统,大多是确定性的. 尽管生命在分子生物学时代被视为确定性的&q ...

  • 乳酸菌的生物学特性

    乳酸菌是能利用碳水化合物代谢主要产乳酸的一类细菌的统称.乳酸菌在自然界分布广泛,种类繁多,与人类生产生活密切相关,具有重要的社会和经济价值.乳酸菌代表了一种典型的微生物代谢类型,是研究细菌代谢及分子遗 ...

  • Sleeping Beauty转座载体是什么?

    我们的睡美人(Sleeping beauty)转座载体系统可以高效地将外源DNA插入宿主细胞基因组.该系统在技术上十分简洁,仅需要进行质粒转染(无需病毒转导)即可永久性地对宿主细胞基因组插入您的目的基 ...