科研 | Industrial Crops & Products:借助转录组和小RNAome研究广东金钱草的夏佛塔苷(国人佳作)

编译:冬日暖阳,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

传统中草药广东金钱草中含有夏佛塔苷(schaftoside)可以预防尿路结石,然而夏佛塔苷的生物合成尚未得到解析。本文对广东金钱草叶和花进行转录组和小RNA组分析,鉴定出9955个差异表达的基因DEG和86个差异表达的microRNA。通路富集分析表明,与花相比,叶片中苯丙烷的生物合成和苯丙氨酸代谢较高。结果预测夏佛塔苷的生物合成基因C-葡萄糖基转移酶(CGT)和黄酮合酶II(FNSII),同时发现与CGT和FNSII共表达的1484个基因。此外,鉴定了211个多态性SSR标记可进一步用于标记辅助育种MAB;对miRNA及其靶向基因分析发现26个CGT共表达基因和184个DEGs。本文鉴定的候选基因和基于基因的标记物为研究夏佛塔苷的生物合成及育种研究奠定了坚实的基础。

论文ID

原名: Transcriptome and small RNAome facilitate to study schaftoside in Desmodium styracifolium Merr

译名: 借助转录组和小RNAome研究广东金钱草夏佛塔苷

期刊: Industrial Crops & Products

IF: 4.191(1区)

发表时间: 2020.3.15

通讯作者: 曾少华

通讯作者单位: 中国科学院华南植物园、赣南师范大学

DOI号: 10.1016/j.indcrop.2020.112352

实验设计

广东金钱草6个叶样品和3个花样品用于RNAseq表达谱分析,以鉴定参与总类黄酮生物活性成分生物合成的基因。4个叶样品和2个花样品用于小RNA组分析,并通过搜索miRBase鉴定已知miRNA,利用MiREvo和mirdeep2用于预测新miRNA。为了验证分子标记,随机选择了107个与CGT共表达的含SSR的基因设计了EST-SSR引物,从2个独立的广东金钱草中提取的DNA用作PCR模板,扩增并测序用于验证基于基因的标记。

结果

1 广东金钱草的转录组学分析

对广东金钱草叶和花的转录组分析,产生了超过15 Gbp的数据,获得188131个N50 762 bp和N90 236 bp的单基因。Pfam、KOG、NR、NT和GO数据库注释了18,660个单基因。与其他豆科植物相比,广东金钱草在与甘氨酸相关的单基因占比例最高,这表明广东金钱草在植物遗传学上可能比其他豆科植物更接近于大豆。GO注释表明,细胞过程、代谢过程、单一生物过程、生物调节、生物过程的调节以及细胞成分的组织或生物过程是排名前6位的生物过程。KEGG分析表明,558和900个单基因分类为萜类化合物和聚酮化合物的代谢以及其他次生代谢产物的生物合成。

比较了叶和花之间的RNAseq表达谱,以鉴定参与总类黄酮生物活性成分生物合成的基因。如图1所示,与花相比,在叶片中鉴定出9,955个DEG,4122个DEG上调,5833个下调。KEGG分析表明,叶片中淀粉和蔗糖代谢、苯丙氨酸类生物合成、植物激素信号转导、戊糖和葡糖醛酸相互转化以及苯丙氨酸代谢相关基因表达增加。

2 广东金钱草的小RNA组分析

对来源于叶和花的小RNA组进行了测序。通过搜索miRBase,鉴定出140种已知miRNA,其中在2个花样品中存在123和126种已知miRNA,在4个叶片样品中鉴定出118、120、121和123种已知miRNA。MiREvo和mirdeep2用于预测新型miRNA鉴定得到了61种新型miRNA。与花相比,在叶中差异表达了86种miRNA,包括64种已知miRNA和22种新的miRNA(图1B)。

与花相比,在叶中已知的miRNA有44种上调、42种下调,新的miRNA有15种上调、7种下调(图2)miRNA novel-33的靶基因有12个基因,novel-77的靶基因有19个,novell-90的靶基因有4个。特别是,miR156z靶向148个基因,miR1525靶向96个基因,miR156b靶向79个基因。DEmiRNA靶基因的GO富集表明DEmiRNA参与调节转录过程和代谢过程。这些途径包括结核病、抗原加工和表达、甲烷代谢、甘油脂代谢、倍半萜和三萜类生物合成以及心肌收缩。

图1. 与花相比,叶片中差异表达基因(DEGs)(A)和miRNA(B)的数量

图2. 花和叶中差异表达的miRNA

3 夏佛塔苷生物合成相关候选基因的鉴定

对已知的夏佛塔苷/异夏佛塔苷的生物合成途径相关基因的同源比对表明单基因c73785_g1和c53266_g1分别编码CGT和FNSII。体外酶活性分析表明CGT(单基因c73785_g1)参与夏佛塔苷的生物合成(未发表数据)。为了鉴定参与夏佛塔苷/异夏佛塔苷生物合成的候选基因,与CGT和FNSII共表达1484个基因,CGT共表达FNSII,r = 0.973。不仅与类黄酮结构基因PAL(c58773_g1)和4CL(c8867_g1)共表达,而且还与HY5、NFYA1、NAC90、MYB6、PIF3、WRKY55和bHLH68等转录因子共表达。

值得注意的是,这些TF包含SNP或SSR标记,表明它们是夏佛塔苷MAB的潜在标记。

为了评估miRNA对夏佛塔苷生物合成的影响,进一步检测CGT共表达的miRNA靶向单基因。如图3A所示,与CGT共表达53个miRNA-靶标单基因。其中,miR156靶向了8个基因,miR172也靶向了8个CGT共表达的基因,这表明miR156和miR172可能参与了夏佛塔苷的生物合成。此外,叶片中的miR156转录水平与SPLs转录因子相反,与夏佛塔苷生物合成基因(PAL、C4H、4CL、CHS、CHI、CGT和FNSII)相同(表1)。在拟南芥中,靶向miR156的SPL9不仅直接结合DFR从而抑制其表达,而且还与PAP1 R2R3结构域结合,进一步干扰BMW构象和花色苷的生物合成。因此,SPL可能以显性负性方式影响R2R3型MYB6对夏佛塔苷生物合成的正调控作用。同时,CGT启动子具有两个SPL结合顺式元件。总的来说,miR156和SPL直接或间接参与夏佛塔苷的生物合成。

图3. microRNA(miRNA)靶向的CGT共表达的单基因的Venn图(A)和基于基因的标记和/或miRNA靶向的CGT共表达的单基因的Venn图(B)。

表1.预测在广东金钱草中夏佛塔苷生物合成中涉及的基因的表达水平。

4 源自DEG和miRNA靶基因的基于基因的标记

为了促进广东金钱草分子标记辅助育种(MAB),开发EST-SSR和EST-SNP标记。24,837个单基因包含SSR,总共鉴定出30,934个SSR。除了20644个具有1个核苷酸SSR基序的EST-SSR外,另外有4879个和4946个具有2个和3个核苷酸SSR基序的EST-SSR。如表2所示,有3,490个含SSR的单基因和4,715个含SNP的单基因是DEG,184个靶向miRNA的DEG含有SSR和/或SNP。

为了找出候选EST标记,进一步鉴定34,331个含有SSR的基因SSRG、29,037个含SNP的基因SNPG,1,538个miRNA靶基因miRG和9,955个DEGs中共有的基因。如图4A所示,6组基因(I至VI)具有开发与某些性状相关的EST标记的能力,这将有利于MAB。Ⅰ组包含SSRG、miRG和DEG中共有的74个基因,包括了参与了萜类生物合成的基因如c56602_g1(角鲨烯环氧酶1)和c1178_g1(2-C-甲基-D-赤藓糖醇4-磷酸胞苷转移酶)。Ⅱ组为所有4组基因中共有的66个基因,有12个转录因子。Ⅲ组具有SSRG、miRG和DEG中共有的44个基因。Ⅳ组为SNPG和DEG共有的2,872个基因。Ⅴ组为SNPG,SSRG和DEG共有的1,703个基因。VI组为SSRG和DEG共有的1,677个基因。与花相比,I-VI组中共有6,436个含EST标记的基因在叶子中差异表达。其中,1,038个基因与CGT共表达(图4B)。考虑到夏佛塔苷是类黄酮衍生物,推测这些基于基因的标记物可能是广东金钱草MAB的潜在标记物。

图4.鉴定包含基于基因的标记(A)和CGT共表达的差异表达基因(DEG)的Venn图

5 源自CGT共表达基因的基于基因的标记

为了进一步筛选与夏佛塔苷生物合成相关的潜在分子标记,鉴定了CGT共表达基因的分子标记。1,038 个基因包含SSR和/或SNP,miRNAs靶标53个基因(图3A,4B)。如表2所示,miRNA靶向26个基因,607个基因具有SSR,751个基因具有SNP。274个SSR的基因以及307个SSR和SNP的基因与CGT共表达(图3B)。此外,miRNA靶向的13个含SSR的基因与CGT共表达。miR169靶向的NFYA1(c63827_g1)与CGT共表达并含有SSR(图3B)。含有SNP和SSR的另外13个CGT共表达基因被miRNA靶向(图3B)。其中,与CGT共表达的miR396靶向SVP(c64004_g1)包含SSR和SNP(图3B)。值得注意的是,CGT(c73785_g1)具有InDel和SNP标记,而FNSII(c53266_g1)具有SNP标记。这些结果表明,这些基因是研究夏佛塔苷生物合成的候选物。

6 验证基于基因的分子标记

为了验证分子标记,随机选择了107个与CGT共表达的含SSR的基因设计了EST-SSR引物,并用于验证基于基因的标记。其中104对(97.2%)引物成功扩增PCR产物,其中54对(50.5%)引物是多态性单体。值得注意的是,SSR位于PAL(c58773_g1)、4CL(c8867_g1)、MYB6(c180843_g1)和HY5中(c15341_g1)显示多态性,表明这些SSR标记可用于广东金钱草夏佛塔苷生物合成的MAB。

讨论

广东金钱草夏佛塔苷生物合成途径尚不清楚,本研究中大豆UGT708D1和蒺藜苜蓿MtFNSII用于同源预测广东金钱草CGT(c73785_g1)和FNSII(c53266_g1),未公开的数据表明CGT(c73785_g1)具有C-葡萄糖转移酶活性。值得注意的是,PAL、C4H、4CL、CHS、CHI、CGT和FNSII具有相同的表达模式,在叶片中高水平表达,在花中低水平表达。CGT与FNSII(r = 0.973)、PAL(r = 0.765)和4CL(r = 0.768)共表达。这些结果表明CGT和FNSII很可能参与了夏佛塔苷途径。除此之外,还有一些转录因子(TFs)与CGT和FNSII共表达,包括MYB6(c180843_g1)、PIF3(c66917_g1)和HY5(c15341_g1)。在拟南芥中,HY5和PIF3可调节类胡萝卜素的生物合成。这些结果表明,调节类黄酮生物合成的TFs可能参与了夏佛塔苷生物合成的调节。

在这项研究中,鉴定出201种miRNA和86种miRNA,包括64种已知的miRNA和22种新的miRNA,在叶和花中的表达具有差异。2个新的miRNA(novel-33和novel-77)与miR156具有高度的序列同一性,预计靶向SPL6、SPL9和SPL13。在拟南芥中,SPL6和SPL13与SPL9均为IIe组的成员,与花青素生物合成相关。如表1所示,在花和叶中miR156的表达模式与SPL相反,后者与CGT、FNSII、PAL和4CL负相关。这些结果表明,SPL6/9/13、novel-33/77和miR156很可能参与了广东金钱草夏佛塔苷/异夏佛塔苷的生物合成。

最近的研究表明,miRNA858负调控苯基丙烷的生物合成,针对黄酮醇特异性MYB转录因子(MYB11、MYB12和MYB111)的miRNA858在类黄酮生物合成中起着至关重要的调节作用。本文中未检测到miRNA858,这表明CHS和CHI可能由于叶黄酮特异性MYB12的主要转录本在叶子中高表达(表1)。尽管CHS和CHI与CGT和FNSII不共表达,但MYB12、CHS、CHI的表达方式与CGT和FNSII相同。这些结果表明,黄花甾醇特异性MYB12在一定程度上促进了广东金钱草夏佛塔苷的生物合成。

本文共鉴定出30,934个SSR、17,574个InDels和86,882个SNPs作为基于基因的标记。结果分析表明至少1,038个基于基因的标记可能与广东金钱草夏佛塔苷生物合成有关。SPL9(c15130_g1)、SPL6(c68884_g2)、SPL13(c58074_g1)和HY5(c15341_g1)包含SSR和SNP。MYB12(c161954_g1)也带有SSR标记。此外,HY5(c15341_g1)与CGT(r = 0.807)和FNSII(r = 0.898)共表达。同时,启动子分析表明,几个结合SPL的顺式元件位于FNSII和CGT的启动子中(数据未显示)。这些结果表明,位于基因中的SSR和/或SNP标记(例如SPL6/9/13、HY5和MYB12)可能有助于广东金钱草夏佛塔苷的分子育种。此外,本研究还鉴定了1,538个miRNA靶向基因和184个miRNA靶向DEG。其中30个具有SNP的miRNA靶向基因与CGT共表达;带有SSR的26个miRNA靶向基因与CGT共表达(图3B)。此外,共有13个CGT共表达基因和miRNA靶向基因具有SNP和SSR。这些结果表明,位于miR156或miR172上的SSR和/或SNP基因标记的发展可能有助于广东金钱草夏佛塔苷的分子育种。

评论

广东金钱草是重要的药用植物,具有抗糖尿病活性、抗氧化活性和抗炎性的药理特性,具有高水平的生物活性成分如夏佛塔苷。本文获得的转录组和小RNA组数据有助于研究夏佛塔苷的生物合成和调控。此外,本文开发高通量的基于基因的标记,为促进在广东金钱草中的MAB、遗传图谱和比较基因组学研究提供了宝贵的资源。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐