科研 | Industrial crops and products:深度测序鉴定参与樟树萜类生物合成的miRNA及其靶基因
编译:Jerry,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
樟树具有较高的经济、工业价值。樟树叶片挥发油中的萜类是美容、医药产品的重要原料。然而,樟树中miRNA对萜类生物合成的调控作用尚不明确。本探究使用miRNA测序和降解组测序技术测量了樟树中miRNA的数量及其靶基因。从芳樟醇型和龙脑型樟树叶片中检测到364个已知miRNA和117个新的miRNA。芳樟醇型(F_L)、龙脑型(L_L)樟树文库之间鉴定出14个差异表达miRNA,龙脑型樟树样品中有9个基因上调表达,5个基因下调表达。在选择的12个miRNA中,11个miRNA 的表达谱与miRNA测序结果一致,该结果得到了茎环实时定量PCR的验证。根据联合的叶片样本降解组测序分析结果,预测43个保守miRNA家族有363个目标unigene、15个新miRNA有144个目标unigene。靶基因鉴定分析表明,包括miR4995、miR5021和miR6300在内的一些miRNA可能与萜类调节有关。对樟树miRNA及其目标unigene的分析不仅有助于了解它们在樟树不同萜类的积累中发挥的作用,也为挥发油类的生物工程研究提供给了有价值的参考。
论文ID
原名:Deep sequencing identifies miRNAs and their target genes involved in the biosynthesis of terpenoids in Cinnamomum camphora
译名:深度测序鉴定参与樟树萜类生物合成的miRNA及其靶基因
期刊:Industrial crops and products
IF:4.58
发表时间:2019.10
通讯作者:Xu meng
通讯作者单位:南京林业大学南方现代林业协同创新中心
DOI号:10.1016/j.indcrop.2019.111853
实验设计
6月采集芳樟醇型、龙脑型樟树叶片,树龄为9年,取顶芽下方第4-8个叶片。液氮速冻,-80℃保存待用。每个化学型2个重复,提取RNA,构建文库,测序。ACGT101-miRNA去除原始读段中的杂质片段,纯净读段与miRBase v22.0收录的已知片段进行匹配。使用MiREvo和miRDeep2预测新miRNA。使用DESeq2寻找两种化学型之间的差异表达miRNA。用两种化学型的RNA混合样品构建降解组文库,测序。CleaveLand v3.0软件预测miRNA靶基因及其切割位点,所得的靶基因与NCBI的樟树转录组数据匹配,根据unigene的超富集丰度绘出“靶基因图”,对靶基因进行GO及KEGG通路分析。最后选取12个miRNA,进行茎环qRT-PCR,验证其表达量与测序结果的一致性。
结果
1 测序产生的sRNA
由4个樟树文库(F_L1、F_L2、L_L1和L_L2)中高通量测序得到的总读段数量介于1850万~1980万。测序结果提交到NCBI下的SRA数据库,登录号为PRJNA509985。去除poly-N(N百分率>10%)、低质量、接头和poly-T/A/C/G之后,长度为18-30nt的sRNA标签数量介于1300万~1510万。sRNA中长度最多的是24nt的sRNA标签,与梨、罂粟和东南景天的结果相似。约8.25%(1130556)的sRNA读段可匹配到Pfam数据库的非编码RNA(tRNA、snoRNA、snRNA和rRNA)。超过1000万个读段(4个文库平均值为77.66%)可匹配到樟树转录组。平均每个文库有85588个读段可鉴定为已知miRNA,70840个已匹配读段为新miRNA。4个文库详细信息见表1。

表1 樟树两种化学型sRNA深度测序谱
2 樟树叶片中miRNA 的鉴定
从芳樟醇型、龙脑型樟树中共鉴定出481个miRNA,336个为两者共有、82个为龙脑型特有、63个为芳樟醇型独有(图1a)。在这些miRNA中,364个已知miRNA包含能够无误匹配到miRBase v22.0中的成熟miRNA。新miRNA有117个不能匹配到miRBase v22.0中的成熟miRNA,但与miRNA前体的单链一致。这些新miRNA暂时命名为novel_序号的形式,如novel_1。已知miRNA中21nt的miRNA丰度最高,新miRNA中24nt的miRNA丰度最高(图1b)。这种分布情况与大麦相似。已知的miRNA与miRBase v22.0中的583个前体miRNA一致。这些前体miRNA多数与大豆、苹果、水稻、杨、玉米、蒺藜苜蓿和亚麻的前体miRNA同源。例如,樟树的242个前体miRNA与大豆的同源(图2)。此外,若干miRNA在不同植物之间高度保守,如miR156、miR159、miR171、miR166、miR396、miR167和miR172分别在54、54、51、46、38、37、33个物种中保守,提示它们在植物生物过程中的保守作用。

图1 从龙脑型和芳樟醇型樟树叶片中鉴定到的miRNA。(a)两种化学型的miRNA数量。(b)已鉴定miRNA 的长度分布。共发现481个miRNA,分为已知miRNA和新miRNA。

图2 樟树已知miRNA 的保守程度
3 樟树的差异表达miRNA
使用DESeq2鉴定F_L和L_L文库中的差异表达miRNA,标准为:调整Q<0.05且|log2 (变化倍数) |> 1。两个樟树化学型之间有14个显著差异表达miRNA,龙脑型樟树有9个上调表达miRNA、5个下调表达miRNA(表2)。在茎环qRT-PCR验证中,12个miRNA有11个(除了novle_134)的表达谱与sRNA测序结果一致(图3)。

表2 两种化学型樟树之间的差异表达miRNA。 a. |log2 (变化倍数) |>1的miRNA为显著上调,|log2 (变化倍数) | ≤1的miRNA为显著下调。b. miRNA靶标unigene的降解组检测结果。Y、N分别代表靶基因在/不在降解组内。

图3 樟树miRNA的茎环qRT-PCR。灰条为小RNA测序得到的相对表达量(右边y轴),黑条为qRT-PCR计算得出的miRNA表达水平(左边y轴)。误差线代表3个生物学重复的标准误差。
4 降解组测序鉴定miRNA靶基因
使用降解组测序技术鉴定樟树叶片中miRNA的潜在调控基因。miRNA引导的切割通常发生在miRNA与目标转录本互补区域5’端第10、11个碱基之间。按照这一特点,使用CleaveLand v3.0鉴定出477个miRNA目标unigene,包括43个保守已知miRNA家族的363个目标和15个新miRNA的114个目标。已知miRNA目标的比例见表3。我们注意到,某些情况下,一个个体保守的miRNA会参与多个靶基因的调控,例如,miR156、miR159、miR172、miR963和miR5021目标超过了20个(图5)。与miRNA配对的高相似度模体或许能解释靶基因的普遍性。然而,除了novel_10以外,所有新miRNA(特异性)的靶基因都是有限的。另外,在一些情况下,一个unigene可被一个以上的miRNA调控;例如,Cluster-13185.10758和Cluster-13185.97251可能被miR156、miR157和miR319共同调控(图4、表3)。miRNA的目标切割序列主要为植物转录因子。相似地,樟树叶片中许多miRNA的目标被注释为转录因子,例如SBP、MYB、TCP、WRKY、bHLH和ARF,说明了樟树miRNA可能具备调控转录因子基因家族的能力。

表3 樟树降解组分析鉴定出的已知miRNA

图4 樟树叶片miRNA 的调控网络
根据miRNA对应的靶基因丰度标记相对于其他已匹配到的丰度标记,被切割的靶基因可分为5大类。具有唯一miRNA导向切割位点且标记丰度最高的靶基因定义为第0类。靶基因切割位点标记在所有标记中丰度最高的为第1类。靶基因剪切信号丰度高于中位数的为第2类。靶基因剪切标记丰度低于中位数的为第3类。靶基因只有1个miRNA互补读段的为第4类。在鉴定到的已知miRNA的364个靶转录本中,203个(55.7%)靶基因属于第0、1、2类,161个属于3、4类。对于第0、1、2类miRNA导向切割的靶基因的预测会更准确,因为这几类靶基因的标记丰度显著高于3、4类。
5 miRNA靶基因的GO及KEGG分析
GO分析吧靶基因的功能归纳为3大类,细分为50个GO分类条目(图5a)。在生物过程大类中,靶基因数量最高的是“氧化还原过程”、“转录调控”和“蛋白磷酸化”。在分子功能大类下,靶基因主要与“蛋白质结合”和“DNA结合”相关。细胞组成大类下,靶基因主要集中在“膜”和“膜整体成分”条目。
根据KEGG通路分析,靶基因与19个代谢通路相匹配,其中“翻译”(158)、“碳水化合物代谢”(137)和“环境适应”(95)通路的富集程度最高(图5b)。38个靶基因匹配到“萜类和聚酮代谢”通路,如gmamiR6300靶基因为脱落酸8’-羟化酶4(Cluster-13185.83504, Cluster-13185.83505和Cluster-13185.53179),novel_10靶基因为细胞色素P450 724B1近似物(Cluster-13185.51660、Cluster- 13185.68806和Cluster-13185.72493)。有趣的是,我们确认了由aht-miR5021切割的双香叶基二磷酸还原酶(GGDR, Cluster-13185.61050)参与了“萜类骨架生物合成”和“卟啉和叶绿素代谢”通路(图6)。

图5 樟树中miRNA靶标unigene的注释信息。(a)樟树中靶基因的GO分析。(b)靶基因的KEGG注释。x轴为被注释靶基因中可注释到通路上靶基因百分比。y轴代表KEGG通路。

图6 参与萜类及聚酮生物合成的miRNA靶基因的功能。miRNA剪切用实线和“T”形箭头表示。
讨论
樟树是中国重要的挥发油工业树种,特别是芳樟醇型和龙脑型樟树。近年来,人们越发意识到miRNA是操控所有生物合成通路的工具。对miRNA调控重要经济作物次生代谢的报道日益增多。但是,樟树中miRNA潜在的基因调控作用仍然未知。因此,研究者对樟树叶进行sRNA测序的生物信息学分析以及降解组测序,以探讨其miRNA潜在的调控网络。
对于从已知miRNA调控网络中鉴定出的363个靶基因,多数具有保守功能,包括转录调控、细胞生长发育、病原应答和次生代谢(表3)。有趣的是,我们从樟树中鉴定出了最有可能是差异表达miRNA gma-miR4995靶基因的吲哚-3-丙酮酸单加氧酶(Cluster-13185.61534)。植物萜类通过甲羟戊酸(MVA)和2-C-甲基-D-赤藓糖醇-4-磷酸酯(MEP)通路在细胞中合成萜类。在萜类合酶(TPS)的催化下,5碳前体缩合为各种萜类。植物中萜类多样性高的一个原因在于,TPS的直接产物会被羟基化、糖基化、甲基化、环氧化、还原、卤化修饰。这些后修饰酶包括依赖于细胞色素P450的单加氧酶、脱氢酶及还原酶、糖基转移酶和甲基转移酶。在之前的转录组测序研究中,氧化还原酶活性在龙脑型和芳樟醇型樟树中显著富集。胡黄连的miR4995靶基因3-脱氧-7磷酸庚酮糖合酶可通过调控萜类生物合成影响胡黄连苷I的生成。因此,gma-miR4995可能在芳樟醇型及龙脑型樟树的萜类生物合成中具有关键的调节作用。
人们已经报道了包括miR5021在内的某些与植物次生代谢相关的miRNA,而miRNA对次生代谢产物的调控也有频繁报道。在长春花中,miR5021对于萜类骨架的生物合成有调控作用,并且调节了双香叶基二磷酸的表达。。在上游的类异戊二烯通路,在苍耳中已预测过miR5021靶基因为羟甲基戊二酰-辅酶A合酶(HMGR)、异戊烯二磷酸异构酶(IDI)及二磷酸合酶(IDS)。本研究中,3个miRNA及其靶基因与萜类和聚酮代谢相关(图6)。miR5021靶基因GGDR定位在异戊二烯通路的下游分支,可将双香叶基二磷酸(GGPP)催化为叶绿基焦磷酸(phytyl-pp)。此外,miR6300靶基因脱落酸8’-羟化酶参与了胡萝卜素生物合成。然而,GGPP是二萜、胡萝卜素和其他聚酮类生物合成的共同底物。因此,miR5021和miR6300可能也参与了樟树萜类积累的调控。另外,miR5021的两个靶基因(Cluster-13185.58317和Cluster-13185.55128)被注释为查耳酮合酶,提示其可能也参与了黄酮生物合成。
研究者从樟树转录组数据中鉴定出15个新miRNA的114个靶基因。在很多调控情况下,新miRNA的表达模式与靶基因相关,提示这些新miRNA对靶基因具有负调控作用(图7)。Novel_1miRNA有6个靶基因,包括2个植物病原互作基因、3个MYB转录因子和1个WRKY转录因子,说明它可能参与了防御调控。MYB和WRKY蛋白是植物代谢、发育和胁迫响应的调控网络中的关键因子。在novel_10潜在的67个靶基因中,3个unigene被注释为细胞色素P450 724B相似物蛋白,表明它们可能参与了油菜类固醇生物合成(图6)。然而,许多新miRNA假定靶基因的功能尚不明确,与其他物种也没有同源性,提示它们可能在樟树中有特殊功能。需要深入研究这些miRNA以确认其功能。

图7 樟脑叶片中新miRNA及其靶基因的表达模式。新miRNA表达模式在左侧以log2(TPM+1)数值的形式标出,右边数值代表基于log2(FPKM+1)值判断的miRNA靶基因。
评论
更多推荐
1 科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响
