科研 | Plant Molecular Biology:全长转录组分析三角叶黄连中BIA合成过程及相关基因鉴定(国人作品)

编译:寒江雪,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

三角叶黄连是一种具有悠久药用历的史的用植物,它富含丰富的苄基异喹啉生物碱(BIA)。本研究利用UPLC-MS/MS和高通量测序的方法对三角叶黄连BIA的含量及转录组进行分析。通过代谢组学分析10种BIA的含量发现不同组织中BIA的含量不同。三代全长转录组测序共得到75438个全长转录本。研究人员提出了BIA前体酪氨酸的候选生物合成途径,并鉴定了64个编码可能与生物合成有关的酶的全长转录本。转录组结果发现大部分基因在根部高表达。BIA的转运对其积累也很重要,鉴定出9个ABC转运蛋白和2个MATE转运蛋白与已知的根和根茎BIA转运相关的生物碱转运蛋白高度同源。基于二代和三代的测序数据为三角叶黄连提供了有价值的遗传信息,转录组结合代谢组联合分析的结果可以帮助我们更好地了解这种药用植物的BIA的生物合成和运输机制。这些信息将为进一步鉴定三角叶黄连转录组和对这种资源稀缺的药用植物进行分子辅助育种提供关键信息。

论文ID

原名:Full‑length transcriptome analysis of Coptis deltoidei and identification of putative genes involved in benzylisoquinoline alkaloids biosynthesis based on combined sequencing platforms

译名:三角叶黄连的全长转录组分析及苄基异喹啉生物碱合成相关基因的鉴定

期刊:Plant Molecular Biology

IF:3.928

发表时间:2020.1

通讯作者:严铸云

通讯作者单位:成都中医药大学药学院

DOI号:10.1007/s11103-019-00959-y

实验设计

本研究选取9株四年生三角叶黄连随机分为3组(每组3株),取叶、叶柄、根茎、根和匍匐茎5个组织。对所有样本通过UPLC-MS/MS进行BIA含量的测定。利用染色等方法对BIA物质在不同组织中进行定位分析。将5个组织样本混为1个样本完成三代全长转录组测序,根,根茎和叶3个组织分别进行二代转录组测序分析,并通过qRT-PCR对转录组结果进行验证。

结果

1 三角叶黄连不同组织中BIA的积累

苄基异喹啉生物碱是一种含氮的植物次生代谢产物,主要存在于罂粟科、毛莨科、小檗科、木兰科等植物中。采用液质联用技术检测叶片、根茎和根中主要的BIA和另外两种衍生物的含量(图1)。所有组织中小檗碱,黄连碱,药根碱和厚朴碱含量都比较高。葛兰素,去亚甲基小檗碱,表小檗碱,黄连碱,药根碱和小檗碱在根部含量最高。厚朴碱在叶片中含量最高,小檗碱只在根茎中检测到,根茎也是非洲防己碱和巴马汀的最佳来源。在定量和PCA分析的基础上(图2b),本研究结果进一步说明了三角叶黄连中不同组织间BIA类型的相似性和含量的差异。

为了研究生物碱在三角叶黄连不同组织中的积累,采用光学显微镜和荧光显微镜观察三角叶黄连叶片、根茎和根的显微图像(图3)。在叶片中,维管组织和厚壁组织中都含有丰富的生物碱。根状茎中,维管束中检测到生物碱,皮层和髓中几乎没有检测到黄色荧光。Dragendorff试剂中的碘化物将积累淀粉的皮层细胞染成深紫色。根中黄色荧光主要分布在维管束内,经Dragendorff试剂染色呈红棕色,因此推测生物碱主要积累在根部的维管束中。

图1各个物质的典型MRM色谱图。
图2测定了三角叶黄连不同组织中10种BIAS的含量,进行了叶、根茎和根的主成分分析。a 10种BIA含量。B PCA分步图。
图3 BIA在不同组织中的定位。叶片(a-c),根茎(d-f)和根(g-i)通过光学显微镜和共聚焦显微镜观察图片。在可见光下观察到叶(a)、根茎(d)和根(g)的切片。通过共聚焦显微镜观察到的叶(b,c)、根茎(e,f)和根(h,i)的冰冻切片。小檗碱是一种黄色化合物,在紫外光照射下呈黄色自发荧光。c、f、i显示了紫外光照射下不同组织的显微图像,b、e、h只显示了不同组织切片的黄色荧光。图中数字:1表皮和木栓层,2皮层,3中柱鞘纤维束,4韧皮部,5木质部,6髓,7厚壁组织,8内胚层。

2 利用转录组和全长转录组分析三角叶黄连

对三角叶黄连的根茎叶三个组织九个样本分别进行二代转录组测序,表1呈现了过滤后的二代测序数据概况。将叶、叶柄、根茎、根和匍匐茎五个组织样本混样利用PacBio RS II平台进行三代测序。共获得了532835个CCS序列,包括436531个FLNC和94603个非FL序列(图4)。通过ICE算法和Quiver程序进行序列聚类后,利用二代数据纠错去冗余,最终得到75438条非冗余转录本序列(表2)。转录本长度在106bp~11325bp之间,N50为2517bp,GC含量为41.28%。BLASTx与Nr数据库的相似性分析发现三角叶黄连的全长转录本与几个植物物种相似,其中21888个转录本(29.01%)与莲子的转录本有显著同源性,与欧洲葡萄属(Vitis Vinifera)有5484条序列同源,与红掌(Anthurium Amnicola)序列同源的有3158条。

表1 Illumina数据概况
图4 PacBio单分子实时(SMRT)测序数据概况。A CCS序列数量。b FLNC序列数量和长度分布。c非冗余转录本的数量和长度分布。d CCS序列的分类。
表2非冗余reads统计信息

3 三角叶黄连的全长转录组的功能注释

为了获得三角叶黄连转录组的全面注释,通过4个蛋白质数据库(Nr, SwissProt, KEGG 和KOG)对75438个全长转录本进行了注释。共有70383条序列得到注释,并对整体注释进行了描述(图5)。发现5055个未注释的unigene可能是三角叶黄连的新基因。

利用GO富集分析对全长转录本的分子功能、细胞组分和生物过程进行功能分类(图6a)。其中生物过程分类注释最多,很多基因注释到代谢过程、细胞过程和催化活性等功能,这些都是植物中重要的活动并且参与了代谢物的生物合成。有50173个转录本通过COG注释到25个功能。注释最多的5个类别是“一般功能预测”、“信号转导机制”、“翻译后修饰、蛋白质转运、伴侣”、“RNA加工和修饰”和“翻译、核糖体结构和生物发生”(图6b)。KEGG注释到133条代谢途径,包含基因数最多的是代谢途径,也有很多基因注释到次生代谢物的生物合成、抗生素的生物合成、不同环境中的微生物代谢和碳代谢等途径。

图5全长转录本在公共数据库的注释。
图6三角叶黄连全长转录本的功能注释和分类。a GO数据库注释。b COG数据库注释。

4 三角叶黄连不同组织间差异表达基因的研究

为了研究三角叶黄连不同组织间转录本丰度和表达模式的差异,将Illumina RNA-Seq reads映射到SMRT转录本上,所有样本的FPKM分布如图7所示。对叶片、根茎和根的差异基因(DEG)(CdLvs CdRh,CdLvsCdRo,CdRh vs CdRo)比较分析,结果如表3和图8所示。CdLvs CdRh和CdLvsCdRo中分别鉴定了24937个和25391个差异表达转录本。根茎和根鉴定出16762个DEG,叶片和根茎的DEG最多,而根茎和根的DEG较少,表明叶片和地下部分的差异较大,而根茎和根的差异较小(图8a)所有分组中有5335个共有的DEG,这些基因可能在三角叶黄连不同组织的代谢中起重要作用。三角叶黄连的三个不同组织中代谢类别最多,涉及碳水化合物代谢、次生代谢物的生物合成、能量代谢、氨基酸和脂肪代谢(图8)。

图7不同组织样本的FPKM分布。
表3不同差异分组差异基因数目。
图8不同分组中差异表达基因的功能注释。a差异分组韦恩图 b-d DEG的KEGG途径富集散点图。

5 参与莽草酸途径和酪氨酸生物合成的全长转录本鉴定

在植物中,酪氨酸是蛋白质合成所需的芳香族氨基酸,是各种次生代谢物如BIA和色素甜菜碱的前体,它们在植物生长、防御和环境反应中起着至关重要的作用。根据序列功能注释,鉴定了编码与酪氨酸生物合成有关的已知酶的全长转录本(图9)。鉴定了18个编码6种酶的全长转录本,催化7种莽草酸途径的酶促反应,大多数参与莽草酸途径的转录本在三角叶黄连的根中高表达。在酪氨酸生物合成方面,发现了6个转录本催化分支酸转化为精氨酸并随后产生酪氨酸。但是在SMRT测序数据中没有发现第二条可能的酪氨酸生物合成路线。还发现了一个编码苯丙氨酸4-羟化酶(PAH)的转录本,该转录本催化苯丙氨酸转化为酪氨酸,并且只在根中表达。

图9三角叶黄连酪氨酸生物合成途径及酪氨酸生物合成基因在不同组织中的表达模式

6参与BIA生物合成的5个全长转录本的鉴定

为了确定三角叶黄连BIA生物合成的候选途径,将已报道的BIA生物合成途径的编码基因与三角叶黄连的75438个全长序列进行了比较。根据已知的途径和目前的三代测序数据,提出了BIA可能的生物合成途径(图10)。SMRT测序数据中发现了40个转录本,编码几乎所有已知的参与BIA前体生物合成的酶

在三代测序数据中对编码与小檗碱生物合成相关的酶的转录本进行鉴定。但是与小檗碱结构密切相关的药根碱和表小檗碱的作用途径尚未确定。有研究表明CODM酶参与药根碱的合成,在三代数据中对CODM鉴定,鉴定到了一个CODM的全长转录本,该转录本可能与三角叶黄连药根碱的生物合成有关。

为了进一步确定BIA生物合成候选基因注释,并分析三角叶黄连的BIA生物合成酶与其他植物已知BIA酶的系统发育关系,对这些基因构建了进化树及保守基序分析(图11)。在开放阅读框预测的基础上,确定了全长转录本的编码区,并在蛋白质家族数据库中进行了分析。三角叶黄连的BIA生物合成基因编码的大多数酶与其他BIA生物合成植物的已知酶具有相似的保守结构域。

基于Illumina数据的FPKM值,分析了不同组织间参与BIA生物合成的酶的全长转录本的表达模式(图10)。大多数转录本在叶、根茎和根中的表达水平存在差异。多数基因在根中表达量最高,在叶中表达量最低,与BIA积累基本一致。为了验证转录组分析数据的可靠性,随机选择9个与BIA生物合成有关的转录本和1个参与次生代谢物生物合成的转录本进行qRT-PCR分析,所选基因的qRT-PCR结果与RNAseq结果显示相似的表达模式(R2>0.8),表明转录组测序数据的有效性。

图10 BIA生物合成途径和相关酶编码候选基因表达模式的热图。
图11三角叶黄连和其他植物中已知的酶的BIA生物合成相关转录本的系统发育关系和保守基序结构。

7转录因子预测

将蛋白质序列与植物转录因子数据库进行比对预测转录因子。从转录组数据集中鉴定出55个TF家族的2147个表达TF其中最丰富是bHLH,它是植物转铁蛋白中最大的一类,参与调节黄酮类化合物的生物合成、转录激活和逆境反应等许多重要的生物学过程。本研究中鉴定到4条编码bHLH的序列,序列比对分析表明,其中3个基因与CjbHLH1相似,分别命名为CdbHLH1a、CdbHLH1b和CdbHLH1c。对3个转录本的表达模式分析表明调控BIA生物合成的转录因子在根茎和根中均有较高的表达。

8三角叶黄连中ABC转运蛋白和MATE转运蛋白

为了揭示BIA在三角叶黄连中的积累和膜转运,在SMRT测序数据中发现了编码ABC转运蛋白和MATE转运蛋白的转录本。ABC转运蛋白直接参与生物碱、多酚、萜类等多种次生代谢物的转运,在植物生长的生理过程中发挥重要作用。共鉴定了149个全长转录本,其中最大的三个亚家族是ABCB,ABCC和ABCG大多数ABC转运蛋白的转录本表达水平较低,ABC转运蛋白根据其表达模式大致可分为三类,表达量较高的转录本主要分布在叶片和根中。本研究获得了9个编码ABCB转运蛋白的转录本,它们与CjABCB1、CjABCB2和CjABCB3高度相似。

MATE转运蛋白介导次生代谢物的运输,并参与植物发育过程中多个生物学过程。在三角叶黄连中鉴定了28个编码MATE转运蛋白的转录本,系统发育分析表明其中10个与CjMATE1、NtMATE1、NtMATE2、AtDTX1和NT-JAT1紧密聚为一类,说明这些基因与生物碱的积累有关(图12)。在MATE家族的候选生物碱转运蛋白中,与CjMATE1序列同源性较高的unigene0012717和0060046在根茎中高表达,而其他在根中高表达。

图12 ABCB型ABC转运蛋白和MATE转运蛋白的系统发育关系。

结论

本研究利用UPLC-MS/MS分析了三角叶黄连叶片、根茎和根中10种BIA成分的含量,并首次采用PacBio SMRT三代测序和Illumina测序相结合的方法对三角叶黄连转录组进行分析。共得到75438个全长转录本,2147个转录因子。提出了三角叶黄连BIA前体(酪氨酸)的候选生物合成途径。还对BIA生物合成途径中涉及的基因进行了筛选,鉴定出64个可能的全长转录本。从表达量方面分析发现大多数基因在根中高表达。还鉴定了3个bHLH1转录因子,其表达模式与大多数参与BIA生物合成途径的转录酶相似。为了揭示BIA在三角叶黄连体内的积累和膜转运,共发现了149个ABC转运蛋白和28个MATE转运蛋白的转录本。分别有9个和2个与已知生物碱转运蛋白高度同源的转录本,可能与根和根茎的BIA转运有关。本研究为三角叶黄连转录组的鉴定提供了重要信息,为这一资源稀缺的药用植物提供了宝贵的遗传资源。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐