科研 | 组织特异性长链非编码RNA参与红茶的香气形成

编译:罗睺,编辑:夏甘草、江舜尧。

原创微文,欢迎转发转载。

导读

随着测序技术与生物学信息的不断发展,从RNAseq数据中揭示长链非编码RNA变得简单可信。到目前为止,关于lncRNAs及其在茶叶中的调节作用还没有系统的研究。本研究利用11个组织中的170个RNAseq数据,发现了33400个可推测的高确定性lncRNAs,其中99.76%被认为是新的lncRNAs。对7个组织(腋芽、1芽和1叶、1芽2叶、顶芽和2叶、2thleaf、4thleaf和6thleaf)的53个RNAseq数据进行了lncRNAs的表达分析,证实了它们的组织特异性表达。此外,约1654个lncRNAs被发现是miRNAs的内源性模拟靶标(eTMs),与红茶基因组的698个mRNAs相互作用。基于其基因编辑伴侣,GO和KEGG分析发现378个lncRNAs参与了茶香气形成的主要途径。本研究也为揭示lncRNAs调节茶叶香气形成的各种分子功能提供了有价值的信息

论文ID

原名:Tissue specific long non-coding RNAs are involved in aroma formation of black tea

译 名:组织特异性长链非编码RNA参与红茶的香气形成

期 刊:Industrial Crops & Products

IF:4.244(2020年)

发表时间:2019.3

通讯作者:Tapan Kumar Mondal

通讯作者单位:印度新德里ICAR-植物生物技术国家研究中心

DOI号:10.1016/j.indcrop.2019.03.020.

研究方法

鉴定茶lncRNAs RNAseq数据的数据集是从序列读取档案中下载(http://www.ncbi.nlm.nih.gov/Traces/sra/)代表11种不同的组织(种子、根、茎、腋芽、芽和叶、芽和叶、顶芽和2片叶、第2片叶、第4片叶、第6片叶和花,图1)。首先,本研究开发了用于识别lncRNAs的生物信息学管道,如图2所示。共170份RNAseq样本,代表7个不同的叶组织(腋芽、1芽和1叶、1芽2叶、顶芽和2叶、2thleaf、4thleaf和6thleaf)中的lncRNAs差异表达进行差异表达分析。然后,预测了可以作为miRNA前体的lncRNAs,鉴别lncRNA-mRNAs-miRNAs模块,主要分析内容有GO和KEGG注释,红茶lncRNAs全基因组比较分析,lncRNAs中转座元件的组成,最后,验证了部分lncRNAs的qRT-PCR表达。

图1 茶叶不同部位的多种分析。

图2 本研究中使用的红茶lncRNAs鉴定管道

结果

预测的lncRNAs的鉴定与表征

设置了生物信息学管道分析了170个RNAseq数据(图2)。大约43.69亿个 reads (62.54%)成功地匹配到红茶参考基因组上,并产生137429个基因座(156911个转录本)。这些转录本是在管家非编码RNA的潜在前体的基础上进一步过滤的,如miRNAs、短发夹RNA(ShRNA)、siRNAs和tRNAs。
对lncRNAs的总长度、外显子数和AU含量也进行了表征。lncRNAs的长度从最小200 bp到最大14670 bp不等,平均长度为799 bp(图3a)。大多数lncRNAs(75.6%)的长度<1000bp。共有1867例(5.58%)lncRNAs的长度大于2000bp。发现lncRNAs的平均长度远短于蛋白质编码基因的平均长度。lncRNA的平均长度与其它植物相似,如灵芝322bp到水稻800bp。大多数lncRNAs(97.95%)被发现含有单个外显子(图3b)。lncRNAs的AU含量从最低27%(TCONS U 00030583)到最高81%(TCONS U 00106220),大多数lncRNAs(96.5%)含有50%以上的AU。具体而言,317个lncRNAs的AU含量≥75%(图3c)。
根据lncRNAs的基因组位置及其与最近蛋白编码基因的接近程度,将鉴定出的lncRNAs分为三类:(1)基因间lncRNAs(距离>1kb,与蛋白编码基因在两条链上没有重叠),(2)相邻的lncRNAs(距离<1kb,蛋白质编码基因)和(3)基因lncRNAs(距离与蛋白质编码基因重叠)具有任意方向。根据这个标准,研究者发现大多数的lncRNA都是1型。67.53%位于任何注释的茶基因模型的上游或下游链上,距离至少1 kb。大约5.6%的lncRNA为邻接lncRNA,3.46%的在反义或有义方向上重叠。其余的lncRNA不能被分配到任何组,因为两个红茶基因组都存在缺口。

lncRNA的差异表达分析

为了探究lncRNA的作用,作者对53份至少有2个生物学重复的RNAseq样本进行了差异表达分析。根据lncRNA的FPKM值对其进行了分类。
将lncRNAsFPKM阈值设置为5,1975个lncRNAs被确定为“全部表达”(即在7个组织中均表达,FPKM值≥5),而12000个lncrna呈“混合表达”(在4个组织中低或高表达),1645个为组织特异性lncrna(仅在一个组织中表达)。在2-6个FPKM值≤5的组织中,共有11,919个lncRNAs被至少表达,并被划分为“Remaining”类别。此外,根据FDR值(pvalue≤0.05)和fold change≥2 (log2≥2),共有7001个lncRNAs差异表达(图4)。
表达上调的lncRNAs最多出现在顶芽和2片叶片上(Apb_2 L:2302个lncRNAs)。共发现1709个lncRNA在5个不同组织(6 L、Ab_1 L、Ab_2 L、Apb_2 L和Axb)的第2叶组织中上调,14个lncrna在其中4个组织中相互上调(Apb_2 L除外)。同样,在6叶有1385个lncrna上调,分别为2 L、Ab_1 L、Ab_2 L、Apb_2 L和Axb。此外,1308在芽和叶(Ab_1 L)中上调,对应的2 L、4 L、6 L、Ab_2 L、Apb_2 L和Axb,其中10和16个lncrna在相关组织中普遍上(图S2d和S2e)。研究者在4个组织(Ab_1 L、Ab_2 L、Apb_2 L和Axb)中发现了1129个差异表达的lncRNA,而在这4个组织中只有1个lncRNA表达上调。对于腋芽(Axb),只有477个lncrna被发现上调(原文图S2)。

图3 lncRNAs的特征:(A) lncRNAs的长度分布,(B) lncRNAs的外显子分布,(C) lncRNAs的AU含量。

图4 茶树(C. Sinensis)不同发育阶段幼叶7001个lncRNA转录本的热图表达模式。[Axb = Axillary bud; Apb_2 L = Apical bud and 2 leaves; Ab_1L = a bud and a leaf; Ab_2 L = a bud and 2 leaves; 2 L = 2nd leaf; 4 L = 4th leaf; 6 L = 6th leaf]。

lncRNA被预测为miRNAs的前体和诱饵

在lncRNA的众多功能中,作为前体和诱饵的作用已被确定。总共有13个lncrna被预测为红茶15个miRNAs的前体。例如,TCONS_00078561被鉴定为CsnmiRn104的前体。此外,为了识别内源性靶标模拟物(endogenous target mimics, eTMs),作者将预测的lncRNA与红茶miRNA和mRNA进行相互作用分析。共发现1654个lncRNA与红茶473个miRNA相互作用。这些与lncRNA相互作用的miRNA进一步被发现与698种不同的中华支那mRNA作为推测的靶点相互作用。
研究者检测了miRNA和lncRNAs之间的两种相互作用。它们是: i)单个lncRNA与多个miRNAs相互作用:例如,TCONS_00069314与11个不同的miRNA (CsnmiRn20, CsnmiRn26, CsnsmR31-3p, CsnmiRn70,CsnmiRn115,,CsnmiRn198, CsnmiRn358, CsnmiRn409, CsnmiRn439,CsnmiRn455, CsnmiRn472)(图5a);ii)与多个lncRNA相互作用的单个miRNA,如CsnmiRn372与61个不同的lncRNA相互作用(图5b)。此外,本研究还鉴定了差异表达lncRNA的相互作用。

图5 | 相互作用网络。(A)单个lncRNA与多个miRNA;(B)单个miRNA与多个lncRNA。

图6 | 基于GO的靶基因功能注释。

图7 基于KEGG通路的靶基因分布研究

GO 和 KEGG 分析结果

对预测的lncRNA进行GO富集分析,根据GO注释将其分为三组:生物学过程、分子过程、细胞过程。在698个目标基因序列中,对468个序列进行了134个基因本体术语标记,并对134个目标基因分配了98个EC号。并还对靶基因进行了KEGG通路分析,发现共1109个基因涉及133个生物通路,其中40个通路涉及红茶品质,包含378个酶。在各种品质形成途径中,参与嘌呤代谢的酶最多(图7)。

红茶lncRNA的比较分析

作者从CANT ATAdb, GreeNC, 和PNRD数据库下载了所有可用的lncRNA序列用于对比分析。在红茶中,只有81个lncRNAs与其他物种的125个lncRNAs具有同源性。所得到的lncRNA与其他物种具有相似性,可能与本研究中用于鉴定lncRNA的组织样本和生物学管道不同有关。因此,有可能丢失了一些保守的lncRNA对。这些结果表明,在茶树中预测的lncRNA可能是种特异性的。

lncRNA中的转座元件

研究者使用前人自定义 repeat libraries对预测的lncRNAs进行Repeat Masking,以识别lncRNAs中的TE元素等特征。发现具有转座元件的lncRNA之间有60.98%的相似性。未指定重复元件的比例较高(88.0%)。含有LTR/ gypsya的lncRNA所占比例小于含有LTR/ copia的lncRNA(图8)。位于编码基因附近的copia元件所占比例高于gypsytype元件。鉴定出含有其他逆转录转座子的1.3%的lncRNA (I类:1.0% LINE, 0.3% sin)和5.3%的DNA转座子(II类),0.4%的简单重复元件。

图8 | 重复元件在lncRNA中的分布

图9 对所选lncRNA进行Q-PCR分析。(A)验证所选lncRNAS(Illumina读数的fold changes和QRT-PCR)在TV-1茶叶片组织中的表达分析;(B) 查尔酮异构酶特异性lncRNAs相关的miRNA和在两种不同组织中的表达分析(1芽两叶和TV-1的 4th叶)。

随机选择的lncRNA进行qRT-PCR验证

为了验证RNA-seq数据的生物信息学分析得到的表达数据,研究者使用基因特异性引物对15个随机选择的组织特异性lncRNA(基于它们的FPKM值)进行qRT-PCR。结果显示,15个lncRNA中有10个的表达趋势与对应的FPKM值相似(图9a)。在本次分析中5个lncRNA是否缺失尚不清楚,可能是基因型差异、剪接选择性等因素造成的。然而,这个结果清楚的表明了通过生物信息学分析得到的数据是非常可信的,通过qRT-PCR分析15个lncRNAs中有10个表达了相似的趋势。

lncRNA与茶叶次生代谢产物途径的关联

红茶香气的形成与其次生代谢物相关。虽然芳香是由于一些挥发性化合物的存在而形成的,但实际上一些主要的感官形成成分是咖啡因,儿茶素或多酚。这些因素共同决定了红茶的质量。因此,为了研究lncRNAs在香气形成化合物生物合成途径中的作用,作者对目标mRNA进行分析,发现lncRNAs参与了大约40种不同的相关生物合成途径。其中嘌呤生物合成途径、咖啡因生物合成途径、苯基丙醇生物合成途径、类黄酮生物合成途径、异黄酮生物合成途径以及其他几种挥发性化合物(萜类、亚油酸、二萜、香叶、单萜、核黄素等)的生成途径在本研究中被认为是lncRNA的靶向结果。
其中,苯丙氨酸途径以苯丙氨酸解氨酶、肉桂酸4-羟化酶和4-香豆酸:辅酶A连接酶三种主要速率限制酶合成茶叶中重要的次生代谢产物。有趣的是,在本研究中,研究者发现该通路的12种酶是不同的lncRNA靶标。其中lncRNA TCONS_00052382、TCONS_00050120、TCONS_00052690、TCONS_00050120与PAL相互作用,TCONS_00133884与4CL酶相互作用,提示这些lncRNA可能调控这两个基因的表达。
嘌呤代谢直接参与茶叶香气的形成。在本研究中,根据lncRNA-mRNA的相互作用,研究发现最多有37个lncRNA具有该途径的各种酶靶,其中包括两条咖啡因合成途径。咖啡因被认为是存在于茶中的嘌呤生物碱和形成香味的化学物质。茶叶含有大量的咖啡(2%),咖啡因是通过这一途径的主要酶产生的。然而,作者没有发现咖啡因生物合成基因主要速率限制酶的lncRNA。
苯丙途径的另一个重要衍生物是类黄酮生物合成,其中儿茶素是重要的类黄酮化合物之一。
茶叶中儿茶素含量较高,但幼叶含量高于老叶。大约20个lncRNA被发现与7组20种酶相关,这表明lncRNA-mRNA的关联具有副特异性(图10)。其中只有一个网络与miR5021 A有关联。为了进一步了解其关联模式,研究者对查尔酮异构酶模块进行了qRT-PCR分析。
在4个lncRNA中,发现3种不同的反应(9b);(1)在TCONS_00090099-CHI-CSA006623.1-miR5021网络中,lncRNA和mRNA的表达水平相似的组织而microrna的表达趋势是相反,表明lncRNA在年轻的叶子中充当诱饵,这样查耳酮异构酶可以调节产生更catechine生产。(2)在TCONS_00046841-CHICSA008262.1组合中,两者均有逆向表达趋势,表明 lncrna 可能利用DNA甲基化等表观遗传学机制作用于其靶标。这种调控方式在lncRNA很常见。(3)TCONS_00000187-CHI-CSA023536.1组合,同样有相似的趋势。这也表明这些lncrna在茶的儿茶素生物合成中发挥了重要作用。这说明lncRNA在茶叶品质性状调控中发挥着重要作用。

讨论

非编码RNA是最近发现的一组分子,它们参与了多种生物途径中的基因调控。几种类型的非编码RNA调节植物中不同性状的基因表达,其中lncRNAs是最近发现的具有多种功能的非编码RNAs,主要有两种机制:作为miRNAs的前体或作为eTM阻断miRNA的功能。在植物和动物中,lncRNA可作为诱饵,也被称为内源性靶向模拟物(eTM)或竞争性内源性RNA(ceRNA)。研究人员正在使用从lncRNAs特定库生成的高通量测序数据来发现lncRNAs。另一方面,可从公开的RNAseq数据集中发现lncRNAs,生成lncRNAs特定库。相关研究人员已从几种植物物种中发现并表征了lncRNAs,但尚未在茶叶中进行研究。因此,在本研究中,研究者利用公开的RNAseq数据来发现茶叶中的lncRNAs。茶叶的价值在于其唯一的经济部分,但理解茶叶香气(质量成分)形成的分子机制一直是一个挑战。质量是一个多基因特性,因此受到包括lncRNAs和环境因素在内的多种基因组资源的控制。因此,鉴定存在于茶叶幼组织中的lncRNAs是了解其在组织发育和茶叶品质参数综合中的作用的先决条件。因此,本研究旨在实现这一目标。本文分析从RNAseq数据中得到了一个相对较好的(33400)个潜在的lncRNAs,其中33319个被发现是新的。这些lncRNAs将为今后茶叶功能基因组学研究提供有用的基因组资源。组织特异性基因表达是导致组织功能多样性的原因之一,本研究发现1645个(4.92%)的lncRNAs在7种不同的茶幼组织中特异表达。在水稻、二穗短柄草、鹰嘴豆、拟南芥和银杏中发现了类似种类的组织特异性lncRNAs。
不同类型的lncRNAs如基因间lncRNAs、相邻lncRNAs和重叠lncRNAs的外显子数目不同,其长度变化具有不同的功能。在本研究序列分析中,作者发现一些lncRNAs可能参与茶叶香气的形成。
虽然lncRNAs可能通过多种机制发挥作用,但它们大多起到了诱饵的作用,这在本研究中是很有潜力的。然而,一个lncRNAs TCONS_00000187-CHI-CSA023536.1与其靶点有相似的表达趋势。虽然原因尚不清楚,但作者假设可能存在一些miRNAs,该lncRNA可作为诱饵,但由于目前的茶叶基因组中存在缺口,因此不用于本分析。目前,我们的miRNA分析仅限于已发表的miRNA。

图10 儿茶素生物合成途径。蓝色粗线上方的面板是苯基丙烷途径,底部面板是类黄酮途径

虽然eTM已经在一些植物中得到鉴定,但是它们在控制基因表达方面的特殊作用并没有得到很好的研究。最近张等人确定了沙棘果实成熟过程中花青素生物合成的几种差异表达的lncRNAs。在本研究中,作者鉴定出698个lncRNAs是eTM,它们与多种次生代谢产物生物合成途径有关,这些途径几乎涵盖了红茶香气形成(品质)的所有主要生物合成途径。

结论

利用公开的RNAseq数据,研究者已经鉴定出33400个红茶的lncRNAs,其中33319个是新的。在33400个lncRNAs中,22556个、1889个和1152个lncRNAs分别是基因间的、相邻的和重叠的。研究者还发现1645个lncRNAs在7个不同的茶叶幼组织中有差异表达,其中一些可能对泡茶品质起重要作用。有趣的是,大约20368(60.98%)的lncRNAs与各种转座元件有关。大量转座元件的存在反映了茶叶基因组具有高重复区域(高于80%)的事实。几种lncRNAs与茶叶的各种次生代谢途径有关,可以调节茶叶香气的形成。总的来说,本研究已经对茶叶中的lncRNAs进行了分类,其中一些可能对香气形成有重要作用,并将为今后研究其在茶叶基因表达中的调控作用提供重要的基因组资源。

评论

影响泡茶质量的因素取决于茶叶组织、环境因素、基因型和植物的年龄。香气是决定红茶品质的一个重要指标,主要由内源酶如β-葡萄糖苷酶和β-葡萄糖苷酶产生。香气的形成有多种途径。lncRNAs在基因表达中起着关键作用,在植物中控制各种非生物和生物性状表达的作用。本文主要研究了lncRNAs在茶叶幼叶中的差异表达,有助于更好地了解其在香气形成中的作用。本文首次报道了茶叶中lncRNAs的发现和性质,并对其与红茶香气形成的关系进行了研究,对茶叶品质研究提供重要的基因组资源。

更多推荐

高分综述 | Trends in Biotechnology: 单细胞分辨率下利用空间转录组揭示器官分子结构(国人佳作)

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐