PBJ | 探究小麦祖先种、历史种和现代商业化品种中的启动子和5’UTR序列多样性

2021年7月22日,英国kim E. hammond-kosack团队在国际知名期刊Plant Biotechnology Journal在线发表题为“Exploring the diversity of promoter and 5’UTR sequences in ancestral, historic and modern wheat”的研究论文,该研究探究了小麦启动子区域的序列多样性,首次报道了利用高精度myBaits技术捕获单个同源等位基因启动子,构建了小麦重要农艺性状相关的495个基因的启动子区域序列变异数据库

(https://rrescloud.rothamsted.ac.uk/index.php/s/3vc9QopcqYEbIUs/authenticate),为未来小麦基因表达调控研究和农艺性状改良提供了重要基础。

小麦是一种重要的经济作物,为人类饮食提供了最大的蛋白质来源。2018年,完成了对六倍体小麦基因组的组装(The IWGSC et al., 2018),小麦地方性品种Chinese spring基因组大小为14.5 Gbp,包含近27万个基因,其中有107891个基因被高置信度预测。不同发育阶段小麦基因表达图谱的开发(Allen et al., 2017; Arora et al., 2019; Ramírez- González et al., 2018; Wingfield et al., 2018),也为未来研究小麦基因表达和基因结构之间的关系提供了可能。在这里,作者利用了靶向捕获技术,研究了不同小麦品种中和重要农艺性状相关的495个重要同源基因的CDS序列上游前1700 bp包含启动子和5’UTR的序列变异。主要的科学目标是:[1]比较不同小麦基因型中存在的启动子变异(单倍型),并评估不同倍性水平的小麦品种之间的多态性水平,[2]评估小麦祖先种和商业化品种中的启动子序列变异,[3]确定任何已鉴定的核苷酸多态性是否可能位于公认的转录因子结合位点,[4]确定大的缺失是否与重复元件的插入/缺失相关联,以及[5]探索祖先种是否已经对现代小麦育种做出了贡献。

在本研究中,作者首先整理了10个小麦品种改良的重要农艺性状相关的已知和候选基因495个,得到1273个特异的同源基因位点,用于后续的序列捕获和信息分析。69个具有历史和现代意义的商业化小麦品种、15个地方性品种(Watkins)、8个T. monococcum (2n = 2x = 14; AmAm)、1个T. durum (2n = 4x = 28; AABB), Aegilops tauschii (2n = 2x = 14; DD), Ae. speltoides (ASP)(2n = 2x = 14; SS) 和野生种(APG)(2n = 4x = 28; SpSpUU)作为后续分析的小麦种质资源。利用Daicel Arbor Biosciences公司的myBaits捕获技术,设计了17745个特异的诱饵,来靶向位于1273个同源基因中起始密码子上游的1700 bp序列。71%的启动子高严格覆盖率>50%。(图1a)在许多情况下,只要诱饵间隔均匀且不聚集,仅用四个诱饵就能实现1700 bp的期望目标长度 (图1b-1d)。

图1:获得高特异性myBaits覆盖和序列长度

为了通过育种加速小麦育种改良,单倍型作图常被用于调查遗传谱系,并用于鉴定等位基因连锁区域,在这里,作者分析了95个小麦品种中908个不同性状的同源基因的启动子和5’端的SNP。52%的启动子有1-2个共享的单倍型,其中,22%的启动子和商业化小麦品种中一致,只有3.5%的启动子有6个或者更多的共享的单倍型。且SNP分布在启动子的局部区域,分布不均匀(图2)。

图2:六倍体小麦品种的单倍型

小麦基因组中包含非常多的转座子和重复元件,作者在此研究中捕获到了靶序列的缺失情况。对于908个靶序列,共发现了326个小的indel(<100 bp)和257个大的indel,通常只存在某个单倍型的启动子中。在生物逆境胁迫相关的基因中,共鉴定到17个大的indel,都被鉴定为转座子。在WRKY类转录因子启动子区域,共鉴定到两个大的indel,是转座子,可能存在独立的移动行为(图3)。

图3:在B亚族的WRKY转录因子基因的启动子中发现大的缺失

后面,作者又鉴定了存在于转录因子结合位点上的SNP和indel。预测的转录因子结合位点的数量并不与序列长度成比例,并不是所有的缺失都位于转录因子结合位点上。但这些发生突变的潜在的转录因子结合位点,可以作为未来研究这些基因表达调控的良好起点(图4)。

图4:在所有生物胁迫基因启动子中由SNP和Indel引起的转录因子结合位点的获得和缺失

Stb6是一个著名的小麦抗病基因,作者在这里分析了Stb6启动子区域的序列变异。Stb6只位于A亚族,具有低水平多态性(图5)。后面利用新公布的小麦2代基因组也证实了捕获的准确性。

图5:Stb6抗性基因启动子的序列覆盖率和单倍型

讨论:本研究有助于更深入地了解不同小麦品种之间同源基因特异性基因表达的差异。此外,这些数据已经被英国小麦育种家和小麦研究人员用来生成高置信度KASP标记。捕获分析的高特异性极大地简化了后续的数据处理和分析,仅用几个间距适当的诱饵就可以实现目标序列的完全捕获,减少了类似捕获实验的设计和成本。商业化品质和地方性品种之间多态性较为一致,不同小麦品种间具有较低的多态性。这里生成的免费完整数据库将允许研究人员直接搜索感兴趣的特定基因,特别有助于基因调控研究,启动子中的低数量的SNPs和indel会加速转录因子结合位点的确认和发现。
(0)

相关推荐