重磅|[NBT Commun Biol] 节节麦群体基因组分析揭示普通小麦改良可选择位点及优质谷蛋白...
北京时间11月2日凌晨,开放野生小麦联盟(The Open Wild Wheat Consortium)于 Nature Biotechnology (NBT) 和 Communications Biology (Commun Biol) 发布二倍体节节麦 (Aegilops tauschii, DD, 2n=14) 群体基因组研究成果。我们邀请文章的重要作者高亮亮博士为我们做一个解读。高博士同时也是这篇文章用到的新组装的10 面包小麦基因组的《自然》2020文章的主要作者之一。
六倍体面包小麦 (Triticum aestivum, AABBDD, 2n=6x=42) 是全球主要粮食作物之一。在人口增长和极端气候频发的双重挑战下,必须持续地提高小麦产量才可以确保全球粮食安全。小麦野生近缘种中丰富的遗传多样性为提高小麦产量提供了良好的资源和途径。长期以来,面包小麦三个亚基因组中,D亚基因组的遗传多样性最低。节节麦是六倍体小麦的 D亚基因组的祖先供体,其遗传多样性的渗入对于小麦的进化和遗传改良有重大影响。节节麦 AL8/78首个染色体水平参考基因组及注释于2017年前后发表, 并对于节节麦的研究起到了很大促进作用。在群体水平上进一步深入解析节节麦的基因组组成,基因功能及其结构,可为恢复D亚基因组的遗传多样性提供理论依据和技术支持。
近期,有关节节麦基因组功能和群体遗传方面的研究发表在NBT 上,文章标题为 “Population Genomic Analysis of Aegilops tauschii identifies targets for bread wheat improvement”。该研究搜集了世界多个地方的节节麦资源 (306 accessions, 242 non-redundant) 并进行了全基因组重测序。分析发现,节节麦群体可划分为三个进化分支 (Lineage1, 2, and 3) 。其中第三分支 (Lineage 3) 为本研究首次详细阐释并命名,该分支的节节麦分布于一个非常局限的地理位置,个体之间遗传距离很近。虽然第三分支约只贡献了普通小麦基因组成份的1.1%,但包括人们熟知的Glu-D1位点等 (见下述Commun Biol文章)。同时,该发现进一步支持了六倍体小麦基因组的形成经历了多次杂交事件的假设。
本研究另一个重要的创新是借助于kmer关联分析的方法来锁定与目标性状 (叶表皮毛,小穗数,白粉病抗性,和小麦卷螨 ) 相关联的基因组片段,并结合简略拼装的基因组成功鉴定了目标基因(图二)。该方法对MutRenSeq (2016 NBT DOI: 10.1007/978-1-4939-7249-4_19)和 AgRenSeq (2019 NBT, DOI:10.1038/s41587-018-0007-9) 基因定位技术进行了改进和创新。通过进一步和小麦地方品种比较发现,这些优异基因未参与早期的基因流事件。
数据分析发现大约只有25%的D亚基因组多态性分布在地方品种中。本研究利用节节麦与四倍体小麦杂交,经染色体加倍后合成的六倍体小麦可明显提高普通小麦D亚基因组多样性 (到70%左右)。本研究合成的六倍体小麦对于筛选优异基因,快捷和迅速地改良农艺性状具有很大的应用价值 (比如wtk抗白粉基因)。作者们通过抗白粉病基因(Wtk4),抗小麦卷螨基因 (Cmc4),和锈病(SrTA1662)的例子整合了三种基因转移的方式,做了很好的总结(原文最后一张图片)。
与四倍体和二倍体祖先相比,D亚基因组的加入导致了面包小麦广泛的适应性和卓越的加工品质。小麦的加工品质主要由低分子量和高分子量谷蛋白决定,其中高分子谷蛋白由三个基因位点 Glu-A1, Glu-B1 和 Glu-D1控制,其中 Glu-D1位点起主要作用。发表在Communications Biology上的研究对Glu-D1位点进行了分析,文章标题为“High molecular weight glutenin gene diversity in Aegilops tauschii demonstrates unique origin of superior wheat quality”。该研究表明,与小麦面包品质相关的高分子量谷蛋白Glu-D1的优质亚基很可能来自于新发现的第三进化分支。基于10 小麦基因组 (DOI:10.1038/s41586-020-2961-x) 和上述NBT文章中的节节麦基因组数据,作者的结果揭示优质高分子量谷蛋白亚基 5 10 很可能来源于第三分支谱系的节节麦。进一步分析发现, 5 10 亚基的染色体定位与L3特异 kmer 分布区段高度重合。Delorean博士等还进行了重组亚基,单倍型地理位置分布等研究,发现了新的重组亚基个体和单倍型分布规律等。
发表于NBT 上的研究工作,由来自18个国家,38个单位的70多位合作者共同完成。通讯作者为英国约翰霍普金斯研究中心-沙特国王科技大学 (JIC-KAUST) 的Brande Wulff教授, 美国堪萨斯州立大学-沙特国王科技大学 (KSU-KAUST) 的Jesse Poland教授, 瑞士苏黎世大学的Beat Keller教授,以及国际小麦玉米改良中心(CIMMYT) 的Alison Bentley (前NIAB研究员)。共同第一作者为英国JIC的Kumar Gaurav博士及Sanu Arora博士, 堪萨斯州立大学的Paula Silva博士 (现就职于乌拉圭INIA研究所),瑞士苏黎世大学的Javier Sanchez-Martin博士,以及英国NIAB的Richard Horsnell。发表在Communications Biology上的文章的通讯作者为堪萨斯州立大学的Jesse Poland (KSU-KAUST)。堪萨斯州立大学的Emily Delorean博士 (现就职于北卡州立大学) 和高亮亮博士为共同第一作者。另有国际玉米小麦中心 (CIMMYT) 品质实验室的很多贡献。
我这里觉得有必要简要介绍一下几个共同第一作者的主要贡献:Brande Wulff教授组的Kumar Gaurav博士和Sanu Arora博士负责了kmer和很多早期的DNA测序以及后来的群体遗传,图片设计等工作;Jesse Poland教授组的Paula Silva博士主要负责了wheat curl mite 表型,统计,skim-seq GBS based遗传关联分析,单倍型分析,图片设计等等;Beat Keller教授组的Javier Sanchez-Martin博士主要负责抗白粉病基因wtk实验及分析;Alison Bentley组的Richard Horsnell主要负责合成六倍体育种等。“第二”作者我的主要的贡献是寻找单核苷酸变异,deep-seq based snp-gwas,样本冗余分析, wheat curl mite (wcm) deep-seq GWAS分析,kgwas和admixture的部分验证, 并作为共同第一作者做了一些Emily Delorean主导的谷蛋白亚基 (Glu-D1) 的工作(部分NSF-WGRC-IUCRC项目)。通讯作者Brande Wulff教授和Jesse Poland教授做了大量的协调,领导,实验设计,分析指导等工作。
开放野生小麦联盟 (The Open Wild Wheat Consortium) 是一个多国家,多团队参与的合作项目。中国农业科学院的毛龙研究员和四川农业大学的刘登才教授提供了宝贵的基因组组装数据。来自于UC Davis的Luo Ming-Cheng (罗明诚) 教授提供了重测序数据等。来自于德州农工大学TAMU的Liu Shu-Yu (刘树玉) 教授提供了研究Cmc4 的宝贵的遗传材料。我所在的堪萨斯州立大学的小麦遗传资源中心(由Dr. Bikram Gill创建)在种质资源上提供了巨大帮助 (一些第三分支L3的材料由John Raupp收集)。感谢Shuangye Wu技术支持。感谢Haley Ahlers图片设计。感谢Narinder Singh博士等人前期的工作。还有Poland Lab, 以及WGRC大家庭(感谢Byron Evers)。英国BBSRC美国NSF-IUCRC等提供了很多资金支持。在此也特别致谢多个单位的高性能计算(HPC)资源 (英国JIC NBI, 德国IPK,堪萨斯BEOCAT等等)。此外,还有很多国内外单位的贡献,在此一并致谢,限于篇幅不再一一列举,详情请查看原文。另外,河南大学宋纯鹏教授团队等学者前段时间也发表了节节麦基因组文章 (Zhou et al 2021 Nature Plants),欢迎大家阅读。
下面是一些文献资源和数据的网页链接,希望能为大家提供帮助:
种子: https://www.seedstor.ac.uk
NBT原文:
https://www.nature.com/articles/s41587-021-01058-4
CommsBio原文:
https://www.nature.com/articles/s42003-021-02563-7
Main github软件:
https://github.com/wheatgenetics/owwc
Glutenin github1:
https://github.com/emilydelorean/Glu-D1_Aegilops-tauschii
Glutenin github2:
https://github.com/umngao/GluD1_commsBio2021
SNP dataset:
https://zenodo.org/record/4317950#.YPbCjJNKhz8
Kmer admixture:
https://zenodo.org/record/4474428#.YPbC7JNKhz8
鉴于水平所限,这篇文章难免有错漏甚至描述不客观之处,请广大同行及时批评指正(lianggao@ksu.edu)。另外,我在分析上的一点经验,跟大家分享下:
(1) https://github.com/samtools/bcftools/issues/1332.
(2) https://github.com/wheatgenetics/owwc/tree/master/kGWAS. 需要选择甚至下调适当Python版本才能运行特定的函数等。
(3) http://pcingola.github.io/SnpEff. 对于相邻碱基的snp的默认注释输出很可能是错的。
最后感谢堪萨斯州立大学王巍博士 (Eduard Akhunov Lab), 林桂芳博士 (Sanzhen Liu Lab), 卞若琳, 徐誉州博士生 (Guihua Bai Lab),亚利桑那州立大学尹璐博士(Arizona ASU Changbin Chen Lab), 吉林大学王乐副教授 (原UC Davis博士后科学家),中国农业大学小麦研究中心郭伟龙副教授,姚颖垠教授,中国科学院遗传与发育生物学研究所 (wheatomics editor) 马省伟博士等人对本解读的修改和建议。特别鸣谢由于疫情和长期在家办公逐渐转型成半个生物信息学专家的妻子冉庆红研究助理 (Sonny Lee Lab) 的建议和意见。
大家近期可以关注以下的学术报告并参与交流。我很感恩自己成为在两篇文章正式发布后的第一个对此作出报告的科学家,后期可能会有视频。
1. Gao L., Gaurav K., Arora S., Silva P., Sanchez-Martin J., Horsnell R. Delorean S. Bentley A., Keller B., Poland J., Wulff B. and OWWC (2021) Population genome sequencing of Aegilops tauschii gives insight to bread wheat evolution and forms a powerful resource for association genetics. 3rd IPPG meeting, Assuit University, Nov 1-3, 2021 https://ipgg-aun.wixsite.com/website-1/dr-liangliang-gao
2. Arora S., Gaurav K., Silva P., Sanchez-Martin J., Horsnell R. Gao L. Bentley A., Keller B., Poland J., Wulff B. and OWWC (2022) Past evolution and future enrichment of the bread wheat D-subgenome from Aegilops tauschii Plant and Animal Genome Conference XXIX San Diego, CA, Jan 8-12, 2022
JIC press https://www.jic.ac.uk/press-release/how-bread-wheat-got-its-gluten-tracing-the-impact-of-a-long-lost-relative-on-modern-bread-wheat/
K-STATE press : (Should be out in a couple of days, in prep).
References:
Luo Ming-Cheng., et al 2017 Genome sequence of the progenitor of the wheat D genome Aegilops tauschii 2017 Nature https://www.nature.com/articles/nature24486
Zhao G., Zou C., Li K., ...Jia Jizeng 2017 The Aegilops tauschii genome reveals multiple impacts of transposons. Nature Plants https://www.nature.com/articles/s41477-017-0067-8
Zhou Y., Bai S., Li H., Sun G., Zhang D., Ma F., et al 2021 Introgressing the Aegilops tauschii genome into wheat as a basis for cereal improvement, Nature Plants, https://doi.org/10.1038/s41477-021-00934-w (Corresponding authors: Song C., Zou C.)
Walkowiak S., Gao, L., Monat C., Haberer G, et al 2020 Multiple wheat genomes reveal global variation in modern breeding, Nature, https://doi.org/10.1038/s41586-020-2961-x (Corresponding authors Pozniak C., Wicker T., Spannagl M. McCartney T.) My postdoc advisor Dr. Jesse Poland is a very important contributor but neither a first nor a corresponding author
Gaurav K., Arora S., Silva P, Sanchez-Martin J., Horsnell R., Gao, L, Bentley A., Keller B, Poland J., Wulff B. 2021 Population genomic analysis of Aegilops tauschii identifies targets for bread wheat improvement Nature Biotechnology https://www.nature.com/articles/s41587-021-01058-4 (Corresponding authors: Wulff B., Poland J., Keller B, Bentley A)
Delorean E., Gao L, Lopez J., Open Wild Wheat Consortium, Wulff B, Iiba M., Poland J., 2021 High molecular weight glutenin gene diversity in Aegilops tauschii demonstrates unique origin of superior wheat quality. Communications Biology https://www.nature.com/articles/s42003-021-02563-7