从金庸武功套路谈小麦基因图位克隆

受贾继增研究员委托,在烟台召开的第十届“全国小麦基因组学及分子育种大会”上继续主持小麦基因克隆方法研讨会(workshop),有感于当前小麦基因组学和功能基因组学研究的迅猛发展,对长期以来研究工作中经常遇到的问题和教训简单进行了总结。少时读金庸,常存江湖梦!借用金庸先生武侠小说中描述的武功秘笈,归纳了小麦基因图位克隆七种套路。当然实际工作中所用到的远不止七种套路,而且也不能局限于套路,需要不断创新。谨以此文活跃气氛,博诸君一笑!

套路一@太极--全基因组关联分析(Genome wide association study, GWAS)

在金庸武侠小说《倚天屠龙记》中,太极是武当派师祖张三丰所创,是大成之作,以柔克刚,战无不胜,籍此成为武林的泰山北斗。而在现代人眼里,太极可能是公园晨练的老少皆宜套路。

开展全基因组关联分析简便易行,在选择一些小麦品种(系)构建自然群体的基础上,利用各种分子标记技术(SSR、SNP、GBS、重测序等)对每个品种(系)进行基因型扫描,即可获得其群体结构,结合多年、多点的表型数据,通过不同的模型计算,寻找到与所关注性状相关的标记及其所在基因组区间,再通过对关联区间内基因的注释分析,预测候选基因进行功能验证。在小麦参考基因组序列具备之前,还只能关联到目标性状所在的区段,难以准确预测候选基因;而在目前已经具备多个参考基因组序列的情况下,对关联区段内的基因注释已经非常有助于预测候选基因。

一般的关联分析群体大小在200-400为宜,少于100个品种(系)也有关联到目标性状基因区段的案例,而过多的品种(系)会增加成本和表型鉴定的工作量。大规模的巢式关联分析也时常被大的研究团队采用,可以根据所研究的具体问题和经费预算进行设计。由于小麦的光温反应特性,在构建自然群体时应尽量选用同一生态区或相邻生态区的品种(系),使其基本都能够正常的生长发育和成熟,所关注的性状充分正常表达。

目前的研究结果表明普通小麦的连锁不平衡(Linkagedisequilibrium, LD)远远大于玉米和水稻等作物,期望直接关联到所关注的性状功能基因往往还比较困难。而小麦的野生祖先种(乌拉尔图小麦、节节麦、野生二粒小麦等)自然群体的LD较小,通过关联分析寻找到所关注的性状功能基因可能性有大幅度的提高。因此通常在关联分析到候选基因组区段后,往往还需要在双亲遗传群体(RIL和DH等)上对其加以验证,构建其饱和的高密度精细遗传图谱,对目标基因进行精细定位和克隆。

如同练太极一样,初步的关联分析和找到一些关联的位点相对容易。但进一步获得所关注的性状目标基因,还需要很多精细的后续研究工作,需要持之以恒,不懈努力才能成为高手。

套路二@独孤九剑--图位克隆(Map-based Cloning)

        独孤九剑是出现于金庸小说《笑傲江湖》中之剑法,为剑魔独孤求败所创,是剑法求变的极至,以无招胜有招,杀尽仇寇奸人,败尽英雄豪杰,打遍天下无敌手。华山派弟子令狐冲于思过崖遭遇到强敌田伯光,华山派前辈风清扬见令狐冲习武学剑资质颇佳,于是以一夜时间传授令狐冲独孤九剑心法,三招打败田伯光。独孤九剑有总诀式、破剑式、破刀式、破枪式、破鞭式、破索式、破掌式、破箭式、破气式,分别是依据不同兵器而生的对招方式。

小麦基因图位克隆中会用到不同类型的群体、不同类型的分子标记、应对不同基因组区段的复杂情况、解析亚基因组直系同源基因的功能冗余和分化,需要扎实的遗传学、基因组学、生物信息学等学科知识,才能如同独孤九剑,完全视对方招式而定,见招拆招,遇强则强。

在没有参考基因组序列之前,小麦图位克隆是件非常孤独和痛苦的事,目标基因区段基因组物理图谱的搭建需要构建BAC文库和进行反复多次的染色体步移(Chromosome walking),远没有在公园散步(Park walking)的惬意。在目前有了参考基因组序列的情况下,小麦的图位克隆已经是极大地加快了速度,但由于其生物学和遗传学特性,所面临的复杂情况和困难还是远大于拟南芥和水稻等植(作)物。

在精细定位的群体中经常会遇到一些奇怪的重组体(Ghost recombinant),在目标基因组区段的标记基因型与双亲或其它的大部分重组体不一致。可以对其进行遗传背景检测,排除这些由于各种未知原因(如种子混杂、自然异交等)产生的重组体。而在目标基因组区段一个非常小的基因组区间内发生双交换的可能性也比较低,应该反复进行基因型和表现型鉴定,排除这些重组体的影响。

在图位克隆克隆研究中最坏的局面是遇到重组抑制、目标基因组区段参考序列存在较大的Gap、大片段的插入/缺失/倒位、以及基因重复(Duplication)导致的拷贝数变异(Copy number variation, CNV)等情况,而小麦由于其异源多倍体特性,对基因组变异的容忍度较高,出现这种情况的可能性很高。因此需要博览群书,夯实基础理论,掌握经典研究方法,并与新技术有机结合,不断精修,渐进於无剑胜有剑之境。

套路三@降龙十八掌--QTL克隆

金庸武侠小说中萧峰、洪七公、郭靖都以降龙十八掌闻名江湖,无愧巅峰外功。萧峰以降龙十八掌威震武林,少林寺一役技冠群雄。洪七公以降龙十八掌夺得'北丐'之称。郭靖以降龙十八掌力抗蒙古大军,死守襄阳数十年之久。

之所以以降龙十八掌比喻QTL克隆,是因为QTL的克隆比图位克隆质量性状基因需要更加繁杂的步骤和程序,花费的时间、精力和物力都更多,需要的时间也更长,需要更多的招式和方法。一般需要在QTL作图/关联分析定位到目标位点的基础上,构建高代回交的次级作图群体和近等基因系,也可以利用各种分离群体中的个别杂合单株所形成的剩余杂合系。在筛选到目标基因区段重组个体的情况下,自交获得重组体下一代/下二代纯合重组家系,开展多年、多点、多次的表型精准鉴定,不断缩小定位区间,寻找候选基因。

套路四@六脉神剑--突变体分析

六脉神剑出自金庸的武侠小说《天龙八部》,乃是大理段氏的最高武学,是最强一种外功。萧峰对六脉神剑有极高的评价,他自认为,如果段誉的六脉神剑练得纯熟,连自己也不是他的对手。六脉神剑确实也体现出了超强的威力,慕容复、鸠摩智等都无法与之对敌。只是段誉在开始使用六脉神剑的时候对内功运用还不甚娴熟,在面对敌手时时而不灵,时而所向无敌!

突变体创制是植物功能基因组研究中经常应用的手段。创制的突变体可以直接用于候选基因的功能验证,明确是否在某个候选基因上发生了突变。利用创制的某个性状的一系列突变体,可以采用Mut-Seq的策略,对这些突变体都进行DNA/RNA-seq/Capture-seq,寻找是否在某个基因上都发生了突变,锁定候选基因。尤其是在定位区间重组率较低,难以进一步缩小定位区间物理距离的情况下时常有效。利用突变体与野生型亲本配制杂交组合构建分离群体,通过Mut-map的手段克隆基因是拟南芥和水稻中经常用到的策略。

我们最近的一些工作表明利用创制的突变体克隆候选基因时而有效,时而不灵,恰如段誉初练六脉神剑的境况。这可能是由于小麦的基因组还是比较复杂,在SNP-calling时经常受到部分直系同源基因/旁系同源基因的干扰,对应的生物信息学算法在小麦中还有一定的局限性。另外,在特定的研究材料中可能会存在染色体/基因组片段的多种变异,所参照的参考基因组序列中缺乏对应的信息,无法对一些测序的Reads进行精确Mapping。相信随着生信算法的不断完善,基因组信息的不断增加,成功的概率会不断增加。

对突变体群体针对某一性状进行筛选,获得的突变体中有可能是所有的突变体均在某一个基因上发生了突变;但也有可能是只有其中的部分突变体在候选基因上发生了突变。这些非候选基因上发生突变的突变体是用来解析所研究的目标基因调控网络的宝贵遗传材料,其发生突变的基因通常可能是所研究目标基因的调控因子,要善加利用。

用于创制小麦突变体的品种材料应尽量保证是真实的纯系,在利用EMS/离子束等不同的诱变方式处理后尽可能播种在一块上年没有种植过小麦的地块上,预防小麦自生苗的混杂和干扰。同时由于小麦不是100%的自交作物,存在一定的天然异交率,而且诱变处理后经常出现的是花粉不育性状,会增加天然异交的机会,如果不能全部套袋自交的话,需要考虑到进行花粉的隔离。由于主穗和分蘖发生突变的几率不一,对M1代单株的收获可以考虑单株混收,以增加获得突变体的几率。而在M2代田间种植/性状鉴定时应增加家系群体的数量,从几十甚至上百个M2代家系的单株中选择到个别的突变体个体。一旦发现某个家系中存在感兴趣的突变体,可以将整个家系收获,进行下一代的系统分析。在M2和M3代筛选到的突变体需要进行遗传背景检测,确认其与野生型的遗传背景一致性,对于真实的突变体继续开展后续的研究工作。

套路五@九阴真经--功能验证

九阴真经出自金庸小说《射雕英雄传》,贯穿于《射雕英雄传》、《神雕侠侣》和《倚天屠龙记》中。九阴真经分为上、下两卷,上卷为内功基础,下卷为武功招式(黄裳版)是金庸小说中最负盛名的武学秘籍。

小麦功能基因的克隆离不开功能验证,包括利用突变体和转基因等多种技术手段,提供候选基因确认的终极证据。在进行遗传转化时,通常需要利用候选基因自身的基因组序列(包括启动子、基因编码区、内含子和基因下游序列)构建遗传互补载体,另外还同时构建利用Ubiqutin启动子驱动超表达载体进行遗传转化。还可以构建RNAi干扰的表达载体进行遗传转化。而目前的CRISPR/Cas9基因敲除等方法是更加高效的基因功能验证策略。

套路六@玉女心经--单倍型分析

玉女心经出自金庸小说《神雕侠侣》,由林朝英创造,是古墓派至高绝学,也是天下最快的轻功,成为丝毫不逊于九阴真经的武学宝典。林朝英创造玉女心经是要克制「全真派」武功,但因其对王重阳始终情意不减,所以林朝英幻想终有一日能与意中人并肩击敌,因之其第七章的武术是双人剑法,一个使玉女心经,一个使全真功夫,相互应援,分进合击,后由杨过和小龙女共同修习后习得,而且两人要心意相通,默契无间,是天下无敌的功夫。

对候选基因的单倍型分析可以进一步验证所确定的候选基因是否具有独特的遗传变异,是与前面功能验证相辅相成的研究,故此将其比喻为玉女心经!而对成百上千份资源材料精细的序列分析和比较,须心思缜密,心灵手巧,往往非女生莫属!单倍型分析可以发掘出目的基因新的等位变异,而一些优异的新等位变异可能在育种实践中属于未被利用(Left behind)的隐藏变异(Cryptic variation),对现代小麦遗传改良具有重要的意义。

进行单倍型分析的资源材料首选中国农业科学院作物科学研究所张学勇研究员构建的小麦微核心种质,具有遗传多样性丰富、代表性强、数量操作性强(262份)、已经具有主要的农艺性状数据的特点。其次可以选择各种自然群体材料进行单倍型分析,并需要对鉴定出的单倍型进行性状考察鉴定。再其次可以利用已经发表的重测序数据和Exon capture sequencing数据,分析目标基因在这些遗传资源材料数据中的变异特征。

套路七@易筋经--遗传和分子调控网络解析

易筋经是武侠小说中经常被提及的武林秘笈之一,亦是武林中人梦寐以求的武学宝典。易筋经有一种说法系明朝天台紫凝道人所作,是道家练气养生的功夫。此外还流传着一个少林易筋经的版本,据说是达摩所作,金庸武侠中的少林易筋经灵感就来源于此,因此有“天下武功出少林,少林武功易筋经”的说法。甚至于传说只要练成了《易筋经》,就可以做到天下无敌了。

易筋经有十二式,用以比喻功能基因遗传和分子调控网络研究中所用到的多组学、分子和生化技术手段。目前高水平的研究论文都追求调控机理的解析,而小麦中的遗传和分子调控网络研究需要学习和借鉴拟南芥和水稻等植(作)物的分子和生化技术体系,不断提高研究水平。

在遗传和分子调控网络研究中经常利用转录组学和代谢组学分析解析生物的基因表达调控和代谢调控网络。在材料选择上以近等基因系或转基因系等遗传背景相对一致的遗传材料为佳。由于生物自身的基因表达和代谢网络受生物节律(Circadin clock)的影响,为了最大程度降低试验误差和受节律调控基因表达差异,特别需要注意在设计不同的因素处理时间节点时,采用差别时间节点进行试验处理,保证所有的处理在同一个时间点时取样检测。

目前进行蛋白质互作网络研究所涉及的技术手段较多,包括多种蛋白质互作检测技术,如质谱分析技术(MS)、免疫共沉淀技术(Chip/Chip-seq)、酵母双(单)杂交技术(Y2H/Y1H)、凝胶迁移(EMSA)、Pull-down、BiFC等,而表观遗传调控研究在功能基因遗传和分子调控网络中的重要性也日益重要。

“飞雪连天射白鹿,笑书神侠倚碧鸳”涵盖了金庸先生的十四部武侠小说,可其中出现的武功名称却有400多种。本文仅以其中的七种武功比喻小麦基因图位克隆中的常见套路,尚且远远不能涵盖生物学研究中的方法和技术,而且许多相关内容未能展开描述。尤其在目前新的创新层出不穷,研究方法日新月异的情况下,只有勤于学习,善于思考,勇于创新,融会贯通,才能在小麦功能基因组研究中立于不败之地。祝愿大家在小麦的功能基因组研究中笑傲江湖!

(0)

相关推荐