中国栽培小麦老家来自欧洲?--首篇小麦基因组大规模重测序研究

2019年1月14号,农历腊月初九,是大家过完腊八品茗五谷的日子。国际科技期刊预印本网站biorxiv,悄悄的挂出了一篇遗传发育所焦雨玲老师为通讯作者的关于小麦重测序的文章。这篇文章选取了120份具有代表性的小麦地方种和栽培核心种质,每份材料重测序11倍覆盖度,参考中国春基因组得到了全基因组变异图谱,然后进行了中国小麦栽培和育种史的研究。

材料不多,120份。但是小麦庞大的基因组,足足有17G之巨,是水稻基因组的40多倍,也就是说,单单从测序成本上,这个项目就相当于测了5000份水稻。数量上的庞大,仅仅是项目的难度很小的一方面。做生信分析的都知道有个简单的换算比例--运算量差不多和输入数据量的三次方而不是一次方成比例的。任何事情,加上平方都是了不起的,更别提加上三次方,所以默默的为中国科学家加油吧!

下面我们就简单的看图说话,来看看这个研究项目给我们带来了那些有趣的故事。为了便于大家理解,先给大家两个名词解释,一个是农家种(landraces),另一个是栽培种(cultivars)。栽培种就是现在农田里广为种植的品种,是公司、科研机构的现代育种结晶;农家种是之前历史上农民耕作的品种,是农耕文明的历史遗产。你可以理解成一个是高铁,一个是火车。

图一、材料和遗传多样性

图一展示的是材料多样性的情况。a,地理分布;b,表现遗传多样的各种参数,SNP density, Tajima’s D, π,  θ;c,三个亚基因组上多样性。这些分析都是群体遗传的常规操作。我们从c上可以看出,小麦的三套基因组上A和B具有更多的遗传多样性,同时D基因组不仅遗传多样性小,次等位基因频率(SNP,往往只考虑biallelic,一个位点两个等位基因,比如G和C,如果G等位基因频率是0.6,C就是0.4,那么这个位点上的MAF(minor allele frequency)就是0.4)也更加的低频化。

这个图,是下面故事的基础。

图二、群体结构

图二主要是材料的群体结构的分析。a,是120份材料的NJ树;b,是PCA分析结果,这两个结果都可以看出,中国的小麦栽培品种(小麦高铁)和欧洲农家种聚在一起,而不是和中国的农家种聚在一起。这强烈的预示着,中国的“小麦高铁”,是个舶来品,来自欧洲的火车,而不是本土火车改良(事实上中国的高铁技术开始时候也确实主要来自法国、德国、意大利和日本)。d图,从Fst这个群体遗传参数里,也说明了这个事。e图呈现的是小麦里面比较悲催的一面--小麦的LD衰减非常慢。这个图,其实从根本上说明了,即便测序价格降到非常便宜,小麦的GWAS分析也不会像水稻玉米高粱一样搞得轰轰烈烈,你可以轰轰烈烈的砸钱,但是肯定不会轰轰烈烈的出结果,因为大于10Mb的LD block,会让你的GWAS结果,不是高楼耸立的曼哈顿商业中心,而是平平坦坦的农村小平房。说句人话,就是你的GWAS找不到基因。想必这也是这篇文章没有展现GWAS的一个原因,花了那么多钱,GWAS肯定做了,但是结果应该是理所当然的不会好。

正文描述部分,又对ABD基因组分开做了群体结构的分析,发现AB基因组得到的结果类似,都是中国栽培种和欧洲农家种离的近,但是D基因组中却反转了,中国栽培种和中国农家种更近了。有一个原因可以解释,小麦的产生是AABB先多倍化,然后DD再加入。其中小麦和欧洲的四倍体小麦AABB有很多的基因交流,有很多的优良基因持续的从AABB中导入小麦群体,所以中国小麦育种过程中也大量的选择、继承了欧洲小麦的AABB遗传信息,而DD基因组并没有这种基因流,也就更多的保留了本地特色。(为什么DD没有?可能还需要后续更深入研究)

图三、基因流和基因渗入

图三是做的基因流和基因渗入的分析。上面已经说了,中国的栽培种亲缘关系和欧洲农家种更近,那么究竟是那些区域更近,或者是全基因组都近吗?中国的农家种对中国的栽培种又有那些贡献呢?a是基因流的结果,不做群体遗传和演化的看不懂,可以不用管。图二是和参考基因组相比的远近打分,也可以不用管。(我觉得上面两个图换成基因组的马赛克图,会更加清爽直接)。d图是一个实打实的数据,中国栽培种,整个基因组上有5.61Gb的区间和欧洲农家种更近,2.13Gb的区间和中国农家种更近。e,f是展示的两个例子,e这个区间中国栽培种和欧洲农家种更近,f这个区间则是中国栽培种和中国农家种更近。说明了大家对现在的中国栽培种都是有贡献的,只不过,舶来品占比更大点。

图四、育种选择分析

图四讲的是现代育种过程中,基因组上有那些受选择的信号。要算育种中的选择,所以使用栽培种和农家种两个群体作比较,计算的方法是π值比较,Fst,XP-CLR,XP-EHH这些常规的选择分析。b图展示的是这些受选择区域中,在ABD三套同源基因组上,那些同源区间是共同受选择的。所谓选择,就是在育种中,由农家种到栽培种,优异基因等位基因频率上升的过程,d、e、f就是展示了一些基因,在农家种和栽培种两个群体中的基因频率。

图五、小麦适应性选择分析

上面分析的是育种中的选择印记。那么换一个思路,我们比较中国栽培种和欧洲农家种,就这两个地方的品种基因组上的差异,也就是反映了适应性的情况。为什么比较欧洲农家种而不是欧洲栽培种,因为材料选择里面欧洲栽培种只有2个,做不了啊。

总之,这项研究,为我们分析了中国小麦的育种栽培历史的基因组印记,展示了欧洲小麦品种和中国传统小麦品种对现在我国小麦栽培品种的贡献,也许能够启迪我们在育种过程中更加注重外来资源和异地选择的重要性。这部分数据对于小麦基因组的理论研究和育种应用都有相当重要的利用价值。

原文链接:

https://www.biorxiv.org/content/10.1101/519587v1.article-info

(0)

相关推荐