分子人类学基础知识(五),一路向东,现代东亚人的起源之旅(上)
01
父系单倍群的命名方法:
以父系CT-M168和 D-M174为例,“-”前的CT和D是单倍群名称,“-”后的 M168和M89是突变名称。因为全人类的父系支系(也就是所说的单倍群)有很多种。早期的研究在很久以前发现一系列的突变(如M168和M89),用这些突变定义了全人类的绝大部分父系支系,支系的名称分别用A到T等字母来命名。支系名称(如D)加上突变名称(M174),就成了父系单倍群的命名方法(D-M174)。
因为大类单倍群之下有很多支系,形成很多层级。于是,交错地用数字和字母来命名下游支系。例如,D-M174下有两个支系分别命名为D1-CTS11577和D2-L1378。D1-CTS11577之下的两个支系分别命名为D1a-F6251和D1b-M64.1,依此类推。
母系单倍群的命名方法:与父系的命名法基本相同(如F1a1a-A8149G)。
02
走出非洲:10万or5万年前?
早期的遗传学研究观察到非洲之外的主要父系支系大约是在5万年后才开始大规模扩张的。因此,当时的学者推测现代人类可能是距今5万前才走出非洲的[1]。
不过,这个推测与考古学以及其他学科的发现存在冲突。比如,在以色列 Skhul 和 Qafzeh 洞穴发现的人类骨骼化石(年代为距今9.2万年)可以毫无争议地被归类为现代人类。之后,通过对全球人类的常染色体的研究,发现非洲之外的现代人类的遗传成分的共祖时间可达10万-11万年[2]。
父系遗传方面的证据也支持这个时间。非洲之外的父系都是CT-M168的后裔,而CT-M168与非洲特有的B-M60的分离年代约为距今13万年至10万年[3]。因此认为,目前各方面的证据都支持现代人应该在距今10万年前后就已经走出非洲了。走出非洲的父系可能是CT-M168,伴随的母系可能是L3’4。
综合以上信息,我们同时可以推测:在距今10万年到5万年前之间,现代人类的祖先出非洲后大约一直生活在中东一带。直到距今5万年前后,他们才大规模地扩散到欧洲大陆、亚洲大陆和澳洲大陆的大部分地区。
图1,现代人祖先走出非洲时的父系和母系,引自[1,2,3]。 图中的4条绿线分别代表4个年代:东非奥莫人的年代(19.5万年前),以色列Qafzeh人的年代(9.2万年前),多峇火山喷发的时间(7.4万年前)和东亚地区最早的晚期智人遗存的时间(约5万年前)。
03
非洲之外的主要父系
父系A00-AF6的各个分支和B-M60是非洲人特有的父系类型。此外,E-M96主要分布在非洲,但在中东地区和欧洲也存在。
非洲之外的主要父系类型(即CT-M168下游主要支系)包括:E-M96, C-M130, D-M174, G-M201, F-M89, H-L901, I-M170, J-M304, L-M20, T-M184, M-P256, S-M230, N-M231, O-M175, P-P295, Q-M242, R-M207。
对于C-M130, F-M89和K-M9, 它们都存在遍布欧亚大陆和澳洲的下游支系。因此,一般认为,在大约距今5万年前,这三个父系大约是从中东地区开始向周边地区扩散。一部分经由南亚迁往东南亚、东亚和澳洲。一部分经由中亚迁往西伯利亚,一部分迁往西往欧洲地区。
图2,现代人类的主要父系
04
欧洲人群的主要父系
欧洲人群的主要父系是 I-M170, R-M207, J-M304和G-M201。这些父系是在不同的时代扩散到欧洲的。其中父系I-M170可能是欧洲大陆最古老的父系之一,在旧石器时代已经在欧洲大陆扩散。父系J-M304和G-M201可能是在新石器时代以后才在欧洲大陆大规模扩散的。而R-M207可能在旧石器时代晚期已经扩散到欧洲东北部,R-M207在新石器时代和青铜时代发证强烈的扩张,成为现代欧洲人的主要父系类型。
图3,欧洲人群的主要父系及扩散路径
05
东亚人群的主要父系
Y染色体单倍群O-M175, C-M130, D-M174和N-M231是现代东亚人群四个主要父系类型,约占到东亚全部男性的93%。其他单倍群,例如E-SRY4064, G-M201, H-M69,I-M170, J-P209, L-M20, Q-M242, R-M207 和T-M70 仅占到东亚男性的7% 。本文暂时仅介绍如上四个东亚父系主要类型。
1.东亚人群的主要父系D-M174
父系D大约在6.5万年前诞生,由单倍群DE-M145分化产生。在约5万年前分化成几个重要的的下游支系,扩散到了安达曼群岛、东南亚群岛、东亚地区(包括青藏高原)和日本列岛。接下来简单介绍D-M174的几个主要下游支系。
父系D1a1-M15在东亚人群中也广泛存在,在青藏高原人群中的比例相对较高,是藏缅语人群的核心父系之一。
父系D1a2-P99主要分布在青藏高原人群中,是藏缅语(特别是羌语支和藏语支)人群的核心父系之一。
父系D1b-M46.1主要分布在日本列岛。目前还不知道这个支系是在何时、是否是从东亚大陆迁徙到日本列岛。但目前能够确定的是,这个支系大约在4.5万年前就诞生了,它在日本列岛上至少已经有2.2万年的扩散历史。
基于下游支系的分布,可以推定D-M174这个父系在早期应该是沿着亚洲东南部地区进行扩散的,即目前学界一般认为的东亚人群祖先“南线扩张”路径。
图4.D-M174主要下游支系扩散路径
2.东亚人群的主要父系C-M130
父系C大约在6.5万年前诞生,由单倍群CF-P143分化产生。在距今5万年前后分化成几个重要的的下游支系,扩散到了欧亚大陆东部地区和澳洲地区,但在欧洲也存在一个下游支系(V20)。接下来简单介绍C-M130的几个主要下游直系。
父系C1a1-M8主要分布在日本列岛。父系C1a2-V20主要分布在欧洲。父系C1b1a1- M356主要分布在南亚。C1b2a-M38主要分布在东南亚岛屿地区、新几内亚岛和西太平洋地区。C1b2b-M347主要分布在澳洲土著人群中。在东亚地区,C-M130最主要的下游支系是 C2-M217。
可以推测,C1a2-V20应该是在最初分化的时候就向欧洲方向扩散了。而出现在南亚直到澳洲的支系C1b2a-M38及C1b2b-M347,则应该是沿着亚洲东南部地区扩散的。
对于父系C2-M217经由南线还是北线(下图中带问号的虚线)迁徙到亚洲东北部,目前还有一点争议。C2-M217的下游支系C2a-F1067主要分布在东亚,而C2b-F1396则主要分布在亚洲北部。不过,C2a-F1067之下最早的分支(C2a2-CTS4660)主要分布在东南亚和华南地区。这似乎支持C2-M217是经由南线迁徙到东亚地区的。不过,由于目前证据的缺乏,我们暂时无法精确定位旧石器时代的人群迁徙路径。因此,C2-M217经由南线还是北线进入东亚这一话题的意义可能并不大。我们可以更加关于C2-M217的下游支系在东欧亚地区的扩张对东亚人群的影响。
图5.C-M130主要下游支系扩散路径
3.东亚人群的主要父系N-M231
父系N-M231大约在3.7万年前诞生,由单倍群NO-M214分化产生。在距今2万年前后分化成几个重要的的下游支系,主要分布在东亚、西伯利亚和欧洲东北部地区。接下来简单介绍N-M231的几个主要下游支系。
N1a1a-M178主要分布在在东亚、西伯利亚和欧洲东北部地区。这个支系的下游支系是乌拉尔语人群和部分西伯利亚人群的核心父系类型。但是在东亚地区(包括汉族人群)也存在很多N1a1a-M178的下游支系,有的是早期的分支。
N1a2a-M128主要分布在东亚地区,集中出现在汉族人群和华北-东北地区的少数族群之中。这个父系可能是中国古代华北和东北地区最重要的父系类型之一。
支系N1a2b~ P43是西伯利亚西部地区的萨摩耶德语人群和汉特-曼西人群的主要父系类型。支系N1b-F2930主要分布在东亚地区,是汉藏语人群的核心父系类型之一。
对于父系N-M231经由南线还是北线(下图中带问号的虚线)迁徙到亚洲东北部,目前还有一点争议。一部分下游支系(N1b-F2930)局限在东亚,而另一部分(N1a1a-M178)则遍布西伯利亚。不过,在华北和东北地区发现有很多N1a1a-M178之下的早期分支。这可能支持西伯利亚的N1a1a-M178是从中国的华北-东北地区扩散过去。另一方面,一般认为N-M231的旁系支O-M175是经由南线迁入东亚的。按常理推测,N-M231也应该沿南线迁徙而来。不过,N-M231还有很多罕见的早期分支,分布也很离散。旧石器时代的采集-渔猎人群的活动范围通常都很广。
由于目前证据的缺乏,我们暂时无法精确定位旧石器时代的人群迁徙路径。因此,讨论N-M231经由南线或者北线这一话题的意义可能并不大。我们可以更加关于N-M231的下游支系在东欧亚地区的扩张对当地人群的影响。
图6.N-M231主要扩散路径
4.东亚人群的主要父系O-M175
父系O-M175大约在3.7万年前诞生,由单倍群NO-M214分化产生。这个父系是东亚人群中比例最高的父系类型,约75%的中国人以及超过50%的日本人都可归到这一类型下,因此有理由认为它代表着蒙古利亚人(即一般认为的黄色人种)。
O-M175分出三个主要的下游单倍群O1a-M119、O2-M268以及O3-M122,这三个单倍群约占到东亚男性的60%。
O1a-M119在中国东南沿海、侗傣族群、台湾原住民中集中分布。
O2-M268约在汉族中占5%以上,O2a1-M95是O2下的主要支系,在华南、南方少数民族、中南半岛及印度门哒人群中分布较多。O2b-M176是O2下的另一支系,最主要集中于朝鲜半岛、朝鲜族和日本弥生人,越南人和汉族中也有少量分布。
O3-M122是中国最常见的单倍群,遍及整个东亚和东南亚,占汉族50-60%左右。O3a1c-002611、O3a2c1-M134和O3a2c1a-M117是O3下的三个主要支系,各占到汉族的11-17%左右。O3a2c1a-M117在藏缅族群中也有较多分布。O3下的另一支系O3a2b-M7在苗瑶和孟高棉人群中高频出现,但在汉族中却不足5%[4]。
图7.O-M175主要扩散路径。距今1万年至4千年前的新石器时代,中国陆续形成了几个非常重要的文化区域(如图所示两个绿圈),包括黄河流域的仰韶和龙山文化,长江流域的河姆渡和良渚文化。中国最早的农业就诞生于这两大块区域,小米种植与黄河流域文化相辅相成,大米种植与长江流域文化紧密联系,可以说这两个区域养育了我们中国人的先祖。随后中国进一步迈入文明社会,人口在不同历史时期产生了更加频繁的流动与融合。
06
“北线”还是“南线”?
关于蒙古利亚人进入东亚的迁徙路径,曾经普遍认同的看法是两条路线:第一条从非洲东北部进入地中海东部地区,并以此作为中转站沿东西走向分别进入中亚和欧洲,该路线被称为“北线”;另外一条路线从东非进入阿拉伯半岛,然后沿着南部海岸线进入南亚、东亚和大洋州,该路线为“南线”。本文仅讨论衍生出O-M175和N-M231的父系NO-M214人群进入东亚的迁徙路径。
由于父系O-M175的下游支系主要分布在东亚和东南亚地区。在华南和东南亚人群中尤为高频。此外,在印度和东南亚地区已经发现了属于NO-M214旁系支的5个现代人家系。南亚和东南亚有很多罕见父系,未来有可能发现更多的的NO-M214早期旁系支。
而西伯利亚4.5万年前的Ust'Ishim人属于NO-M214的早期分支,目前没有在现代人中找到近亲,可能是已灭绝的旁系支。
所以,一般认为以NO-M214为主要父系的人群应该是经过亚洲东南部迁徙到东亚的。经过中亚迁徙到西伯利亚的早期分支也存在,但可能都已经灭绝了。不过,目前并不能排除NO-M214经由北线迁徙到东亚的可能性,还有待更多的证据。
图8.Ust'Ishim人在父系谱系树上的位置
参考文献
[1] Metspalu, Mait, et al. (2004) Most of the extant mtDNA boundaries in South and Southwest Asia were likely shaped during the initial settlement of Eurasia by anatomically modern humans. BMC Genetics,5:26.
[2] Mallick S., et al. (2016) The Simons Genome Diversity Project: genomes from 142 diverse populations. Nature 538: 201-206.
[3]Karmin, M., et al. (2015) A recent bottleneck of Y chromosome diversity coincides with a global change in culture. Genome research 25, 459-466
[4]王传超 (2015). 东亚人群的遗传历史 [D]. 上海:复旦大学,2015.
作者简介:韦兰海,复旦大学人类生物学博士,主要研究人类的父系Y染色体谱系树、东欧亚地区族群及其文化传统的起源和演化历史。于2010年开始创办“分子人类学论坛” (后更名为“人类生物学在线”),现已成为具有较高知名度的、专业的分子人类学科普平台和活跃的个人DNA测试数据讨论社区。