【分子历史连载12】Y-Q系的迁徙和全球扩张
笔者于2016年发布了分子人类学“入门”介绍性质的11篇科普连载文章。中国人父系主要单倍群有C、D、N、O、Q、R,以及少量E、J等。笔者在写这些文章的时候,尽量用客观的视角来介绍分子人类学的最新研究动态,尽量去除“主观的看法”,但有时似乎“主观性的烙印”又很难根除。此前的连载文章已经介绍了E、J、C、D、N、O、R。为避免个人主观性带来的可能误导,作为汉人主要父系单倍大群之一的Q单倍群,一直迟迟未敢动笔写。
实际上,任何一篇分子学的论文,都充满了作者们的个人性质的“主观看法”。这些“主观看法”大多时候未必能反映客观事实的,更多是分子学作者们基于有限数据,包括样本采样的有限性、因作者偏见的选择性和基因组分析数据有限性等,而进行的盲人摸象似描述,尤其是在缺乏考古学和历史人类学知识的综合分析情况下更是如此。有些描述可能会接近事实真相,但实际上有些描述有时还更多反映了作者们个人的一些主观偏见,尤其是在某些具有种族主义心理的作者文章中更是如此。所以笔者一贯强调,对分子人类学方面的论文,首先要保证数据的客观性,至于如何解读,则不同的人可能会有很多不同的看法,甚至截然相反的解读。
2019年初有最新一篇论文,标题是:对人类Y染色体单倍群Q的分析显示了欧亚大陆和美洲古代人口的流动迁徙特征(Analysis of the human Y-chromosome haplogroup Q characterizes ancient population movements in Eurasia and the Americas)。这篇论文2019.1.24日发表于《BMC Biology》,原文可点击下方“阅读原文”。小编就想以这篇文章内容为主干来对Q单倍群作一个简单的介绍。
首先来看一下这篇论文给出的Y-Q谱系树简图。没有分子人类学知识基础的人,看这张图与一定会晕。而小编就要以这张图为主线来简单介绍一下Y-Q单倍群的基本情况。
(Y-Q单倍群谱系树)
这张图最下方横轴表示时间单位千年(Kya),从3万年开始,这也是Y-Q单倍群开始形成时期的大约年龄,然后逐步展示Y-Q单倍群的分化,一直到今天。图的左上方是美洲几个Q的大分支单倍群在大约从1.8~0.5万年期间的人口爆发时间曲线图。曲线图下方是论文使用样本的各个地区的区分图标。在现代人类所有父系单倍群中,Y-Q单倍群是在哥伦布时代之前的唯一遍布于全球各大洲的单倍群,这样的分布是如何形成的?与古代文明扩散是否存在关系?迄今都没有合理的解释,或者回避解释,或者给出曲解误导性的解释。
维基百科介绍Y-Q单倍群起源年龄大约在距今17,200 ~ 31,700年前,最可能是在 距今24,500年前。学术界目前主流认为,Y-Q单倍群形成于中亚和中南西伯利亚一带,随后向四周扩张迁徙,在2-1万年间,Q族群向东进入美洲,向西进入西亚和欧洲,向南进入南亚。非主流界也有认为Y-Q单倍群可能起源于西亚或南亚。考古发现的这期间的细石器文化扩张与Y-Q单倍群扩张存在较为明显的伴随关系。下图是俄罗斯和复旦大学等多国学者合作论文《Dispersals of the Siberian Y-chromosome haplogroup Q in Eurasia》中关于Y-Q单倍群的扩散图。
根据最新论文谱系树,Q-M242单倍群大约于2.65万年前开始第一次分岔,形成Q1-L472和Q2-L275两大分支。Q2分支就是早期命名的Q的西欧亚类型Q1b。它有两个分支Q-Y1150和Q-M378.
(Q2-L275两大分支现代样本的地理分布)
Q-Y1150形成年代大约在1.47万年前,最近共祖时间大约在6500年前,主要分布于南亚和伊朗地区,在欧洲部分俄罗斯、比利时、意大利等人群中也有少量分布,其中有一分支在阿什肯纳兹犹太人(Ashkenazi Jews,又称德系犹太人)中。
Q-M378形成年代大约在1.05万年前,最近共祖时间大约在6400年前,主要分布于地中海周边和中东地区。在欧洲人群体中占有相当的比例,在中亚、南亚、高加索和北非等地也有一定的比例。在YFULL网站上已出现有4例中国的M378样本。中美洲地区也发现有两例M378样本,但被论文解读为是属于哥布伦之后的欧洲殖民者后裔混入。
如果单看Q2分布,很容易把该分支形成地认为是在从地中海周边到中东和南亚一带。但是从Q2形成到最近共祖年代有约2万年时间的瓶颈期,在这2万年时间内,一切都有可能。从Q-Y1150和Q-M378的大约6500年最近共祖时间看,Q2人群爆发年代和地区相当于苏美尔欧倍德文化到乌鲁克时期。而其在地中海和欧洲分支基本属于L245下两个分支,其最近共祖时间大约在2.5±0.8千年,大约是在古埃及文明新王国中期或崩溃之后,才进入地中海周边和欧洲。M378的另一分支Y2250最近共祖时间大约5500年前,大约相当于苏美尔乌鲁克文明中期,其分布于地中海出海口和伊比利亚半岛,以及印度半岛南部和中亚地区。这个分布特征与乌鲁克时期的苏美尔人陆海路扩张可能存在一定的关联。M378在以色列犹太人和德系犹太人中占有5-7%的频率。
Q1-L472两大分支是Q1a-F1096和Q1b-L56(M346).下图是Q1a-F1096分支的古代和现代样本全球分布图。其中五角星显示的是古代样本。Q1a-F1096单倍群形成年代大约在2.6万年前,最近共祖时间2.41万年。其下也有两个主要分支,分别Q1a1-F746和Q1a2-M25。
(Q1a-F1096单倍群古今样本全球分布图)
Q1a1-F746的最近共祖时间距今有1.69万年,在叶尼塞河谷阿丰托瓦遗址发现有约1.7万年前的古人古遗骸,与猛犸象遗骨在一起,古DNA测试表明属于F746*单倍群。但最新论文未包含该样本。F746下两个主要分支是Q1a1a-M120和Q1a1b-B143。F746*主要分布于北美大陆北部和格林兰岛。
QM120单倍群是汉人的主要特征单倍群之一,最近共祖时间6500年。在伊朗、巴基斯坦、印度,以及不丹和东南亚方向的文莱也有少量分布。美洲地区秘鲁发现一例Q-M120,有些人认为属于近代华人基因流入,但该样本不具备任何东亚QM120样本的那些任何突变SNP位点。在阿拉斯加一现代样本被定义为pre-M120, 年龄大约有14.2万年。东亚QM120样本基本都是Y515分支下的样本,最近共祖时间4.6±0.9千年。古DNA方面,在黑海西岸摩尔多瓦境内约3100年前的辛梅里安人一例样本被证明是Y515下的Y558分支。约3000年前西周早期晋国最初版图境内的横水北诸侯王级大墓基本都是 QM120。大约2500年前东周时期宁夏彭阳王大户遗址贵族古DNA也是QM120。从pre-M120到QM120经历了约1万年时间的“瓶颈”,这个瓶颈可能是真瓶颈,也可能是假瓶颈,所谓假瓶颈主要来来自于选择性数据或掩盖数据的结果。pre-M120人群在这一万年时间内经历怎样的迁徙和扩张,目前还不得而知。同样地,在这一万年时间内,一切皆有可能。从阿拉斯加到东亚直接画等号,这是不科学的。
Q1a1b-B143分支则主要分布于俄罗斯亚洲大陆部分的东北角一带,大约4000年前格林兰岛的Saqqaq古DNA样本属于该分支。
F746下的另一大分支Q1a2-M25最近共祖时间有1.63万年。与Q2类似,Q -M25分支主要分布在西欧亚方向,土库曼斯坦人约40%属于该分支,在伊朗北部也有10%左右的分布,基本属于L713分支,共祖年龄只有2.2±0.8千年。在山西汉族中约有1.8%的Q-M25。有趣的是,目前发现的Q-M25古DNA,年代介于4.4-0.2千年之前,全部分布在从西伯利亚到白令海两边以及阿留神群岛一带。青铜时代中晚期之后的M25古DNA的地理分布与现代样本M25地理分布的差异,也是一个十分有趣的问题。笔者倾向于认为Q-M25是爆发于中东地区,西伯利亚到白令地区的青铜时代中晚期以后的Q-M25古DNA是中东青铜人群从欧亚大陆腹地向美洲方向扩张的结果。YFULL网站上显示的M25现代样本有来自英国、土耳其、巴基斯坦、印度、巴林、俄罗斯、乌兹别克、匈牙利和波兰等。
再来看Q1b-L56(M346)分支情况。属于这个分支的两个基本分支是Y2659和L53。
Q-Y2659分支最近共祖年龄1.88万年,其下也有两个分支Z5902和L940。在美洲地区未发现属于该分支的样本。
Z5902最近共祖年龄有1.59万年,主要分布在印度半岛,又基本属于6.5±1.3千年扩张的Y6794分支。Y6794下YP1600分支又基本分布于东欧。L940最近共祖年龄有1.66万年,分布在从印度半岛、西亚、东欧,一直到英国和北欧地区。其中北欧大簇属于FGC7000 分支,最近共祖时间2700年。
进入美洲大扩张的单倍群实际是Q-L53下的支系。L53实际位于亚洲、欧洲和美洲特有分支的系统发育十字路口。L53最近共祖年龄1.81万年,可能起源于中亚,在扩散之前,分化为Q-YP4004和Q-L54。但在南美地区发现有超过1万年的 L53*古DNA。YP4004发现于俄罗斯和波兰,最近共祖有7500年。
Q-L54是L53下的大分支,最近共祖有1.6万年。其下两个主要分支是L330和M1107。
L330分支最近共祖时间有7700年,主要分布在中亚、东亚以及少西欧亚。YFULL网站上L330样本有哈萨克斯坦、俄罗斯、蒙古、匈牙利等。Q-L330的较低频率与它的兄弟分支 Q-M1107相比,表明Q-L330在欧亚大陆传播之前,在中亚某个地方经历了一个强烈的瓶颈。
M1107分支最近共祖年龄有1.55万年,有M930和Z780两个分支。M930下有L804和M3两个分支。
美洲土著印第安人大部分属于Z780和M3这两大分支。美国蒙大拿州"安齐克男孩”(Anzick-1)古DNA年龄距今大约有12,707–12,556年,属于Z780下Q-FGC47532分支,这是从克洛维斯文化复合体中唯一被发现的人类遗骸,也是第一个完全测序的古美洲土著基因组。Z780下的各分支主要于墨西哥和安第斯山脉。
M3包括M848和Y4276分支。尽管Q-Y4276在树上的表现较差,但从西伯利亚到南美,其地理分布最为广泛。它是在美国(弗吉尼亚、卡罗莱纳和乔治亚州,也在西南部)发现的主要分支,以Q-Y4276*和Q-Y4300的形式存在。Q-Y4303*似乎与说阿尔冈昆语的受试者有关。阿尔冈昆语是北美人口最多、分布最广的土著语言群体之一。历史上,它在大西洋沿岸和沿着圣劳伦斯河进入泰瑞奥河,在五大湖和落基山脉周围非常突出。
在北美,Y染色体系Q-Y4276的分布与mtDNA单倍型类群x2a和稀有c4c的分布相似。据推测,他们是通过劳伦蒂山脉和科迪勒山脉冰原之间的无冰走廊从白令吉亚进入北美的。因此,可能是携带mtDNA单倍型群x2a和c4c的同一个族群在北美携带了Q-Y4276的Y染色体。进入美洲的谱系分化可能发生在进入美国之前的东部白令海峡,分为两条路线:海岸线(Q-Z780/Q-M848)和内部路线(Q-Y4276)。
(从白令陆桥进入美洲三大路线和回流)
Q-M848是现代和古代美洲单倍型类群Q中最具代表性的分支。Q-M925是其亚单倍型群中扩散最广的,样本来自从美国到南美,其年龄估计有 9.8 ± 1.4 千年。它包括四个分支(Q-Z4012、Q-Y26547、Q-Y12421和Q-CTS748),具有特定的地理分布,还有一些尚未亚类化的Y染色体(M925*)。在两个巴西样本中发现Q-Y26547;在墨西哥和美国西南部都观察到Q-Y12421,它是巴拿马M3 Y染色体的主要特征;Q-CTS748几乎涵盖了数据集中所有的墨西哥M3 Y染色体,其中一半进一步以CTS1002标记为特征。此外,在美国西南部也偶尔观察到。在这项研究中测试的三个分支中,墨西哥的Q-CTS748是最古老的(8.5±1.4Ky),其次是其分支Q-CTS1002(6.8±1.2Ky)。剩下的两个分支更为新(Q-Y12421:5.3±1.0 KY;Q-Y26547:1.2±0.6 KY),尽管它们的年龄估计可能会受到包含在树中的极少数样本的影响。这些关联单倍群分支揭示了这些宗族的内部高度复杂性,以及还存在未确认的亚宗族。
从墨西哥到阿根廷,M848下另外两大分支Q-Z5906和Q-Z5908表现出相似的分布模式,秘鲁的频率峰值都表现出最大的多样性,每一个都包括一个当地特有的亚族:Q-M557和Q-SA01。Q-Z5906几乎完全由CTS4000代表,在玻利维亚也以高频率出现。如STR单倍型网络图所示,所有单倍型都有明显的扩展。在秘鲁和玻利维亚发现了Z5906亚系。相反,Q-Z5908表现出早期的分化,尽管在该区域表现良好,但没有任何亚系扩张的迹象。对这两个族群观察到的差异可能是由于其携带者的不同生存行为和人口动态。
最后一个M3的小兄弟支系L804,新论文作者认为,在白令海峡停留期间,Q-M930分为Q-L804和Q-M3。论文认为从白令亚开始,L804向西进入北欧,Q-M3进入美洲大陆,进一步分化为Q-M848和Q-Y4276。然而L804的最近共祖时间只有3200年,与M3最近共祖1.31万年,差了将近一万年。认为L804与M3分道后,就直接进入北欧,可能也过于草率。
以上是一个详细的单倍型类群Q系统发育史,为其欧亚和美洲分支在现代和古代样本中的地理分布提供了新的见解。要详细解释这些分支的迁徙与分布的历史原因,目前还是对专家们智商的一个考验。尤其是许多分支还都是文明历史时期扩张的。天然具有自身Y立场影响的分子人类学专家们,如果在没有考古学和历史人类学的知识的综合分析之下,更容易走上错误的道路。