【分子历史连载3】母系线粒体谱系树与扩散
你知道父亲的线粒体基因无法遗传给下一代吗?
1 线粒体基因组(mtDNA)
线粒体基因组也叫线粒体DNA(mtDNA,Mitochondrial DNA)。 mtDNA结构与细菌DNA相似,成双链环状。线粒体基因组的结构特点也与原核生物相同。现今人类体内的每个细胞中,大约有1000到10000个线粒体,而每一个线粒体内,则大约有2到10组mtDNA,每个mtDNA共包含16569个碱基对。
除男性精子细胞外,人身体所有细胞里面都有线粒体。由于男性精子细胞不含有线粒体基因,这样受精卵子中只保存有女性卵子中的线粒体,并遗传给后代。男人线粒体只伴随此男人生活一生,然后终结,不能遗传给后代。利用 mtDNA 多态性遗传标记来追溯人类群体起源迁移事件发生的大致时间及路线,成为人类进化研究的重要手段之一。
2 mtDNA系统发生树
在人类遗传学中,线粒体夏娃(Mitochondrial Eve)是所有当前生活人类的最近共同母系祖先 (MRCA)。通俗说,她是当今世界所有人类的最近共同祖母,约生活在10-20万年前的东非。因为在遗传中,父亲的线粒体基因不会遗传给下一代,这样母亲的线粒体可以不经过重组直接遗传给下一代,就是说儿子和女儿的线粒体基因组只来自于母亲,并通过她的女儿继续遗传给她的女儿,这与父亲的Y染色体不需要经过重组而遗传给儿子是类似的。线粒体基因组也会发生突变,突变点会被保留并遗传给后代。
线粒体突变的单倍群也是用英文字母来命名的,与Y谱系树开始时按照一次性排序命名再加之后修订稍有不同,线粒体单倍群命名是按照线粒体类型发现顺序来命名的,最开始遗传学家是研究的美洲土著母系基因,并标记为A、B、C、D四大类型,后来把发现的世界各地的线粒体类型再组合成系统发生树。与Y染色体按照二叉树突变规律类似,早期线粒体突变也基本按照二叉树方式进行。
线粒体夏娃最早的女儿单倍群被标记为L0,走出非洲时祖母被标记为L3。走出非洲时间大约在5-9万年前。L3下有两大分支,分别被标记为N和M。两大支下又有众多的分支。
由于欧美人在分子人类学研究方面具有垄断地位,与虚构Y染色体“进化树”类似,他们虚构母系mtDNA突变的所谓“进化树“,其实质是忽略其他母系分支下众多分支,而突出欧美人母系细化分支,形成一颗假树。
(mtDNA谱系树)
下图是PhyloTree.org 网站给出最新mtDNA谱系树:
3 亚欧类型M、N、R的分布
mtDNA-N单倍群分支下的R单倍群分支有众多分支,其中HV、UK、JT构成欧美白种人母系主要成分。而M下的各分支是亚洲和美洲黄种人的主要母系成分。这里值得指出的是R下的FB支系主要分布在东亚,其中B也分布在美洲,很可能最早是父系Y-O系对应的母系成分。
如下图所表示:
黑色类型-东欧亚类型:有M下的各支系,其中M1主要分布在东非,Q分布在美拉尼西亚人中;N下的A、N9、Y;R下的F和B。
灰色类型-西欧亚类型:有N下的I、W、N1a、N1b, R下J、T、H、V、U、K。
泛欧亚类型:X主要分布在西欧亚和美洲
其他L下的各支系分布在非洲
下面是一些类型在一些族群中的分布频率,NA表示美洲土著:
A 42% NA 美洲土著
B 22% NA 美洲土著
C 18% NA 美洲土著
D 16% NA 美洲土著
F 4% Asia 亚洲
H 39% Europe 欧洲
H 52% England 英格兰
I 5%
J 9%
K 8%
L 76% Africa 非洲
N1b Rare 稀少
R Rare 稀少
T 10%
U 11% Europe 欧洲
U5b1 42% Sammi 萨米人-北欧地区原住民
V 5%
V 40% Sammi 萨米人-北欧地区原住民
W 2%
X 3% Europe 欧洲
X 3% NA
Y
Z <1% [3% Sammi] 萨米人-北欧地区原住民
4 荒谬的“新老亚洲”论
复旦李辉虚构“两个人种论”,并在网上传播。基于他们自身立场,曾经先入为主把自己定位为种族优越的“新亚洲”,因为对应的母系N-R下F、B与欧美人的母系支系属于近亲,因而沾沾自喜,而把M系定位为“老亚洲”,并发挥他们的心理, YY某Y系祖先如何“神勇”还是“残忍”地父系Y-CD系进行了种族灭绝,杀光了Y-CD的男人,抢了“老亚洲”Y-CD的女人mt-M。
如下图是N下各单倍群,其中亚洲的B与欧洲UK是近亲,而亚洲的F与欧洲的HV是近亲,东北亚的Y与欧洲的JT是近亲。下图显示F的年龄不到3万年,B的年龄3-4万年左右,B比F早约万年。
然而真实的情况,mtDNA-M母系要比N、R母系都更要年轻。如下图,取自于论文《A “Copernican” Reassessment of the Human Mitochondrial DNA Tree from its Root》,Y轴表示幸存到今天的母系类型数量,大约有600多种,其中约有一半的300多种类型是在2-3万年内诞生爆发的。上方X轴表示突变数量,下方X轴表示距今年代。
根据上图显示N和R诞生于大约6-7万年前,而M诞生于5万多年前,整体上看显然M系要比NR年轻!当然R下有一些支系是诞生于2万年前左右。
下图取自于ancestry.com网站的分析文章“Swinging in the mtDNA Tree”。其中红棕色表示部分的支系分布在亚洲,紫色表示部分的支系分布在欧洲,黄色表示部分的支系分布在非洲。我们可以看到能够幸存到今天的人类母系大簇类型全部都是在非常晚近时期产生的,包括非洲的L支系。推测绝大部分单倍型(母系和父系)都是在1万-9000年的LGM(末次冰期)之后爆发扩张。而其早期祖先类型基本都没有能留下后代(考虑LGM及其后温度升高后的大洪水对早期人类的淘汰或许很厉害),但可以用来分析迁徙年代和途径。
4 M系的扩散与全球覆盖
然而如果用心思考一下:为什么亚洲FBY和欧洲母系类型是近亲,却分居欧亚大陆东西两端呢?
如下图,取自维基网站“Haplogroup M (mtDNA)”,其中了绿色部分表示mt-R系占优部分,黄色部分表示mt-N系占优地区,粉色部分表示mt-M系占优地区,灰棕色部分表示非洲L系占优地区。我们可以看到东南亚地区mt-R下的F和B占优势,而亚洲北方地区和印度则是M系占优势。实际上印度的M母系和亚洲北方地区的M系分离年代早,区别大,但在字母分配上,没有象N下再分出一个R系一样给亚洲北方地区的M系统再分配一个字母。当然或许研究不深入还没有找到共祖,或许本来只是共祖到M下。下面为了论述方便,我自定义一个⊙(发音“拉”)来代表黄种人母系共祖。
由于N、R的年龄要比M的年龄高出1-2万年,对FB和欧洲母系分居欧亚大陆两端合理的解释是mt-N出非洲后最早扩散于欧亚大陆,然后是R*系,再然后是以中亚为中心而诞生的黄种人母系⊙崛起,对mt-R母系进行了东西分割,其后⊙下各支系继续向欧亚非大陆扩散。结合马来系人种曾经覆盖东亚大陆和黄种人基因类型从北向南递减的现状,显然是mt-R下FB为“老亚洲”,而黄种人母系为后来扩散的“新亚洲”。
如下图同样取自维基,标出M系的一些类型分布,可以看出M1主要分布在东北非洲和中东。而CZD则分布在中东、中亚、北欧、西北利亚、美洲以及东亚北方,母系CZD分布与古文明区分布分布具有很好的一致性。在非洲南部的科伊桑人也分布有接近半数的N和M系,显示N和M都先后扩散于非洲,只是黄种人母系M在科伊桑人中占据优势成分,使得科伊桑人和苏丹人呈现黄种人特征。努比亚或库施人曾经于前8-7世纪占领并统治埃及全境约有百年,后被亚述人赶往南方。科伊桑人即可能是从苏丹继续南迁。这里确实有可能发生了黑人抢黄种女人事件。
中国人中的母系CZ约有8%,发现的中东地区和西伯利亚青铜时代的古mtDNA主要为mt-C,显示CZ与苏美尔人、古埃及人关系非常密切。同时也显示在中东地区人类文明历史时期的古今人种变化剧烈,中东黄种人基因反被JT等白种母系类型超越。至于mt-D的成分来源可能就比较复杂一些。
参考: