【分子历史连载1】人类亚当及Y染色体谱系树
编者著:分子人类学的发展日新月异,很多观点结论都还处于动态变化或不断修订中。维基百科上也在跟踪分子人类学的这些进展。很多网友对分子人类学很感兴趣,但不知如何入门。曾有多位网友希望兵策儒剑能够写一些分子人类学基础知识的系统性普及文章,因此决定在文明基因公号上开辟“分子历史”专栏文章,不定期连载。文章内容主要是根据兵策儒剑新浪博客之前所撰写的博文,结合维基百科等资料编辑而成。
1 分子人类学发展简明史
分子人类学产生于二十世纪60年代,它是分子生物学与人类学交叉产生的边缘学科。从60年代开始,一些分子生物学家逐步将分子生物学技术引入人类学研究领域,试图通过研究人类DNA中所蕴藏的遣传信息来揭示整个人类的形成与演化过程,并寻找人类的祖先。随着分子生物学理论和技术应用于人类学领域,人类学的一门新的分支学科——分子人类学(Molecular anthropdogy)兴起了。在随后分子人类学的关键发展阶段,经历了三次大争论,显示了分子人类学的威力:
(1) 初显威力,人猿分离时间大争论
分子人类学在诞生之初并未受到人类学界的欢迎。许多人类学家对该学科的研究成果都持怀疑或否定态度。60年代未美国加州大学伯克利分校的两位分子生物学家—阿伦·威尔逊(Alan Wilson,后来夏娃理论的主要提出者)和文森特·萨里奇(Vincent Sarich)通过比较现代人类和非洲猿类的血液蛋白的分子结构,得出了人猿分离时间为距今约500万年前的结论。这与古人类学家通过化石证据获得的1500万年前的结论相去甚远,因而引发了人类学界的一场大争论。当时绝大多数古人类学家都不相信威尔逊和萨里奇的结论,认为这是离奇和荒谬的。但在以后的十多年中,其他一些分子生物学家通过研究人类其他组织的分子结构,得出了和威尔逊等相似的结果。80年代初,匹尔比姆(Pilbeam)和安德鲁斯(Andrews)根据新的化石材料否定了腊玛古猿(Ramapithecus,当时曾认为其生存年代为1400万年前)的人类祖先地位,从而大大缩短了我们人类出现的时间。整个人类学界不得不承认:在人猿分离问题上,威尔逊和萨里奇是正确的,而人类学家是错误的。此后,一些古人类学家(如英国的斯琼格 Stringer、德国的布劳尔 Brauer等)开始欢迎分子生物学家的介入,并把分子人类学的研究成果视为人类起源研究的重要组成部分。
(2) 夏娃理论,人类走出非洲
在人猿分离争论结束后不久,一场更大的争论席卷了整个人类学界,这场争论一直延续至今。1987年1月,美国加州大学伯克利分校的3名分子生物学家威尔逊、卡恩(Cann)、斯托金(Stoneking)联名在英国的《自然》(Nature)杂志上发表了《线粒体DNA与人类进化》一文,在文中他们根据对147名妇女(这些妇女分别来自欧、亚、非洲及太平洋群岛和澳大利亚)的胎盘细胞线粒体DNA(Mitochondrion DNA)11的分析提出了著名的夏娃理论。该理论认为,现代人类的共同祖先是20万年前生活在非洲的一名妇女(威尔逊命名其为夏娃),大约在10-15万年前,夏娃的后裔走出非洲并扩散到世界各地,在这一扩散过程中他们完全取代了当地的原始人类(完全取代意味着夏娃的后裔与当地人群之间的杂交即使存在的话,其影响程度也只是无穷小的)。 威尔逊小组的报告给人类学界以猛烈的冲击,其程度较之分子生物学家们前一次的介入(人猿分离问题的争论)有过之而无不及。针对威尔逊小组的观点,从事现代人类起源研究的古人类学家们的态度各不相同。多区进化论者认为:威尔逊小组的资料和分析方法都是不可靠的,现代人类的“基因相似性表明了一直追溯到一百多万年前我们的祖先最初居住于旧大陆以来人们之间的(基因)连锁的结果,基因相似性是具有悠久历史的群体联系和配偶交换的产物”。其他持多区进化论观点的古人类学家也先后对威尔逊小组提出批评,认为从现有的化石材料中找不到现代人类完全取代古人类的证据。持非洲起源说主张的学者则多支持威尔逊小组的观点,斯琼格认为:“所有现代人类均来源于一较近非洲祖先的理论已得到研究现代人群的遗传学家的支持,化石记录也从另一方面为这一模型提供了证据。”生物学界的态度则较为一致,多数遗传学家都支持威尔逊小组的观点,认为它在生物学上也是最合理的。但同时,对威尔逊小组最有力的批评也来自生物学界。美国华盛顿大学的遗传学家坦普列顿(Templeton)在他于90年代发表的一系列论文中指出:运用威尔逊小组的分析方法并不能确切地得出现代人类起源的地点。他们对现代人类起源时间的估算也存在着较大的误差,多项研究结果表明在过去的近100 万年内,居住在欧洲和亚洲的人类之间存在着一定程度的基因交流,因而现代人类完全取代各地区原住居民的结论并不能成立。 针对坦普列顿等人的批评,威尔逊小组的斯托金和文奇兰特在《皇家学会哲学学报》上撰文进行了反驳。斯托金指出,坦普列顿使用了错误的数据库,因而他未能发现各人群基因突变上的明显差异,他们(威尔逊小组)对现代人类起源时间的估计是准确的,这一估计是根据一个年代测定相当准确的事件(人类在4-6万年间拓居到新几内亚)推算得出的。其可信度达95%。威尔逊在此前也针对沃尔泼夫等人的批评提出反驳,他认为,活人的生物学材料远比死人的化石重要,“因为现在的活人必定有其祖先,而死去了的化石则不一定会留下后代”。 尽管坦普列顿的批评动摇了威尔逊小组的结论,但许多分子生物学家仍然相信对线粒体DNA的分析足以支持非洲起源说。同时,其他一些分子生物学家开始着手研究现代人类其他遗传位点上提供的信息,以检验线粒体DNA研究成果的可靠性,并更全面地揭示出人类的进化情况。现代人类起源研究自此又进入了一个新的发展阶段,在这一阶段,古人类学家在研究中独领风骚的局面被打破了,分子生物学家在现代人类起源研究中起到了越来越大的作用。
(3) 亚当理论,现代人类走出非洲理论形成
分子人类学从90年代才真正兴起。人类的Y染色体是一个特别的染色体,其特点是只传子、不传女,而且代代相传。Y染色体可以分成很多区,如果两人某一区的基因字符完全相同,那么他们就一定有相同的父系。1995年,道瑞特、阿卡西和吉尔波特三位科学家在美国权威科学期刊《 科学》上发表了一篇《 人类Y染色体在ZFY区上不存在多态性》的论文(RL Dorit, H Akashi and W Gilbert,1995. “Absence ofpolymorphism at the ZFY locus on the human Y chromosome.” Science268:1183–1185).,他们测定了分处世界各地各地,共38名男性Y染色体的ZFY基因区,结果令他们大吃一惊的是:在他们检测的ZFY基因区中,38人的DNA序列,竟然完全相同。难道这38名没有任何亲戚关系的男人,都是一位风流好色的男人在世界各地所留下的后裔吗?这听起来,实在是如同天方夜谭一样,匪夷所思!这两位科学家的发现,就导致了后来“Y染色体非重组区”"(英文是thenon-recombining region of the human Y chromosome简称NRY)的发现。根据这一结果,他们断言目前的人类,有一位共同的男性祖先,估算大约生活在27万年前。这样,继“线粒体夏娃”这位人类共同的“老奶奶”祖宗被发现之后,“Y染色体亚当”,这位人类共同的“老爷爷”祖宗,也终于被首次从历史的迷雾当中,露出了他的真面目。接下来,在1997年10月31日出版的美国“科学”杂志上(《Science》31 October,1997: Page 804-805),刊登了另一篇题为“Y染色体显示亚当是一位非洲人”(Y Chromosome Shows That Adam Was an African)的论文。“Y染色体亚当” ,这位人类共同的“老老祖父”,被正式命名。而这个他的、也是我们每一个男人的,位于Y染色体短臂Yp11.3点上ZFY基因区内的、729个基因字符,也就成了全球男人所携带的,独一无二的“亚当标记”。
真正揭开人类起源史里程碑的,是斯坦福大学21学者的国际研究队伍,是他们完成了寻找“Y染色体标记“的工作。在全球范围内,他们采集了几万人的DNA样本,创立了分析手段和标准,并且通过严密的分析,确认出从“亚当的标记”起,到现代全球的男人体内,218个非重组区当中,共167个“突变”标记。雄厚的资金,各类专家密切的协作,历经五年,甚至18个月里没有过周末。2000年11月, 这些科学家们最终获得完整的“人类父系谱系图”、人类DNA类型的地理分布图、及人类由非洲走出的时间路线图。这是继美国加州大学伯克利分校的学者们,发现线粒体夏娃并创立了夏娃理论之后,人类起源学的基因研究领域,又一重大突破。
2 人类父系族谱的忠实记录文件--“Y染色体的非重组区”
随着Y染色体亚当的发现,人们更加关注Y染色体。研究发现在Y染色体中,有着95%的区域为非重组区,意思就是说:在这个区段内的字符信息,一般是不随每代的遗传发生变化的,故此,它们得名为“Y染色体非重组区”。这个区域,又可以进一步地被划分成218个 更小的“字符特区”。在这些“特区”当中,在经过几十、上百代的遗传之后,其中的某个,或某几个基因字符,会发生变化,这就是我们通常所说的“突变”。这种“突变”又会随着遗传,一代代传下去,成为某一个族裔所拥有的特殊的标记。越到下面的后代,当然所承受的“突变”也就越多、标记也越细致。只是,一个令 人惊异的是地方是:这些突变所产生的标记,虽然历经几万年、上千代的传承,多少亿次的“拷贝”,却可以保持清晰、准确,分毫不差的特点。因此,我们说“Y染色体的非重组区”,是人类父系族谱的最忠实无误的记录文件。
科学家们在这218个“Y染色体的非重组区”的167区个里面、发现由“突变”所形成的标记。这些因突变而形成的特殊标记,在全世界每个男人体内的218个“Y染色体的非重组区”中,都可以或多或少地被发现到。少则十几,多则几十。而正是这些标记本身,忠实地记录了我们每一个人,由“Y染色体亚当”以降,绵延几千代的遗传历史。
换句话说,我们每一个人的细胞中,都有一本我们肉眼看不见的父系的“族谱”。分子生物学家们将其形象地称之为“生物化石”。这是一个令人无法想象,却奇妙无比的 客观事实。令人惊讶的是上帝早已将我们的身份密码放在我们的身体中了,我们何须到处去发掘化石?我们何须去寻找我们的族谱?它就“写”在我们身体的每一个 细胞中。这并不是“天方夜谭”,我们不都相信了DNA的亲子鉴定吗?如果您的Y染色体经鉴定和您的父亲一样,您会怀疑他不是您的父亲吗?既然可以用DNA鉴定我们的父亲、祖父、曾祖父,儿子、孙子和重孙子,当然可以用DNA寻找我们更古老的祖先。细胞中染色体基因的组合,称基因组,它包含了人类全部的遗传信息。人类基因组,大约由30亿个DNA基因字符信息组成,如果用图书来类比的话,这个信息量大约相当于1000本每本1000页的百科辞典。这差不多是一个图书室的规模了。而Y染色体所记录的“族谱”,仅相当于其中的第一本书,是关于人的“产品说明书”。在这本书的“首页”上,写着“亚当标记”,下面的各页,则是从亚当至今,历代各“标记”祖先的记录。我们每一个人的生命,就好象其中的一页。
斯坦福大学的国际研究队伍,后来公布了在“Y染色体的非重组区”所发现的这167个标记的DNA字符序列,并分别给于它们不同的命名:如M168、M175、M122等。从此,由DNA研究去发现人类历史轨迹的理论,才走出分子生物学家的神秘殿堂,变成了一个普通的科普故事。以我们体内的“亚当的标记”以及这167个标记为主导,就可以勾绘出一部人类的父系族谱,和相应的迁徙史。在西方考古学家,和生物学家当中所流传的“中国人起源西来说”,现在看来并非无中生有的臆造。相反,这个理论的构架,是有着坚实的分子生物学实证基础的。
3 人类父系谱系--Y染色体演化树
在人类遗传学中,人类的Y染色体 DNA 单倍型类群是由 Y 染色体非重组的 DNA 部分区别定义的单倍型类群。它代表了基于 Y 染色体上的单核苷酸多态性 (SNPs)的人类遗传多样性。Y-DNA单倍群代表了Y染色体系统演化发生树的主要分支。Y 染色体”亚当“(Y-chromosomal Adam)是由研究人员给予所有生活人类父系的最近共同祖先在这棵树上根的名称。Y-DNA单倍群是由一系列Y-DNA SNP标记来定义的。
最初Y-染色体谱系树分支用英文字母和数字一次性定义的,大的分支使用了从A到R的字母做标记,每个字母下再使用数字和字母交替来标记其下的分支,例如Y-R1a1单倍群,每一个Y单倍群都由一个或多个特征Y-SNP标记。最开始西方人把最后的一个字母R分配给他们自己,并以此为中心,或作为“进化”顶点,来构建Y染色体谱系树。如下图是2008年以前,Y染色体谱系树(摘自国际基因库网站)。
但随着研究的深入,新的单倍群和分支不断被发现或细分,在R之后又增加S和T两个字母标记的单倍群。由于每个单倍群下的新的分支发现,研究者也发现了几乎所有Y单倍群早期演变都可以归纳成二叉树形式的分支演化。同时对亚当A根部的探索也越来越深入。这样用字母和数字顺序交替来标记Y单倍群分支形式就常常需要做出调整。现在研究者有时更愿意直接使用Y-SNP标记来代表Y单倍群。
下图是维基百科上给出最新Y系统演化谱系树:
(Human Y-chromosome DNA haplogroup - Wikipedia, the free encyclopedia https://en.wikipedia.org/wiki/Human_Y-chromosome_DNA_haplogroup)
这种西方人定义的Y系统演化谱系树,又被称为“Y进化树”,实际上这不是全面真实反映实际Y系统的演化树,而是西方人以自己为中心而人为构造出来的假Y进化树。这种Y树并没有给出靠近根本的其他Y单倍群下的分支,这种“Y进化树”纯粹是由于字母人为分配而造成的假象。
(没有给出靠前Y单倍群下分支的所谓“Y进化树”)
然而这种并不能全面反映Y真实演化,天然带有种族主义意识的东西,被许多中国学者接受为“真实的进化树”,并进而传播给中国网民。后来复旦学者李辉在网上发表种族主义民科性质的“两个人种论”,把这种“Y种族优越和歧视”的意识给以尽情渲染,把Y-CD系归为“低级进化的老亚洲”,进而误导了几乎所有一开始对分子人类学不了解的人们。
过去几年,一些种族论思维者喜欢宣传所谓”NOQR处于进化树的顶点“而沾沾自喜。对于人类而言,今天人口的多少并不能成为“人种优劣”的标准。多少淹没于历史长河中的文明族群消失不见,能说他们劣等吗?假如当年把F下的GHIJKLTNOMSQR等字母逐个分配给C或D系的各个分支,而F下的各分支则全部用F1a1xxxx此类形式命名,大家将会看到另一种以C或D下支系为顶点的“Y进化树”!
4 Y染色体谱系树二叉演化现象
世界人类各个Y染色体分支的SNP突变并没有呈现所谓的“进化链”,而是表现出类似混沌理论中的倍周期分岔的现象。在混沌学者,被研究得最彻底,且有一套严格理论结果的是生态学中的逻辑斯谛模型。在生态学中,种群的数量取决于食物来源、竞争者、捕食者诸多因素。1845年,人们使用一个逻辑斯谛非线性方程来描述生存竞争。根据方程,人们可以依据上一年的昆虫数目和增殖系数预测下一年的昆虫数目。
(逻辑斯谛方程)
1976年数学生态学家R. May在英国的《自然》杂志上发表的一篇后来影响甚广的综述中所提出增殖系数u属于[0,4],x属于(0,1)的最早的一个由倍周期分岔通向混沌的一个例子。后来经过费根鲍姆(Feigenbaum)研究得出:一个系统一旦发生倍周期分岔,必然导致混沌。他还发现并确定了该系统由倍周期分岔通向混沌的两个普适常数(也称为Feigenbaum常数)。
(一个逻辑斯谛倍周期分岔混沌例子)
最近几年Y系统发育树修订过程中,一个引人瞩目的现象是二叉归类现象不断出现,即早期Y分支几乎都可以归成以二叉分支的形式。关于Y突变二叉形成的内在机理,目前还没有过硬的理论支持。也可以解释说:Y-SNP突变很难发生,某个Y支系发生SNP突变是在长时间范围内一个偶然现象,这样就形成了一个新的分岔。在原来Y*祖先型后裔中,经过一段时间又另外产生一个新的SNP突变,这样形成二叉。或者也可以解释说,一个Y在不长的时间内有很多SNP突变发生,但最后只有两种突变支系能够幸存下来,其他众多的突变均未留下后裔。
下图是在“基因组研究”(《Genome Research 》)杂志上发表的一篇论文图片,显示当今人类全部Y分支的人口几乎全部是在1万年左右以内才开始爆发的。这也是对李辉两个人种论的否定。
Published in AdvanceMarch 13, 2015, doi:
10.1101/gr.186684.114
Genome Res. 2015.
© 2015 Karmin et al.; Published by Cold Spring Harbor Laboratory Press
复旦大学王传超等在《中国科学》上有一篇论文:“新石器时代农业驱动男性人口扩张” (http://engine.scichina.com/downloadPdf/i2dp4KBGfaafQWRbC )。论文说农业的出现被认为驱动了大范围的群体人口增长,农业出现使得男性人口增长了10~100 倍。论文分析了来自千人基因组计划的全球分布的526 个男性样本的Y 染色体和线粒体基因组集合,发现大多数主要的父系扩张均可追溯至新石器时代。下图是王等论文根据千人基因组的526个Y样本测序结果构建的人类Y染色体系统发育树。从这个图上就很难看出了什么“Y进化链”,却可以看出是二叉分形混沌图。
Y突变倍周期分岔现象也许也遵循自然生态界的普适规律,受到食物来源、竞争者、捕食者的影响。Y突变为何产生,以及如何生存,其规律还远远没有得到揭示。