Y染色体单倍群知识科普
本文主要来源于wiki
翻译自英文
简介
在人类遗传学中,人类Y染色体DNA单倍群是由男性Y染色体的DNA的非重组部分中的发生突变的单倍群。许多人在一个单倍群中有着相似短串联重复序列(STRs)数量还存在着称为单核苷酸多态性(SNPs)的核苷酸突变。
人类Y染色体每世代大约会有两个突变。Y-DNA单倍群是Y染色体进化系统树的主要分支,每个单倍群共有数百甚至数千个独特的突变。
在Y染色体最近缘的共同祖先(Y-MRCA,俗称Y染色体亚当)是最早的共同祖先(MRCA),他是目前所有现代人类的父系起源。
据估计,Y染色体亚当大约生活在236,000年前的非洲。通过研究遗传瓶颈,大多数欧亚男人(来自非洲以外地区的男人)都是一个来自69,000年前的男人的后裔。其他主要遗传瓶颈发生在大约50,000和5,000年前,后来大多数(欧亚/非洲以外)男人的祖先可以追溯到50,000年前的四位祖先。
Y-DNA单倍群发展树状图
人类Y-DNA发展图和单倍群地区分布
名词解释
单倍群:单倍型类群是一组类似的单倍型
单倍型:是单倍体基因型的简称,在遗传学上是指在同一染色体上进行共同遗传的多个基因座上等位基因的组合
等位基因:是指位于一对同源染色体相同位置上控制同一性状不同形态的基因
Aa中 A和a就是一对等位基因
基因座:基因在染色体上所占的位置
DNA重组:遗传物质的交换,复制等重新组合
短串联重复序列(STR):串联重复序列是指以相对恒定的短序列为重复单位,首尾相接, 串联连接形成的重复序列。在人类基因组中,串联重复序列约占10%,主要分布在非编码区,少数位于编码区。
非编码区:是不能够转录为相应信使RNA,不能指导蛋白质合成(也就是不能编码蛋白质)的区段。
单核苷酸多态性(SNP):主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。SNP在人类基因组中广泛存在,平均每300个碱基对中就有1个,估计其总数可达300万个甚至更多。SNP是一种二态的标记,由单个碱基的转换或颠换所引起,也可由碱基的插入或缺失所致。SNP既可能在基因序列内,也可能在基因以外的非编码序列上。
遗传瓶颈:一个大的多样性群体在某种条件的限制下,只有少部分个体可以通过某一个时空到达新的繁殖地,并由这些个体进一步繁殖成一个多态性的小群体。由于这少部分的个体只代表了原有群体的遗传多样性的一小部分,故称为遗传瓶颈。
Y-DNA单倍群的命名简介
原来的命名太过于混乱,提出一种按照SNP突变来命名的方案
例子:原命名 → 新命名 ( J1c3d → J-L147 )
新命名按照突变来命名
J-L147 即为Y单倍群J的L147变异
单倍群A和B / Haplogroups A and B
单倍群A是非重组Y(non-recombining Y/NRY)组成的单倍群,是所有现代单倍群的父系。零星分布在非洲,主要集中在西南部的科伊桑人和尼罗河到东北的尼罗河谷地的人口。
BT是单倍群A的一个分支
Haplogroup A
Haplogroup A00
Haplogroup A0 (formerly also A1b)
Haplogroup A1(A-P305)(also A1a-T)
Haplogroup A1b1a1 (also A2; M14)
Haplogroup A1b1b (also A3; M32)
Haplogroup BT(M91, M42, M94, M139, M299)
Haplogroup B (M60)
Haplogroup CT
Haplogroup A1a (M31)
Haplogroup A1b (also A2-T; P108, V221)
单倍群CT(P143) / Haplogroup CT (P143)
决定性的CT突变(所有单倍群除了A和B)都是由M168和M294突变(M168和M294是走出非洲的标志)。原位置可能在非洲,据估计,大约存在了88,000年,最近的大约存在100,000和101,000。
单倍群C(M130) / Haplogroup C (M130)
Haplogroup C (M130, M216) Found in Asia, Oceania, and North America
Haplogroup C1(F3393/Z1426)
Haplogroup C1b1 (AM00694/K281)
Haplogroup C1b2 (C-Z16582)
Haplogroup C1b3(B477/Z31885)
Haplogroup C1b1a1 (M356) Found with low frequency in South Asia, Southwest Asia, and northern China
【少量分布在南亚、西南亚、中国北部】
Haplogroup C1b1a2 (B65)
Haplogroup C1b1a3 (Z16582) Found with low frequency in Saudi Arabia and Iraq【少量分布在沙特阿拉伯和伊拉克】
Haplogroup C1b1a2a (B67) Found among Lebbo’ people in Borneo, Indonesia
【分布在来自婆罗洲的Lebbo人、印度尼西亚】
Haplogroup C1b1a2b (F725) Found among Han Chinese (Guangdong, Hunan, and Shaanxi), Dai people (Yunnan), Murut people (Brunei), Malay people (Singapore), and Aeta people (Philippines)
【分布在中国汉族(广东、湖南、陕西)、傣族(云南)、穆鲁特人(文莱)、马来人(新加坡)、阿埃塔人(菲律宾)】
Haplogroup C1b1a (B66/Z16458)
Haplogroup C1b1b (B68) Found among Dusun people (Brunei)
【分布在杜顺族(文莱)】
Haplogroup C1b3a (M38) Found in Indonesia, New Guinea, Melanesia, Micronesia, and Polynesia
【分布在印度尼西亚,新几内亚、美拉尼西亚、密克罗尼西亚、波利尼西亚】
Haplogroup C1b3b (M347, P309) Found among the indigenous peoples in Australia【分布在澳大利亚的土著人】
Haplogroup C1a1 (M8, M105, M131) Found with low frequency in Japan
【少量分布在日本】
Haplogroup C1a2 (V20) Found with low frequency in Europe, Armenians, Algeria, and Nepal
【少量分布在欧洲,亚美尼亚,阿尔及利亚,尼泊尔】
Haplogroup C1a (CTS11043)
Haplogroup C1b (F1370, Z16480)
Haplogroup C2 (M217, P44) Found throughout Eurasia and North America, but especially among Mongols, Kazakhs, Tungusic peoples, Paleosiberians, and Na-Dené-speaking peoples
【分布从欧亚到北美,尤其分布在蒙古族、哈萨克族、通古斯人、古西伯利亚人、纳-德内语系的人】
单倍群D(CTS3946) / Haplogroup D (CTS3946)
Haplogroup D (CTS3946)
Haplogroup D1(M174)
Found in Japan, China (especially Tibet), the Andaman Islands
【分布在日本、中国(尤其在藏族)、安达曼群岛】
Haplogroup D1a1(Z27276, Z27283, Z29263)
Haplogroup D1a2 (M55, M57, M64.1, M179, P12, P37.1, P41.1 (M359.1), 12f2.2) Found mainly in Japan【主要分布在日本】
Haplogroup D1a3 (Y34637) Found in Andamanese peoples (Onge, Jarawa)
【分布在安达曼人(翁格族、雅拉哇族)】
Haplogroup D1a1a (M15) Found mainly in Tibetans, Qiangic peoples, Yi, and Hmong-Mien peoples
【主要分布在藏族、羌族、彝族、苗瑶族】
Haplogroup D1a1b (P99) Found mainly in Tibetans, Qiangic peoples, Naxi, and Turkic peoples
【主要分布在藏族、羌族、纳西族、突厥人】
Haplogroup D1a (CTS11577)
Haplogroup D1b (L1366, L1378, M226.2) Found in Mactan Island, Philippines
【分布在麦克坦岛、菲律宾】
Haplogroup D2 (A5580.2) Found in Nigeria, Saudi Arabia and Syria
【尼日利亚、沙特阿拉伯、叙利亚】
单倍群E(M96) / Haplogroup E (M96)
Main article: Haplogroup E (Y-DNA)
Haplogroup E(M40, M96)
Found in Africa and parts of the Middle East and Europe
【分布在非洲,部分分布在中东和欧洲】
Haplogroup E1a (M33, M132) formerly E1
Haplogroup E1b(P177)
Haplogroup E1b1a(V38)
Haplogroup E1b1b(M215)
Haplogroup E1b1a1 (M2) Found in Africa, especially among Niger–Congo-speaking populations.; formerly E3a
【分布在非洲,尤其在尼日尔-刚果语系的人】
Haplogroup E1b1a2 (M329) Found in Africa, especially in Ethiopia among Omotic-speaking populations.; formerly E3*
【分布在非洲,尤其在埃塞尔比亚的欧冒提克语系的人】
Haplogroup E1b1b1 (M35) Found in Horn of Africa, North Africa, the Middle East, and Europe (especially in areas near the Mediterranean and the Balkans); formerly E3b
【分布在非洲之角,北非,中东,欧洲(尤其在地中海沿岸和巴尔干)】
Haplogroup E1b1(P2, DYS391p);
formerly E3
Haplogroup E1(P147)
Haplogroup E2 (M75)
单倍群F(M89) / Haplogroup F (M89)
这一群单倍群F(F和F的分支GHIJKLMNOPQ)的后裔占据了世界上90%的人口,这些人几乎都是撒哈拉非洲以外的人。
F xG,H,I,J,K在现代人群中很少见,主要在南亚,尤其分布在斯里兰卡。这些单倍群似乎早就存在于东南亚。据报道,在苏拉威西岛和拉姆巴塔的男性中占有4%-5%。
一项研究(并无全面涵盖F-M89的子分支,但包含GHIJK),表明有SNP突变P14/PF2704(等同M89)的印度尼西亚人在西帝汶有1.8%,在弗洛勒斯岛有1.5%,在拉姆巴塔有5.4%,在苏拉威西有2.3%,在苏门答腊有0.2%。
据报道,F* (F xF1,F2,F3)在斯里兰卡和南印度的男性中有10%。巴基斯坦5%。塔曼人(尼泊尔)和伊朗的男性中F *(F xF1,F2,F3)的水平较低。F1(P91),F2(M427)和F3(M481;以前为F5)都是非常稀有的,并且几乎是斯里兰卡,印度,尼泊尔,中国南方,泰国,缅甸和越南的地区/少数民族所独有的。
在这种情况下,错误识别的可能性很大,其中一些可能识别为单倍群GHIJK(F的子分支)。
单倍群G(M201) / Haplogroup G (M201)
起源于大约48,000年前,它的最新共同祖先可能居住在26,000年前的中东地区。 随着新石器时代的发展,G传到了欧洲。
在欧亚大陆的许多种族中都可以找到G。 最常见于高加索,伊朗,安纳托利亚和黎凡特。 在几乎所有欧洲国家中都发现,但最常见于加告兹自治区,罗马尼亚东南部,希腊,意大利,西班牙,葡萄牙,蒂罗尔和波西米亚,高度集中在某些地中海岛屿上; 在北欧很少见。
G-M201在中国西北,印度,孟加拉国,巴基斯坦,斯里兰卡,马来西亚和北非也有少量发现。
Haplogroup G1
Haplogroup G2
Haplogroup G2a1
Haplogroup G2a2
Haplogroup G2a3
Haplogroup G2b
Haplogroup G2c
(formerly Haplogroup G5)
Haplogroup G2a3b1
Haplogroup G2a3a
Haplogroup G2a3b
Haplogroup G2c1
单倍群H(M69) / Haplogroup H (M69)
H-M89可能产生在中亚或南亚,距今已有约48,000年,并且在那里以H1(M69)和H3(Z5857)的形式广泛流行。 在伊朗,中亚,中东和阿拉伯半岛,也发现了其下级分支。
但是,从新石器时代就已经存在H2(P96)在欧洲,而且H1a1(M82)在中世纪时期随着罗姆人(吉普赛人)的迁徙而向西传播,因此在欧洲一直存在。
单倍群I(M170) / Haplogroup I (M170)
Haplogroup I (M170, M258) is found mainly in Europe and the Caucasus.
【单倍群I(M170,M258)主要在欧洲和高加索地区分布】
Haplogroup I1 Nordid/Nordic Europids (M253) Found mainly in northern Europe
【主要分布在北欧】
Haplogroup I2 Dinarid/Dinaric Europids (P215) Found mainly in Balkans, southeast Europe and Sardinia save for I2B1 (m223) which is found at a moderate frequency in Western, Central, and Northern Europe.
【主要分布在巴尔干,东南欧和撒丁岛,I2B1(m223)在西欧,中欧和北欧的分布频率中等】
单倍群J(M304) / Haplogroup J (M304)
Haplogroup J (M304, S6, S34, S35) is found mainly in the Middle East and South-East Europe.
【单倍群J主要分布在中东和东南欧】
Haplogroup J* (J-M304) is rare outside the island of Socotra.
【J-M304\在索科特拉岛以外很少见】
Haplogroup J1 Semitid/Bedouinid Arabids (M267) is associated with Northeast Caucasian peoples in Dagestan and Semitic languages speaking people in the Middle East, Ethiopia, and North Africa and also found in Mediterranean Europe in smaller frequencies much like haplogroup T.
【J-M267分布在达吉斯坦的东北部高加索人和中东的闪族语系人、埃塞俄比亚和北非,也有分布在地中海沿岸但比较接近单倍群T】
Haplogroup J2 Syrid/Nahrainid Arabids (M172) is found mainly in the Semitic-speaking peoples, Anatolia, Greece, the Balkans, Italy, Iran, the Caucasus, South Asia, and Central Asia.
【J-M172主要分布在闪族语系人,安纳托利亚、希腊、巴尔干、意大利、伊朗、高加索人、南亚和中亚】
单倍群K(M9) / Haplogroup K (M9)
Haplogroup K (M9) is spread all over Eurasia, Oceania and among Native Americans.
【K-M9 广泛分布在欧亚、大洋洲、北美土著】
K(xLT,K2a,K2b) – that is, K*, K2c, K2d or K2e – is found mainly in Melanesia, Aboriginal Australians, India, Polynesia and Island South East Asia.
【K(xLT,K2a,K2b)主要分布在美拉尼西亚,澳大利亚土著,印度,波利尼西亚和东南亚岛屿。】
单倍群L和T(K1) / Haplogroups L and T (K1)
Haplogroup L (M20) is found in South Asia, Central Asia, South-West Asia, and the Mediterranean.
【L-M20 分布在南亚,中亚,西南亚和地中海】
Haplogroup T (M184, M70, M193, M272) is found at high levels in the Horn of Africa (mainly Cushitic-speaking peoples), parts of South Asia, the Middle East, and the Mediterranean. T-M184 is also found in significant minorities of Sciaccensi, Stilfser, Egyptians, Omanis, Sephardi Jews, Ibizans (Eivissencs), and Toubou. It is also found at low frequencies in other parts of the Mediterranean and South Asia.
【T-M184,M70, M193, M272 高频分布在非洲之角(主要是库希特语系人),部分南亚地区,中东,地中海。T-M184还分布在Sciaccensi(阿格里真托的一个海港城市),Stilfs(南蒂罗尔,意大利北部的城)、埃及人、阿曼人、塞法迪犹太人,伊比萨人、图布人。在其他地方的地中海和南亚有低频分布】
单倍群N / Haplogroup N
Haplogroup N (M231) is found through northern Eurasia, especially among speakers of the Uralic languages.【N-M231分布于欧亚北部,尤其在乌拉尔语系的人之间】
Haplogroup N possibly originated in eastern Asia and spread both northward and westward into Siberia, being the most common group found in some Uralic-speaking peoples.
【单倍群N可能起源于亚洲东部向北和西传入西伯利亚】
单倍群 O / Haplogroup O
Haplogroup O (M175) is found with its highest frequency in East Asia and Southeast Asia, with lower frequencies in the South Pacific, Central Asia, South Asia, and islands in the Indian Ocean (e.g. Madagascar, the Comoros).
【O-M175高频分布在东亚和东南亚,低频分布在南太平洋、中亚、南亚、印度洋岛屿(例如,马达加斯加、科摩罗)】
Haplogroup O1 (F265/M1354, CTS2866, F75/M1297, F429/M1415, F465/M1422)
Haplogroup O1b1 (M95) Found in Japan, southern China, Taiwan, Southeast Asia, and the Indian subcontinent, especially among Austroasiatic- and Tai–Kadai-speaking peoples, Malays, and Indonesians
【O1b1(M95)分布在日本、中国南部、台湾、东南亚、印度次大陆(南亚次大陆),尤其在南亚语系人,壮侗语系人、马来西亚人、印度尼西亚人】
Haplogroup O1b2 (SRY465, M176) Found in Japan, Korea, Manchuria, and Southeast Asia【O1b2(SRY465, M176)分布在日本,韩国、满洲、东南亚】
Haplogroup O1a (M119, CTS31, F589/Page20, L246, L466) Found in eastern,central and southern Mainland China, Taiwan, and Southeast Asia, especially among Austronesian and Tai–Kadai peoples
【单倍群O1a(M119, CTS31, F589/Page20, L246, L466)分布在中国大陆东部、中部、南部,台湾、东南亚,尤其在南岛人和壮侗语系人】
Haplogroup O1b(P31, M268)
Haplogroup O2 (M122) Found throughout East Asia, Southeast Asia, and Austronesia including Polynesia
【O2分布在东亚、东南亚、南岛(包括波利尼西亚)】
单倍群K2b1、M和S / Haplogroups K2b1, M & S
No examples of the basal paragroup K2b1* have been identified. Males carrying subclades of K2b1 are found primarily among Papuan peoples, Micronesian peoples, indigenous Australians, and Polynesians.【没有发现K2b1主支的人,K2b1子分支主要分布在巴布亚人、密克罗尼西亚人、澳大利亚土著、波利尼西亚人】
Its primary subclades are two major haplogroups:【两个主要的子分支单倍群】
Haplogroup S (B254) also known as K2b1a: found in the highlands of Papua New Guinea ;【S-B254,又称K2b1a,分布在巴布亚新几内亚的高地】
Haplogroup M (P256) also known as K2b1b: found in New Guinea and Melanesia.【M-P256,又称K2b1b,主要分布在新几内亚和美拉尼西亚】
单倍群P(K2b2) / Haplogroup P (K2b2)
Haplogroup P (P295) has two primary branches: P1 (P-M45) and the extremely rare P2 (P-B253).[参考]【单倍群P(P295)主要有两个分支,P1(P-M45)和极为罕见的P2(P-B253)】
P, P1 and P2 are found together only on the island of Luzon, in The Philippines. In particular, P* and P1* are found at significant rates among members of the Aeta (or Agta) people of Luzon. While, P1* is now more common among living individuals in Eastern Siberia and Central Asia, it is also found at low levels in mainland South East Asia and South Asia. Considered together, these distributions tend to suggest that P* emerged from K2b in South East Asia.【P、P1、P2仅在菲律宾的吕宋一起被发现。P* and P1显著分布在吕宋的阿埃塔人中,但现在P1\更普遍存在于东西伯利亚和中亚,还有少量分布在东南亚的大陆和南亚。从这些分布关系中,可以推出P*在东南亚从K2b中产生】
P1 is also the parent node of two primary clades:【P1也是两个重要进化树中的父节点】
Haplogroup Q (Q-M242) ;
Haplogroup R (R-M207). These share the common marker M45 in addition to at least 18 other SNPs.【R-M207有着跟的M45突变一样的特征,至少有18处SNP突变相同】
Haplogroup Q (MEH2, M242, P36) found in Siberia and the Americas Haplogroup R (M207, M306): found in Europe, West Asia, Central Asia, and South Asia【单倍群Q(MEH2, M242, P36),主要分布在西伯利亚和美洲,单倍群R(M207, M306)主要分布在欧洲,西亚,中亚和南亚】
单倍群Q-M242 / Haplogroup Q M242
Q is defined by the SNP M242. It is believed to have arisen in Central Asia approximately 32,000 years ago. The subclades of Haplogroup Q with their defining mutation(s), according to the 2008 ISOGG tree are provided below. ss4 bp, rs41352448, is not represented in the ISOGG 2008 tree because it is a value for an STR. This low frequency value has been found as a novel Q lineage (Q5) in Indian populations.【Q是SNP突变M242, 大约在32,000年前起源于中亚。单倍群Q子分支和它的突变如下,ss4 bp和 rs41352448没有录入ISOGG 2008 tree是因为它的值合乎短串联重复序列。这一低频值被定义为新的单倍群Q分支Q5】
The 2008 ISOGG tree
Q (M242)
Q*
Q1 (P36.2)
Q1a*
Q1a1 (M120, M265/N14) Found with low frequency among Bhutanese, Dungans, Han Chinese, Japanese, Koreans, Mongolians, Naxi, and Tibetans【Q1a1 (M120, M265/N14)低频分布在不丹人,东干人、中国汉族、日本人、韩国人、蒙古人、纳西族人、藏族人】
Q1a2 (M25, M143) Found at low to moderate frequency among some populations of Southwest Asia, Central Asia, and Siberia【Q1a2 (M25, M143)中低频分布在西南亚、中亚和西伯利亚的部分人中】
Q1a3 (M346)
Q1a4 (P48)
Q1a5 (P89)
Q1a6 (M323) Found in a significant minority of Yemeni Jews【Q1a6 (M323)少量分布在也门犹太人】
Q1a3a*
Q1a3a1 (M19) Found among some indigenous peoples of South America, such as the Ticuna and the Wayuu【Q1a3a1 (M19) 在南美土著中部分分布,例如,图库纳人、瓦尤人】
Q1a3a2 (M194)
Q1a3a3 (M199, P106, P292)
Q1a3* Found at low frequency in Pakistan, India, and Tibet【Q1a3* 低频分布在巴基斯坦、印度和西藏】
Q1a3a(M3)Typical of indigenous peoples of the Americas【Q1a3a(M3)是美洲土著的主体】
Q1*
Q1a (MEH2)
Q1b (M378) Found at low frequency among samples of Hazara and Sindhis【Q1b (M378)低频分布在哈扎拉人、信德人】
单倍群R(M207) / Haplogroup R (M207)
Haplogroup R is defined by the SNP M207. The bulk of Haplogroup R is represented in descendant subclade R1 (M173), which likely originated on the Eurasian Steppes. R1 has two descendant subclades: R1a and R1b.【单倍群R是SNP的M207突变,R的后裔子分支R1(M173),可能起源于欧亚草原。R1有两个后裔子分支R1a和R1b】
R1a is associated with the proto-Indo-Iranian and Balto-Slavic peoples, and is now found primarily in Central Asia, South Asia, and Eastern Europe.【R1a跟印度-伊朗语族人和波罗的-斯拉夫语族人有很大关联,R1a现在主要分布在中亚、南亚、欧洲东部】
Haplogroup R1b is the dominant haplogroup of Western Europe and also found sparsely distributed among various peoples of Asia and Africa. Its subclade R1b1a2 (M269) is the haplogroup that is most commonly found among modern Western European populations, and has been associated with the Italo-Celtic and Germanic peoples.【单倍群R1b是西欧的主体单倍群,在亚洲和非洲的各个民族中分布稀疏,R1b的子分支R1b1a2 (M269)广泛分布在现代欧洲西部人口中,与意大利-凯尔特语族人和日耳曼人有关联】
Haplogroup R1(M173) Found throughout western Eurasia【单倍群R1(M173)横贯欧亚西部】
Haplogroup R1a (M420) Found in Central Asia, South Asia, and Central, Northern and Eastern Europe, Balkans【单倍群R1a(M420)分布在中亚、南亚、欧洲中部北部东部,巴尔干】
Haplogroup R1b (M343) Found in Western Europe, West Asia, Central Asia, North Africa, and northern Cameroon【R1b分布在西欧,西亚、亚洲中部、北非、喀麦隆北部】
Haplogroup R2 (M124) Found in South Asia, Caucasus, Central Asia, and Eastern Europe【单倍群R2(M124)分布在南亚,高加索、欧洲东部】