群体遗传|同源片段追溯-IBD分析(一)

此部分着重简单介绍IBD的理论知识和应用范围,后期会介绍部分软件实操。

IBD介绍

要介绍IBD就要先从IBS说起。IBS-identity by state译为序列一致片段,是指在两个及以上个体间存在完全相同的DNA片段即为IBS片段;IBD-identity by descent译为同源相同片段,是在两个及以上个体存在来源于同一祖先的、未发生重组的、完全相同的DNA片段,这样的片段即为IBD片段。所以从定义来看,我们可以说一个IBD片段一定也是IBS片段,但一个IBS片段可以不是IBD片段。下面这张图形象地描绘了何为IBD

由图我们可以看出,C1和C2两个个体的基因组中橙色部分的DNA片段皆来自于A,所以该片段为IBD片段;但如果假设我们不考虑C1、C2的亲本和祖先,仅仅是在比较两个个体间的在遗传物质方面的异同,这时我们可以说橙色的部分为IBS。

IBD应用

由于IBD片段的能够反映个体间的遗传关系,所以IBD有非常广泛的应用。主要有以下几个方面:

  1. 检测性状变异;两两间的IBD片段和表型之间的相关性可用于检测基因组中是否含有影响性状变异的区域;
  2. 测定遗传力;我们可以先把遗传力狭义地理解为祖先个体中的某个或某几个决定关键性状的DNA片段是否能完全的遗传给子代。基于此,我们通过测定某一系谱内个体间的IBD片段的长度和数量就能够衡量出祖先个体这些片段的遗传力大小。
  3. 估计亲属系数;两个个体间IBD片段长度越大,数量越多,就说明这两个个体的亲缘关系越近;如果两个个体间间隔了很多代,它们之间的IBD片段长度普遍偏短,并且随着传代数的增加个别片段也会丢失导致数量减少。
  4. 鉴定精细的群体结构;基于个体间的亲缘关系。
  5. 推断驯化历史;有效群体越小,个体间的亲缘关系会更近,会有更多的IBD片段。较短的IBD片段反映了个体与共同祖先的亲缘关系比较远,传代数更长,时间更长,能够推测的有效群体偏小;而更长的IBD片段则能较为准确地反映最近的有效群体大小。
  6. 估计群体遗传参数;比如突变率、重组率、迁移率和选择压。突变是通过观察到的IBD片段单倍型的discordance;重组率则是endpoints;选择压是由群体内某一区域IBD频率决定的,频率越高,选择压越大。

IBD探测方法及软件

基于概率模型的方法:容错率高,不适用于非系谱群体;

基于IBS方法:准确度高,但对于突变位点过于敏感;

基于IBS+概率模型:调和上述两种探测方法间的矛盾;

IBD应用实例

  • 挖掘控制农艺性状的候选基因
    • Han Z, Hu Y, Tian Q, et al. Genomic signatures and candidate genes of lint yield and fibre quality improvement in Upland cotton in Xinjiang[J]. Plant Biotechnology Journal, 2020.
  • 选择压
    • Albrechtsen, Anders et al. “Natural selection and the distribution of identity-by-descent in the human genome.” Genetics vol. 186,1 (2010): 295-308. doi:10.1534/genetics.110.113977
  • 驯化历史
    • Liang Z, Duan S, Sheng J, et al. Whole-genome resequencing of 472 Vitis accessions for grapevine diversity and demographic history analyses[J]. Nature communications, 2019, 10(1): 1-12.

参考资料

  1. Identity by descent https://en.wikipedia.org/wiki/Identity_by_descent#cite_note-Albrechtsen.2010-21
  2. Identical by descent https://isogg.org/wiki/Identical_by_descent
  3. Zhou Y, Browning S R, Browning B L. A fast and simple method for detecting identity by descent segments in large-scale data[J]. The American Journal of Human Genetics, 2020.
(0)

相关推荐

  • 获得性遗传

    用进废退这个观点最早是由法国生物学家拉马克提出的,他提出了两个法则:一个是用进废退:一个是获得性遗传. 而达尔文反对拉马克的理论.以长颈鹿为例,从达尔文的角度看,长颈鹿因为基因的隐性和显性的问题,有的 ...

  • 近50万人大规模研究发现,胃溃疡与抑郁症密切相关

    胃肠疾病(GI)非常普遍,不仅占用大量的医疗资源,加大患者社会经济负担,还会影响患者的生活质量. 近日,来自澳大利亚昆士兰大学分子生物科学研究所的 Naomi Wray 教授和 Wu Yeda 博士团 ...

  • Science | 群体遗传调控变异对罕见疾病转录组分析的影响(IF=41.037)

    编译:tRNA,编辑:十九.江舜尧. 原创微文,欢迎转发转载. 美国哥伦比亚大学系统生物学系的Pejman Mohammadi和Tuuli Lappalainen等人于2019年10月18日在Scie ...

  • 正传:30.群体遗传

    李森科事件到底是怎么发生的,真是我们常常在网络上看到的那种说法,有个跳梁小丑,利用公权力狐假虎威作威作福30年.不但反映了有邪恶的小人作祟,也反映了苏联的体制问题.这事儿真的就这么脸谱化吗?未必!历史 ...

  • 《中国姓氏:群体遗传和人口分布》

    分布密度,是指单位面积上有多少某姓人口数量 分布频率,是指单位人群里面,有多少比例的人姓某姓. 前者通常能表明我们对全国范围内,哪些地方某某姓氏比较多的印象,后者则表明我们身处本地时候,身边哪些姓比较 ...

  • 二次元群体在舆论场特点分析

    小贴士:二次元是什么? 一般认为,二次元是指由动画(Animation).漫画(Comic).游戏(Game).轻小说(Light Novel)即ACGN所构成的二维平面世界,然而这样的说法已然不能涵 ...

  • 重磅:72家机构联手,最大规模人遗传与肠菌分析发布

    Nature子刊:1.8万人数据揭示遗传因素如何影响人肠道菌群 Nature Genetics--[27.603] ① 纳入24个队列共18340人的全基因组基因型和16S粪便菌群数据,分析影响肠道菌 ...

  • 群体遗传进化专题之进化树

    导读 岁岁年年花相似,细细推敲,实则年年岁岁花不同.人类进化历程中,万事万物都在悄然的变化着,这积沙成塔的量到质的跳跃,正是无数科研人员孜孜以求的方向--群体进化. 群体进化研究是指通过获得某物种自然 ...

  • 科研 | Nature Genetics:高精度渐渗系群体分析揭示番茄果实风味和抗病性的遗传基础

    编译:李飞,编辑:Tracy.江舜尧. 原创微文,欢迎转发转载. 导读 番茄的驯化和育种过程极大地改变了果实成熟及其伴随的无数代谢过程.导致现代番茄品种丧失了一些重要的果实品质,例如抗旱和抗病能力等. ...

  • PBJ | 基于149份材料靶向测序数据结合全基因组关联分析揭示小麦光能利用相关遗传位点

    普通小麦是一个由三个密切相关的亚基因(AABBDD)组成的异源六倍体.它被认为起源于两次多倍化事件:第一次是野生四倍体小麦(AA)与未发现的节节麦谱系(BB)杂交形成的四倍体,距今约50万年;第二次是 ...

  • 二轮复习 | 遗传实验分析和设计专项,考生必看!

    遗传题,作为高考四道必做题中的一道,考点趋于平稳,基本上围绕基因的分离定律和自由组合定律.伴性遗传综合进行考查,少概率出现变异和遗传定律结合.设问内容较少,留空较长,对逻辑推理能力要求高,对语言表达能 ...