Cell:第一个“垃圾DNA”对哺乳动物生存至关重要的例子
尽管普遍认为我们基因组的98%是垃圾DNA,但新的研究表明,一段垃圾DNA——一种基于病毒的转座子的启动子——在小鼠的细胞增殖和胚胎植入时间中起着关键作用。该研究小组发现,基于病毒的启动子与包括人类在内的其他哺乳动物的发育相关基因相关联,这表明转座子已被广泛地重新用于重要的调节作用。
Lin He
过去十年的研究表明,一些基因“暗物质”确实有功能,主要是调节宿主基因的表达——宿主基因仅占我们基因组的2%——编码蛋白质。然而,生物学家仍在争论,这些DNA的调节序列是在人体中起着重要的还是有害的作用,还是仅仅是偶然的,一个有机体不需要就能生存的意外。
加州大学伯克利分校(University of California, Berkeley)和华盛顿大学(Washington University)的研究人员开展了一项新研究,探索了这种垃圾DNA的一个组成部分——转座子的功能。转座子是一种自私的DNA序列,能够入侵宿主的基因组。这项研究表明,至少有一个转座子家族——入侵我们基因组的数百万种古老病毒——在小鼠的生存能力方面起着关键作用,也许在所有哺乳动物中也是如此。当研究人员敲除老鼠体内的一种特殊转座子时,一半的老鼠幼鼠在出生前死亡。
这是第一个“垃圾DNA”对哺乳动物生存至关重要的例子。
在小鼠中,这种转座子调节早期受精胚胎细胞的增殖和在母体子宫内着床的时机。研究人员观察了包括人类在内的其他7种哺乳动物,也发现了与细胞增殖和胚胎植入时间有关的病毒来源的调控元件,这表明古老的病毒DNA已被独立驯化,在所有哺乳动物的早期胚胎发育中发挥了关键作用。
资深作者、加州大学伯克利分校分子和细胞生物学教授Lin He表示,这些发现突出了一个经常被忽视的进化驱动因素:病毒整合到我们的基因组中,并被重新定位为宿主基因的调控者,开辟了以前没有的进化选择。
He说:“老鼠和人类的基因组中有99%的蛋白质编码基因是相同的,我们彼此非常相似。那么,老鼠和人类之间的区别是什么呢?”其中一个主要的区别是基因调控——老鼠和人类有相同的基因,但它们可以被不同的调控。转座子有能力产生大量的基因调节多样性,可以帮助我们了解世界上的物种特定差异。”
密苏里州圣路易斯华盛顿大学医学院(Washington University School of Medicine)遗传学系特级医学教授Ting Wang对此表示赞同。
“这个故事的真正意义在于,它告诉我们进化是如何以最意想不到的方式进行的,”Wang说。“转座子长期以来被认为是无用的遗传物质,但它们构成了哺乳动物基因组的很大一部分。许多有趣的研究表明,转座子是人类基因组进化的驱动力。然而,这是我知道的第一个删除垃圾DNA片段导致致命表型的例子,证明了特定转座子的功能可能是必不可少的。”
这一发现可能对人类不育有意义。根据第一作者、加州大学伯克利分校博士后安德鲁·莫泽莱夫斯基(Andrew Modzelewski)的研究,近一半的人类流产是未经诊断的,或者没有明确的遗传成分。像这样的转座子会参与吗?
He说:“如果我们的基因组有50%是非编码或重复的——这是暗物质——那么我们很容易提出这样一个问题:人类生殖和人类不育的原因是否可以用垃圾DNA序列来解释?”
胚胎植入
He是加州大学伯克利分校Thomas和Stacey Siebel杰出讲座教授,研究人类98%或更多的不编码蛋白质的基因组。在He的大部分职业生涯中,她专注于microRNAs和较长的非编码RNA片段,这两种都是有效的基因调节器。然而,五年前,她的团队意外地发现了一个名为MERVL(小鼠内源性逆转录病毒元素)的转座子家族的microRNA调节器,它参与了早期小鼠胚胎细胞命运的决定。小鼠胚胎中出乎意料的大量转座子转录使何建平的团队开始研究转座子的发育功能,转座子在地球上几乎所有生物的基因组中都占据了一席之地。
在本周发表在《Cell》杂志上的一篇论文中,He和她的团队确定了涉及的关键调控DNA:一段转座子——一种病毒启动子——已被重新用作小鼠基因的启动子,该基因产生一种蛋白质,参与发育中胚胎的细胞增殖和胚胎植入的时间。启动子是基因上游转录和表达所需的短DNA序列。
野生小鼠使用这种被称为MT2B2的转座子启动子,在早期胚胎中启动基因Cdk2ap1的转录,以产生一种短蛋白质“异构体”,增加受精胚胎中的细胞增殖并加速其在子宫中的植入。他们使用CRISPR-EZ(Modzelewski和他几年前开发的一种简单而廉价的技术)禁用了MT2B2启动子,并发现小鼠将其默认启动子的Cdk2ap1基因表达为一种较长形式的蛋白质,一种长的亚型,这产生了相反的效果:细胞增殖减少,植入延迟。
这种基因敲除的结果是大约一半的幼崽在出生时死亡。
Modzelewski说,这种蛋白质的短形式似乎使小鼠植入的胚胎在子宫内有规律的间隔,以防止拥挤。当启动子被敲除,只有长型存在时,胚胎似乎是随机植入的,其中一些在子宫颈上,这阻碍了完全发育的胎儿的出口,有时在分娩过程中杀死母亲。
他们发现,在胚胎植入前的24小时内,MT2B2启动子使Cdk2ap1基因的表达急剧上升,以至于该蛋白的短形式占胚胎中存在的两种亚型的95%。当Cdk2ap1基因上游的默认启动子激活时,长异构体通常在妊娠后期产生。
该研究小组与Wangqing Shao合作,他是该研究的第一作者之一,也是Wang所在华盛顿大学研究小组的博士后研究员。研究小组搜索了八种哺乳动物植入前胚胎的公开数据,包括人类、恒河猴、狨猴、小鼠、山羊、奶牛、猪和负鼠——观察转座子在植入其他物种之前是否短暂开启。这些在线数据单细胞RNA测序(scRNA-seq),该技术记录单细胞中信使RNA的水平,指示哪些基因被开启和转录。在所有情况下,他们都必须检索非编码DNA的数据,因为通常在分析之前会将其删除,并假定其不重要。
虽然转座子通常是特定于单个物种的——例如,人类和老鼠的组合就有很大的不同——但研究人员发现,不同物种特定的转座子家族在植入所有八种哺乳动物(包括负鼠)之前会短暂开启,负鼠是唯一一种不用胎盘将胚胎植入子宫的哺乳动物。
He说:“令人惊讶的是,不同的物种在植入前胚胎中表达的转座子有很大的不同,但这些转座子的整体表达谱在所有哺乳动物物种中几乎是相同的。”
同事和共同资深作者Davide Risso,开发了一种将特定转座子连接到植入前基因的方法,以便清除基因组中存在的数以千计的相关转座子拷贝。该方法对于识别具有重要基因调控活性的单个转座因子至关重要。
Risso说:“值得注意的是,我们使用的数据大多基于以前的测序技术,称为SMART seq,它涵盖了RNA分子的完整序列。目前流行的技术,10x基因组技术,不会向我们展示不同水平的蛋白质异构体。”
病毒是进化的宿主
研究人员发现,在几乎所有的八种哺乳动物物种中,都存在短Cdk2ap1和长Cdk2ap1亚型,但它们在不同的时间和比例上被开启,这与胚胎植入的时间是早(如小鼠)还是晚(如牛和猪)有关。因此,在蛋白质水平上,短亚型和长亚型都是保守的,但它们的表达模式是特定物种的。
Modzelewski说:“如果你有很多短Cdk2ap1亚型,比如小鼠,你可以很早就植入,而在牛和猪这样的物种中,短亚型没有或很少,植入需要长达两周或更长时间。”
Wang怀疑产生长形式蛋白质的启动子可能是小鼠的原始启动子,但是很久以前整合进基因组的病毒后来被调整为调控元件,产生了短形式和相反的效果。
“所以,这里发生的是一种啮齿动物特异性病毒进来,然后宿主决定,'好,我要用你作为我的启动子来表达这个更短的Cdk2ap1亚型。’我们看到系统内建的冗余,我们可以利用自然抛给我们的任何东西,使它有用,”Wang说。“然后,这个新的启动子恰好比旧的更强。我认为这从根本上改变了啮齿动物的表型;也许这就是让它们生长得更快的原因——植入前的时间更短。所以,它们可能从这种病毒中获得了一些健康益处。”
“无论你在生物学中观察什么,你都会看到转座子被使用,仅仅是因为有这么多的序列,”Wang补充说。“它们本质上为选择提供了一个进化库。”
参考文献
A mouse-specific retrotransposon drives a conserved Cdk2ap1 isoform essential for development