“垃圾DNA”的概念过时了吗?

人类基因组(单倍体)DNA 中约有 32亿个碱基对,但其中只有约 2% 编码蛋白质。其余部分似乎毫无意义,大量的重复序列和基因组死角通常被称为“垃圾 DNA”(Junk DNA)。遗传物质的这种惊人的节俭分布不限于人类,如单细胞的原生动物——杜比亚阿米巴原虫(Amoeba dubia基因组达6 700亿个碱基对,拥有目前已知最大的基因组,甚至许多细菌的基因组也有20% 属于非编码序列。
杜比亚阿米巴原虫

许多谜团仍然围绕着什么是非编码 DNA,以及它是否真的是毫无价值的垃圾或其他东西的问题。现在,十分明确的是至少它的一部分在生物学上具有极其重要的意义。但即使除了其功能(或缺乏功能)的问题之外,研究人员也开始意识到非编码 DNA 如何成为细胞的遗传资源和新基因可以进化的摇篮。

对此,伦敦布鲁内尔大学的遗传学家Cristina Sisu认为:“慢慢地、慢慢地、慢慢地,'垃圾 DNA’的术语已经开始消亡。”

早在 1960 年代,科学家们就随便提到了“垃圾 DNA”,但他们在 1972 年更正式地使用了这个术语,当时日本的遗传学家和进化生物学家Susumu Ohno用它来论证大型基因组不可避免地包含着许多序列,被动地积累了许多年,没有编码任何蛋白质。此后不久,研究人员获得了确凿的证据,证明这种垃圾在基因组中的含量有多丰富,其来源有多么多样,尽管缺乏蛋白质蓝图,但仍有许多被转录成 RNA。

随着DNA测序技术的进步,特别是在过去的二十年里,已经极大地改变了科学家对非编码 DNA 和 RNA 的看法。尽管这些非编码序列不携带蛋白质信息,但它们有时会因向不同目的进化而形成。因此,对于各类“垃圾”的功能,只要它们有功能,就会越来越清晰。

细胞使用它们的一些非编码 DNA 来创造各种各样的 RNA 分子,这些分子以各种方式调节或协助蛋白质合成。这些分子的目录不断扩大,包括核小RNA(snRNA)、核仁小RNA(snoRNA)、微RNA(miRNA)、小干扰 RNA (siRNA)等等。有些是短片段,通常20nt,而另一些则长一个数量级。有些以双链形式存在或以发夹环的形式向回折叠。但它们都可以选择性地与目标结合,例如信使 RNA 转录物,以促进或抑制其翻译成蛋白质。

这些 RNA 可以对生物体的健康产生重大影响。例如,实验证明,小鼠中某些 miRNA 的关闭会导致从震颤到肝功能障碍的各种疾病。

迄今为止,人类和许多其他生物体基因组中最大的非编码 DNA 类别由转座子组成,转座子是可以改变其在基因组中位置的 DNA 片段。这些“跳跃基因”倾向于在整个基因组中复制许多份——有时是数十万个拷贝。最多产的是逆转录转座子,它们通过自身转录产生的 RNA 拷贝在基因组的另一个地方逆转录成DNA 来有效传播。大约一半的人类基因组由转座子组成,而在一些玉米植株中,这一数字攀升至约 90%。

 非编码 DNA 也出现在人类和其他真核生物(具有复杂细胞的有机体)的基因中,其内含子序列中断了蛋白质编码外显子序列。当基因被转录时,外显子 RNA 被剪接成 mRNA,而大部分内含子 RNA 被丢弃。但是一些内含子 RNA 可以变成参与调节蛋白质合成的miRNA。为什么真核生物有内含子是一个悬而未决的问题,但研究人员怀疑内含子通过使外显子更容易重新组合成新的组合来加速基因进化。

基因组中大部分非编码 DNA 的可变部分由各种长度的高度重复序列组成。例如,覆盖染色体末端的端粒。似乎端粒重复序列有助于维持染色体的完整性(由于重复序列丢失导致端粒缩短与衰老有关)。但是细胞中的许多重复没有已知的目的,它们可以在进化过程中获得和丢失,似乎没有不良影响。

如今,让许多科学家感兴趣的一类非编码 DNA 是假基因(pseudogene),它通常被视为功能基因的残余物,这些基因被意外复制然后通过突变失活。只要原始基因的一个副本起作用,自然选择就可能施加很小的压力来保持冗余副本的完整性。

类似于断裂的基因,假基因可能看起来像是典型的基因组垃圾。但是,一些假基因可能根本不是“假基因”。他说,其中许多被认为是已识别基因的缺陷副本,并在没有实验证据表明它们没有功能的情况下被标记为假基因。

假基因还可以进化出新的功能。 有时它们实际上可以控制与它们同源的真基因的活性,如果它们的 RNA 与真基因的 RNA 足够相似,那就可以与之相互作用。2010 年抑癌基因PTENP1 的假基因作为调节肿瘤生长的 RNA 获得了第二次生命的发现说服了许多研究人员更仔细地研究假基因垃圾。

因为动态非编码序列可以产生如此多的基因组变化,这些序列既可以成为新基因进化的引擎,也可以成为它的原材料。研究人员在 ERVW-1 基因中发现了一个例子,该基因编码一种对旧世界猴子、猿和人类胎盘发育至关重要的蛋白质。该基因起源于大约 2500 万年前祖先灵长类动物的逆转录病毒感染,搭乘逆转录转座子进入该动物的基因组。 逆转录转座子基本上选择了这个元件,在基因组周围跳跃,实际上把它变成了对人类发展方式非常重要的东西。

但是,从它对细胞没有任何用途的意义上说,基因组DNA 中又有多少是真正的“垃圾”?这是一个一直被热议的话题。2012 年,DNA 元件百科全书(Encyclopedia of DNA Elements,Encode研究项目宣布其发现,大约 80% 的人类基因组似乎被转录或具有其他生化活性,因此可能具有功能。然而,这一结论遭到了科学家的广泛质疑,他们指出 DNA 可以出于许多与生物学效用无关的原因进行转录。

对此,多伦多大学的 Alexander Palazzo 和圭尔夫大学的 T. Ryan Gregory 描述了几条证据,其中包括进化考虑和基因组大小,强烈表明真核基因组充满了低水平转录的垃圾 DNA。而休斯顿大学的 Dan Graur 认为,由于突变,只有不到四分之一的人类基因组可以在进化上保留功能。这些想法仍然与转座子的“自私”活动可能对其宿主的进化产生影响的证据一致。

关于“垃圾 DNA”的教条已经拖累了对其有多少值得这种描述的问题的调查。这基本上不鼓励人们知道是否有功能。另一方面,由于测序和其他方法的改进,我们正处于了解非编码 DNA 和非编码 RNA 的黄金时代。

未来,研究人员可能越来越不愿意将任何非编码序列描述为垃圾,因为现在有许多其他更精确的标记方法。对此,Sisu认为:该领域最好的前进方式是在评估非编码 DNA 和 RNA 的怪异性及其生物学重要性时保持开放的心态。人们应该退后一步,意识到:

一个人的垃圾可能刚好是另一个人的宝贝

(0)

相关推荐