论 《黄帝内经》 和易经揭“没有灵魂”的生物DNA/RNA基因Watson表的内秘
国际上第四统计力学创始人
中医药国际联盟中国区主席
世界华人报网总编
一、沃森表(Watson’s Table)的由来与现状
引言
“DNA之父”沃森(Watson)排斥女性科学家罗莎琳德·富兰克林对DNA双螺旋结构的贡献,他同克里克(Crick)共同获得了诺贝尔奖,世人在背后替罗莎琳德骂他们,也许是这个原因,克里克就先走西天了,并以227万美元价拍卖了诺贝尔奖章;今年沃森又拍卖获得480万美元。据说前一个由一位中国富者拍得,后一个由俄罗斯的富翁拍得,以支持沃森的科研工作。总之这种诺贝尔奖无法得到人们的赞赏。今天我们再来看沃森借许多人的研究成果而归纳的一张有关DNA中四种碱基和二十种氨基酸之间匹配的关系表,有人把这张表称之为“沃森表”(Watson's Table,见表1)。
表1 DNA四种碱基与二十种氨基酸之间关系的实验总结表
二、从《黄帝内经》阴阳学说看DNA四种碱基的阴阳性,
《黄帝内经》阴阳学说告诉我们一切自然界的阴阳有大的四种:
阴中之阴(--)
阴中之阳(-+)
一切生命体的基因由四种碱基串联成DNA,RNA。
我们从四种碱基结构的电荷分布很容易发现下列事实:
当代分子生物学及量子生物学都指出:在远古生命的原始“化学汤”里,在开始先有过各种核苷酸和氨基酸通过三聚磷酸互相连接的复合型二元单体分子,经双向聚合反应,生成RNA及相应的蛋白体,后由RNA转化为更加稳定、更长链的DNA,从此生物蛋白质的合成的途径变成为先由DNA,复制出t-RNA,用来运输各种氨基酸;又从DNA复制出m-RNA,借助于t-RNA所提供的氨基酸,合成出基因相关的蛋白质。所以从原始生命的“化学汤”看,不存在“先有鸡,后生蛋,或先有蛋,后生鸡”的争议了。从这个意义上,我们很容易理解到下列产生生命的基本模式,其中生命动力源自始至终起催化、激活动力作用:
3.1 t-RNA反密码子和氨基酸与64卦对应关系
近年来随着宇航科技的发展,人们都很想发现地球外生命的存在,有些学者认为在无限大的宇宙里应该还有生命之物,甚至还有外星人类,但是有的学者认为在整个宇宙,地球上的人类,恐怕还是唯一的。笔者相当程度上赞成后一种看法,这是因为生命的出现,特别是人类的出现,其生命的化学演化过程具有非常特殊的规律:就是要遵循中国古代太极八卦及其扩张的六十四卦的规律。笔者难以想像外星的化学演化过程与环境是否能由这样的规律来支配?除非外星的化学环境满足下列的情况:现在让我们来看看生命的最重要的核心特质:DNA和蛋白质是如何配合的,就可以想像到在外星里做到这一点是多么难的事情!
下面进一步探讨如何从DNA→RNA→蛋白体的过程:应该首先指出在上述过程中,为了使RNA合成蛋白体,首先由各种不同结构的t-RNA,通过其三联体反密码子,先识别不同氨基酸,形成中间过渡体结构,接着使不同氨基酸连到不同结构的t-RNA的3¢末端-CCA上,然后再按着m-RNA的要求,在核糖体内按着最佳基因序列链接到蛋白分子链上,可见m-RNA和t-RNA反密码之间有下列对应关系:
表2 由t-RNA氨基酸与反密码子中心碱基之间形成的Watson’Table
按照中国易经的看法,这是一个对立统一体的最典型的实例,且按一生二,二生三,形成三维立体空间的原理,最多可以形成64个三联体密码子:
在这种情况下,由中国古代六十四卦图形可得随碱基阴阳不同而不同的氨基酸的分布图(见图1)。
(1)由图1可以看出,20种氨基酸分成四大区,以靠近太极的密码子第一碱基为准,其分成四大区:每大区有红→紫→黄→兰。
(2)从图1中可以看到,非常奇特的现象,那就是每大区里都由相同的密码子(X¢Y¢Z¢)中心碱基Y¢之颜色均为相同:
3.2 首次发现t-RNA反密码子中心碱基Y的内聚能密度决定氨基酸的选择性
自从反密码子与氨基酸之间的Watson表出现以来人们一直在思考,为什么会有这种选择性?提出了各种观点,主要表现在两点:一是认为t-RNA环状结构的某些区段可能对不同氨基酸具有选择性,即由“副密码子”起作用,但是实际上搞不清楚哪一区域;二是认为有一种神秘的化学动力酶给t-RNA提供氨基酸的选择性。但是究竟是什么呢?至今没有能提供实体。在这种苦难之际,本文作者首次成功地发现了t-RNA的反密码子本身的四种中心碱基Y和四类氨基酸内聚能密度化学信息量之间有密切的关系,而氨基酸的共聚能力取决于反密码子中心碱基和氨基酸内聚能密度化学信息量大小的排序上。
3.2.1 量子化学从头计算之失败与内聚能密度化学结构信息量的新奇性
上世纪70年代,Van Krevlen等人提出了内聚能密度概念及其计算方法[9,10],作者首先用来判断不同分子间相容性以及共聚反应中竞聚率和单体内聚能密度之间的定量关系[5-8]。作者从中看到,内聚能密度的概念隐含着极大的生命力,要比量子化学从头计算方法优越许多倍,这是因为这一方法避开了分子间作用力与距离 r5~6 成反比的难题[4]。
遵循Einstein的名言“要从另一个角度来看问题”的教导,作者发现眼前内聚能密度概念非常成功地解释了氨基酸和密码子中心四种碱基之间的匹配关系。根据内聚能密度的定量数据,可按能量相近原则将氨基酸分成四大类,并与碱基的内聚能密度进行了比较,发现它们之间的匹配关系与Watson’s Table 具有令人满意的一致性。
众所周知,非共价键力包括生物体各分子间普遍存在的色散、极性(包括诱导极性)、氢键三大作用力,它是了解大分子的结构和相互作用的基础,而这些结构和相互作用是通过这三大作用的内聚能密度化学信息量来决定的。根据Van Krevlen提出的计算内聚能密度方式[9,10],可以分别得到色散力、极性力和氢键力相关的内聚能密度的计算公式(式1-3):
色散内聚能密度:
根据上述计算公式,可分别计算遗传密码子中的各碱基的内聚能密度以及四类氨基酸的内聚能密度,然后我们可以进一步从分子结构的化学角度来全面地诠释碱基配对原则以及蛋白质合成过程中氨基酸与三联体反密码子第二碱基之间存在高选择性的问题。
3.2.2从内聚能密度考察碱基与氨基酸之间定量关系,揭示人们所说的神秘的配对原则
根据上述计算公式,首先计算了五种碱基(A、T、G、C和U)的克分子体积及由各种作用力参数所贡献的内聚能密度以及各项内聚能密度之总和(
)和溶解参数
,其结果列于表3中。
表3 五种碱基内聚能密度e(J/cm3·mol)及克分子体积L(cm3/mol)
表4 与m-RNA密码子第二碱基U和t-RNA反密码子A′相关的氨基酸的内聚能密度(J/cm3.mol)
值。
由表4可以看出反密码子中心碱基A¢的总的内聚能密度(
)与五种氨基酸总的内聚能密度(
)都非常相近,故这五种氨基酸与反密码子中心碱基A¢相匹配,也就与正密码子T(U)间接有关。
表5 与m-RNA密码子第二碱基鸟嘌呤G和t-RNA反密码子C′相关的氨基酸内聚能密度(J/cm3.mol)
红外光谱表明,表中甘氨酸、丝氨酸、精氨酸在疏水条件下,均能形成分子内氢键,故在计算内聚能密度时应扣出分子内氢键作用能,例如:
与五种氨基酸的
也相当接近,故这五种氨基酸与C¢相匹配。
表6 与m-RNA密码子第二碱基A与t-RNA反密码子C′相关的氨基酸内聚能密度(J/cm3.mol)
值。
由表6可以看出七种氨基酸的
与反密码子中心碱基U¢的
相近,故这七种氨基酸与中心碱基U¢相匹配。
表7 与m-RNA密码子第二碱基C和t-RNA反密码子G′相关的氨基酸内聚能密度(J/cm3.mol)
注:表中*指扣出疏水状态下的分子内氢键内聚能密度。
表中()指溶解度参数
值。
从表7中可以看出
与
非常接近。
在普通有机化学理论中得知,在疏水介质条件下,表7中苏氨酸和丝氨酸均能形成分子内氢键(见下面示意图),内氢键作用使分子之间的极性作用大为衰弱,以至使它们的内聚能密度化学信息量接近于丙氨酸和脯氨酸的水平。其中苏氨酸和丝氨酸的分子内氢键形式如下:
根据以上的讨论,我们可以总结出正密码子和反密码子的四种中心碱基和四类氨基酸内聚能密度比较表(见表8)。
表8 遗传密码子四个中心碱基与氨基酸内聚能密度的比较(J/cm3.mol)
由表8可以看出,四类氨基酸各有特性,使它们与相应的反密码子中心碱基匹配。
另外从表8中还可以发现各个碱基的内聚能密度之间有
,即1492≈1486,这是一个极其重要的规律。这一规律表明在DNA的双螺旋结构或遗传信息的翻译过程中,DNA与RNA的双螺旋结构的每组碱基对(A-T(U)或G-C)的总内聚能密度之和都相当接近,这是保证DNA、RNA双螺旋结构稳定性的根本条件。由此充分表明相邻碱基对(A-U,C-G)之间存在严格的能量平衡,从而使碱基对之间表现出具有高度的相容性,因此上述能量平衡是DNA,以双螺旋梯形结构形式存在的根本原因。由此可见,我们从内聚能密度相近的现象成功地揭示了双螺旋结构中碱基配对的原则,简而言之DNA高度遵循能量相近、相容性的择优原则。
四、t-RNA的反密码子中心碱基和氨基酸之间形成
接合体的“神秘”机制
在分子生物学中提到t-RNA的反密码子和氨基酸之间接合体的问题,但是如何形成没有加以探讨。
通过上述分析和讨论,我们可以总结出在形成t-RNA反密码子与氨基酸的接合体过程中存在以下几条“神秘”的基本规律:
1)凡是具有色散型疏水性基团的氨基酸均与m-RNA中心碱基尿嘧啶(U)相关,但是实际上它们首先与t-RNA反密码子中心碱基A¢相关,这是因为这些氨基酸的内聚能密度和A¢内聚能密度接近,符合相容性原则。 2)凡是能够在分子内形成强烈氢键的氨基酸均与m-RNA中心碱基(G)相关,但实际上它们首先与t-RNA反密码子中心C¢有关,此时氨基酸的内聚能密度和C¢的内聚能接近,符合相容性原则。
3)凡是在氨基酸侧基R中能够形成电荷中心(+,-)的氨基酸均与m-RNA中心碱基A¢有关,但实际上它们先与反密码子中心碱基U¢有关,此时它们之间可形成很强的氢键,符合相容性原则。
4)凡是在氨基酸侧基R中存在能够同氨基酸的-COOH或-NH2作用形成内氢键或存在有-CH3等超共轭基团时,这些氨基酸均与正密码子中心碱基(C)有关,但实际上也是首先与它的反密码子中心碱基G¢之间有关,此时两者的内聚能密度很接近,符合相容性原则。
总之遗传密码子中心碱基和与之匹配的氨基酸的内聚能密度范围和侧基结构特征强有力地说明转运氨基酸的t-RNA反密码子中心碱基是通过相容性原理,即内聚能密度相近的原则来直接识别和选择氨基酸的,而由生命动力源含水络合离子群为核心的生物酶自始至终起催化、激活动力作用。应当强调的是以上作者所发现的有关氨基酸和碱基之间能量的定量关系,目前尚未见于其他论文的报道中。由于当代分子生物学还不知道上述规律,故有一些分子生物学的教科书将上述的匹配规律性,盲目地归结为生物酶的选择功能,到处用生物酶概念来做笼统的解释,这是典型的学术“经济主义”的表现。作者所发现的上述规律,充分揭示了t-RNA和氨基酸之间的匹配关系,给Waston表提供内在“灵魂”,给予当代科学的内涵!
通过前面的讨论,可以说在整个生物蛋白合成中,生物分子之间的相容性原理始终起着决定性作用。总结起来,相容性原理的作用主要体现在t-RNA反密码子的两项重要功能上,一是首先能够通过它自身的反密码子中心碱基和某种氨基酸之间相容,形成t-RNA反密码子与氨基酸之间的过渡态相容体;二是借助于ATP向另一个相同t-RNA的3¢末端-CCA提供氨基酸,形成大量的t-RNA与氨基酸的酰胺型接合体,后进一步通过核糖体向蛋白高分子链的活性中心提供氨基酸单体,使在核糖体内最终合成出一定结构的蛋白体。那么在这个过程中,t-RNA反密码子与氨基酸之间结合体是究竟通过什么方式来形成的呢?看来大有可能通过双向接合体的方式提供t-RNA—氨基酸接合体,以此在m-RNA中,为持续合成蛋白体做下一步的准备(见图2)。
五、揭秘合成蛋白的起始密码子和终止密码子必然存在的根源
从大量的实验事实中总结的64个密码子和氨基酸对应关系[11-13]中可以看出,沿着m-RNA合成蛋白高分子链的起始密码子总是从-AUG-开始,而相应的氨基酸为甲基硫氨酸Met,为什么这样呢?对此至今没有理论解释。纵观表2-5的数据,我们可以发现,在所有的氨基酸中,甲硫氨酸具有最小的内聚能密度(561.3J/cm3·mol),因此它与t-RNA接合体的内聚能密度也最小,故这些t-RNA含氨基酸分子克服同种分子间凝聚作用,能够较顺利地脱离自身的凝聚体进入核糖体中,并向蛋白链活性端上提供Met氨基酸分子,然后t-RNA脱离核糖体。所以在核糖体中合成蛋白时,t-RNA/Met一但遇到-AUG-密码子,它就首先充当为起始聚合点。同样道理,由于氨基酸Val的内聚能密度也较小,所以在人类线粒体中氨基酸Val也常充当蛋白聚合的起始点。相反地,Tyr具有最大的内聚能密度(902.1 J/cm3·mol),而且比反密码子T(U)的内聚能密度850J/cm3·mol还大一些,故Tyr-t-RNA在进入核糖体时,由于其内聚能密度很大,所以Tyr/t-RNA很难离开自身的凝聚态进入核糖体中,几乎停止提供氨基酸,加之在合成DNA及RNA时-UAA、-UAG密码子本身的分量也很少,所以蛋白链的增长自然就要接近终止,在这种情况下Tyr及其密码子常常表现为“终止”状态。
在上世纪90年代还发现了一个奇特的现象,即发现在细胞质和线粒体的翻译系统中密码子用法不同,例如对应于色氨酸密码子而言,在细胞质中常常表现为终止态,而在线粒体中则不会[14]。这一现象的发现被看作是20世纪末分子生物学发展的重大事件之一,但是出现这种现象的原因至今未能诠释,现在让我们从内聚能密度审视其根本原因!
我们已经知道,色氨酸可以类似精氨酸一样,于疏水条件下其-COOH与>NH之间可相互作用,形成内氢键型8节环,使色氨酸的氢键内聚能减少到68.4 J/cm3.mol,此时色氨酸的总内聚能密度大幅度下降,只有659.6 J/cm3.mol。在这种情况下,色氨酸就会与反密码子-A¢C¢U¢-之间从能量上极不相应,所以色氨酸常表现为终止态。这一点可由色氨酸通常在疏水的细胞质中表现为终止态来验证。但在线粒体中,由于m-RNA和蛋白合成几乎在同一地点和同一时间内进行,而线粒体环境所提供的是一个亲水性的介质条件,使色氨酸的内氢键消失,其内聚能密度值增加到766.3 J/cm3.mol,其在能量上可与-A¢C¢U¢-匹配,以致使在线粒体中-UGA-正密码子表现为非终止态。线粒体的亲水环境往往也会使甲硫氨酸中CH3-S-的极性起作用,以致使-AUC-、-AUU-、-AUG-和-AUA-均为蛋氨酸的密码子。而相反地,在线粒体的亲水性介质条件下,由于精氨酸的内氢键作用的消失,导致其内聚能密度大幅度增加到901.5 J/cm3.mol,因而无法与反密码子-U¢C¢U¢-和-U¢C¢C¢-匹配,所以在正密码子-AGA-和-AGG-上就表现为终止态。由此可见,密码子在细胞核和线粒体的翻译系统中用法的不同,主要是由于微观反应环境的亲疏水性程度不同引起氨基酸的内聚能大小发生变化而导致的。
六、在地球上一切生命体64个密码子与氨基酸
相互关系的64卦循环模型
归纳以上的讨论,作者将地球上所有生命体遗传密码子与相应氨基酸之间匹配规律用下列循环图来示意(见图3)。
t-RNA的反密码子中心碱基与相应的氨基酸之间连带关系
②在大肠干菌、哺乳动物、线粒体中UAA(A'U'U'),UAG(A'U'C')均为终止密码子!
由图3可以看出将循环图可以分成四大区:
第一部分:以A'为中心时,是带有非极性疏水基团氨基酸的一大类区;
第二部分:以G'为中心时,是分子内具有超共扼或内氢键化的氨基酸的一大类区;
第三部分:以C'为中心时,是具有强烈外氢键化及高极性的氨基酸类的一大区;
第四部分:以U'为中心时,是具有带电荷的极性基团的氨基酸类的一大区。
由图3可以看出,在正常情况下,内聚能密度最低的甲硫氨酸作为起始区(3),按照逆时针方向,不同结构的氨基酸大体上,随着内聚能密度的增加一个又一个地对应着密码子,一直到内聚能密度最大的酪氨酸才进入终止区(43)。至于在线粒体的亲水性介质环境下,起始和终止态密码子与上述正常情形之间的差别问题,已在前面作了详细的考察,不再讨论。
七、主要结论
1)首次按着中国传统易经学说的观点,将G(++,
),C(――,
)A(+-,
)U(-+,
)来加以表示,并按中国太极64卦排列的顺序,可得以第一碱基为阴阳起始态的64卦排列的顺序,得到了有64个反密码子和相应氨基酸分布的图形,其中有四大区,每一大区又分成四个小区,从中发现反密码子中心碱基对氨基酸具有相当高度的选择性。这样又得到了以中心碱基作为四大区的循环图,这为研究t-RNA在蛋白合成中的作用机理,提供了非常重要的信息。从中惊奇地看到中国古代太极64卦图和Watson表之间高度的一致性。
2)首次用内聚能密度的定量数据,全面考察了二十种氨基酸和反密码子的四种碱基的氢键、极性、色散内聚能密度之间的关系,并根据能量相近原则将氨基酸分成四大类,并与反密码子碱基的内聚能密度进行了比较,揭开了它们之间的匹配原则。匹配结果和遗传密码与氨基酸的匹配表具有令人满意的一致性。
3)本文首次定量地指出了氨基酸本身是如何通过相容原则使每一个氨基酸分子以L型方式被反密码子中心碱基所识别,从而形成t-RNA酰胺型接合体,并其在m-RNA蛋白合成中,再按着m-RNA的要求,在核糖体内为合成最佳基因序列的蛋白分子链,提供一系列氨基酸。
4)作者提出了形成氨基酸/t-RNA接合体是通过两个氨基酸/t-RNA反密码子,互相倒过来的方式经ATP的作用缩合而形成的。
5)本文首次指出了精氨酸、甘氨酸、丝氨酸、苏氨酸及色氨酸的分子内氢键对四种碱基的选择性影响,成功地解释了在正常细胞质和线粒体的m-RNA翻译系统中,为何密码子用法不同的根本原因。
6)通过密码子的内聚能密度大小及其变化规律,指出了为什么有些密码子成为起始密码子或终止密码子的根本原因。
参考文献
[1]James D. Watson. Molecular Biology of the gene. 3rd Edition. W.A. Benjamin INC., 1977, 356
[2]B. Pullman and A. Pullman, Nature, 1962, 196:1137
[3]R. Rein, et al., in Molecular Orbital Studies in Chemical Phyarmacology, P. 191, Kier, L. B. ed. Springer, 1970
[4]M. S. Rendell, et al., Biopolymers, 1971, 10:2083
[5]Jin R G(金日光),Yang J C(杨金才),Chen S(陈松), et al, Study on Realationship Between Sub-cluster of Sequence Structure of Copolymer and JRG-Fourth Statistical Theory Scale(I) Study on Order-distributed Scale of Sequence Structure of Copolymer. Journal of Beijing University of Chemical Technology, 1997, 24(2):33-42
[6]Jin R G(金日光),Cui X G(崔秀国),Yang J C(杨金才),et al, Study on Relationship Between Sub-cluster of Sequence Structure of Copolymer and JRG-Fourth Statistical Theory Scale(II) Sequence Structure Scale of Copolymer Chain Including Acrylonitrile and Theoretic Analysis of Experimental Data. Journal of Beijing University of Chemical Technology, 1997, 24(3):9-15
[7]Jin R G (金日光),Li X C(李秀错),Wang Y Q (王英奇),et al,Study on the Relationship Between Sub-cluster of Sequence Structure of Copolymer and JRG-Fourth Statistical Theory Scale (III) Investigation of Relationship between Solubility Parameter and the Degree of Sequence in Copolymerization. JOURNAL OF BEIJING UNIVERSITY OF CHEMICAL TECHNOLOGY, 1997, 24(4):15-21
[8]Jin R G(金日光),Feng W(冯威),Chen S(陈松),,et al,Study on the Relationship Between
Sub-cluster of Sequence Structure of Copolymer and JRG-Fourth Statistical Theory Scale (IV) Investigation of Relationship between Solubility Parameter of homopolymer (δ) andQ,e. JOURNAL OF BEIJING UNIVERSITY OF CHEMICAL TECHNOLOGY, 1998, 25(1):20-26
[9]D. W. Van Krevelen, Properties of polymers. Their Estimation and Correlation with Chemical Structure, Elsevier Scientific Publishing Company, Amsterdam-Oxford-New York, 1976
[10]J. Brandruup, et al. Polymer Handbook, A Wiley-Interscience Publication, New York, IV337-354, 1987
[11]Edqvist J, Burger G, Gray M W. Expression of mitochondrial protein-coding genes in Tetraphymena pyriformis. J Mol Biol, 2000, 297:381-393
[12]Anderson S, de Bruijn MH, Coulson A R, Drouin J, Eperon I C, Nierlich D P, Roe B A, Sanger F, Schreier P H, Smith A J, Staden R, Young I G. Comparison of the Human and Bovine Mitochondrial Genomes Mitochondrial Genes. Mol Biol, 1982, 156(4):683-717
[13]Horai S, Satta Y, Hayasaka K, Kondo R, Inoue T, Ishida T, Hayashi S, Takahata N J. Man’s place in Hominoidea revealed by mitochondrial DNA genealogy. Mol Evol, 1992, 35(1):32-43
[14] Taanman JW. The mitochondrial genome: Structure, transcription, translation and replication[J]. Biochim-Biophys-Acta, 1999:1410(2):103-123