当计算机学习了肖邦后……
蛋白质是生命的基本组成,有趣的是,它和看似毫无关联的音符之间还存在着许多惊人的相似之处。
或许更让你惊讶的是,两者之间的这种相似之处不仅可以帮助推进生物领域的研究,还可以让公众了解蛋白质的复杂性。张鹏和陈宇综都是计算生物学家,他们相信,在分子水平上听到生命的声音,有助于激发人们对生物学和计算科学更深入的了解。
只要有了正确的计算机程序,蛋白质就会变成悦耳的音乐。虽然基于蛋白质创作音乐并不算科研领域的新鲜事儿了,但不同的音乐风格和作曲算法仍有很大的探索空间。
两位计算生物学家领导了一个由高中生和其他学者组成的团队,正在研究如何借助算法从蛋白质中创作古典音乐。他们的研究也于近日发表在Heliyon上。
蛋白质的结构就像折叠的长链。这些链由20种可能的氨基酸的小单元组成,每种氨基酸都可以用字母表中的一个字母来表示。换句话说,一条蛋白质链可以表示为一个由字母组成的字符串,这就非常像一个以字母表示的音符串。
此外,蛋白质链也可以折叠成波浪形和曲线形,它们有起伏、弯曲和循环,这就好像音乐是由音高不同的声波组成的,乐曲的节奏也可以不断变化,主题多次重复。
蛋白质结构的不同方面。|图片来源:LadyofHats/Wikimedia Commons
正因如此,一种合适的“蛋白质到音乐”的算法,就可以将一串氨基酸的结构和物理化学特征映射到一段音符的音乐特征上。
同时,蛋白质到音乐的映射可以根据某种特定音乐风格的特征进行微调。当氨基酸特性(比如序列模式和变化)被转换为对应的音乐特性(比如音高、音符长度和和弦)时,就可以增强乐曲的音乐性。
在这项新研究中,团队专门选择了19世纪浪漫主义时期的古典钢琴音乐作为指引。这一时期代表性的作曲家包括肖邦和舒伯特等,因为这类音乐通常包含大跨度的音符,具有更复杂的特征,比如“半音化”,按音高顺序和和弦同时弹奏钢琴的上黑键和白键。
这一时期的音乐也倾向于更轻、更优美、更富有感情的旋律。乐曲通常是谐音的,也就是说它们遵循着一个中心旋律,外加一些伴奏。所有这些特性都让研究人员能够在蛋白质到音乐的映射算法中测试更大范围的音符。
团队选择分析了肖邦的《幻想即兴曲》的特征来指导程序的发展。为了测试这种算法,他们将这种算法应用在18种蛋白质上,它们在各种生物功能中起到了关键作用。
蛋白质中的每一种氨基酸根据它们在蛋白质中出现的频率被映射到一个特定的音符上,它们的生物化学的其他方面则对应着音乐的其他方面。举个例子,一个较大的氨基酸会有较短的音符长度,反之亦然。
由此产生的音乐非常复杂,并且在音高、响度和节奏上都有显著的变化。由于这个算法完全基于蛋白质的氨基酸序列,而没有两种蛋白质拥有一样的氨基酸序列,因此每种蛋白质都会产出一首不一样的歌曲。这也意味着不同作品在音乐性上都存在着差异,并且可以出现有趣的模式。
例如,与激素和神经递质催产素结合的受体蛋白产生的音乐具有一些重复的主旨,这是由于一些短小的氨基酸序列重复出现。
催产素受体蛋白质,其中包含一些重复的氨基酸序列。|图片来源:AlphaFold Data/EMBL-EBI, CC BY
而由肿瘤抗原p53(一种防止癌症形成的蛋白质)产生的音乐则具有明显的半音特征,它产生了一些特别迷人的片段,音乐听起来甚至有点像托卡塔,这种风格的音乐通常以快速和精湛的技巧著称。
肿瘤蛋白p53可以创作出具有半音特征的音乐。|图片来源:AlphaFold Data/EMBL-EBI, CC BY
通过对特定音乐风格中氨基酸特性的分析,可以让蛋白质音乐听起来更悦耳。类似的研究也可以进一步拓展并应用在更广泛的音乐风格中,比如让蛋白质创作出流行音乐或者爵士乐。
蛋白质音乐其实是一个例子,说明了如何结合生物科学和计算科学可以产生美丽的艺术作品。两位科学家希望,这项研究会鼓励研究人员创作不同风格的蛋白质音乐,并创造一种机会,让公众更加了解生命的基本组成部分。
原文作者:张鹏(洛克菲勒大学计算生物学博士后研究员)、陈宇综(新加坡国立大学药学教授)
#参考来源:
https://theconversation.com/the-music-of-proteins-is-made-audible-through-a-computer-program-that-learns-from-chopin-168718
https://www.cell.com/heliyon/fulltext/S2405-8440(21)02036-3
封面来源:Nevit Dilmen via Wikimedia Commons under CC BY-SA