多功能酶的分类技术与应用

1999年有学者将一类同时具有两种或两种以上功能的蛋白质称为兼职蛋白质,还对兼职蛋白质的概念进行了严格的限定。经过研究表明,功能明确的兼职蛋白质大部分是酶蛋白,即除了已经具备的催化功能外还具有其他的生物学功能,这些功能涵盖了两种情况:一是产生催化混杂的现象,二是与调节作用有关的功能。这类具有多种功能的酶被称为多功能酶。

在数据挖掘领域,关于多功能酶的研究是一个预测问题,通常是一个数据分类问题。虽然数据挖掘方法已被广泛应用于建立分类模型来指导预测任务,但对多功能酶这类多标签的分类模型构成了重大的挑战。在汉斯出版社《计算机科学与应用》期刊中,有学者对多标签分类与传统的分类问题做了比较,主要难点有以下两个:1)类标签的数量不确定,有的样本可能只有一个类标签,而有的样本的类标签可能高达几十个;2)类标签之间存在依赖,怎样解决类标签之间的依赖性也是一个难点。

为了解决多功能酶分类问题,在过去人们已经开发了机器学习方法,其中大部分是基于样本技术和集成方法等。尽管已经发表了一些与多功能酶分类有关的研究,但大都集中于技术方面,而忽略了应用方面的探索,关于多功能酶这个大类的应用研究综述少之又少。对于生物学等领域的研究人员来说,使用先进的学习技术和成熟有效的方法解决多功能酶分类预测的问题可能比使用复杂的算法更为重要。

在本文中,我们对多功能酶分类技术及其应用进行了全面的概述,在此过程中我们从方法和应用的角度出发,收集了89篇与多功能酶研究相关的论文。根据调查结果,我们提出了多功能酶研究未来可能的研究方向。

方法方面:可以尝试其他的特征选择方法获得我们所需要的实验数据,然后经过特征融合的方法将特征进行融合使我们的实验数据能够更好的表达它的意义;此外作为一种提高弱学习者分类性能的好方法,基于集成的算法目前已被广泛用于解决一些多分类学习任务。有学者认为集成模型的性能取决于单个分类器的准确性和所有分类器之间的多样性,未来可以尝试将多标签学习算法中的分类器进行集成,以获得更好的性能。往后可以将重心放在多标签学习两大难点上,开发新的算法去解决标签依赖性以及类标不平衡的问题。

应用方面:只有2篇文献讨论了多功能酶在病毒研究领域方面的应用,由于新药研发已经进入到了以生物靶标为核心的时代,特别是以计算机模拟结构来设计药物的出现使得药物设计理念得到了进一步的完善,未来可以在这个方面做更多的工作;另一个有价值的研究方向是在其他应用领域中,多功能酶的应用较广,从生物合成到畜牧水产都有涉猎,尤其近年来多功能酶在畜牧、水产、养蜂方面有很大的应用成果。现在人们更加注重健康与营养,怎样提高产品的产量与质量也是一个需要继续攻克的难题。

文章链接:https://doi.org/10.12677/CSA.2021.113048

(0)

相关推荐