科研 | 哈佛大学:蛋白质结构、氨基酸组成和序列决定了蛋白质组对氧化损伤的易感性
编译:雪花飘飘,编辑:Emma、江舜尧。
原创微文,欢迎转发转载。
氧化应激反应可以改变细胞活力,在微生物辐射敏感性以及人类衰老和神经退化等方面皆有所体现。活性氧(ROS)对蛋白质羰基化的有害影响使得了解决定ROS敏感性的分子特性至关重要。抗辐射细菌放射性双球菌比敏感生物积累更少的羰基化,使其成为破译氧化应激抵抗特性的关键模型。我们整合了鸟枪氧化还原蛋白质组学、结构系统生物学和机器化学习,以解决大肠杆菌和耐辐射奇球菌在多个尺度上通过γ辐射确定蛋白质损伤的特性。局部可及性、电荷和赖氨酸富集可准确地预测ROS活性氧的敏感性。赖氨酸,蛋氨酸和半胱氨酸的使用也有助于预测耐辐射奇球菌蛋白质组活性氧的抗性。我们的模型预测了蛋白质组维持机制,保护活性氧的蛋白质在耐辐射奇球菌中更具抵抗力。我们的发现证实了蛋白质内在保护会影响氧化应激抵抗,从而确定了因果分子特性。
论文ID
实验设计
我们的稳健实验设计首次结合氧化还原蛋白质组学对暴露于急性剂量γ辐射的细胞进行了结构系统生物学和机器化学习(图1B),形成了蛋白质羰基化的预测模型。这一跨学科的工作流程使整个蛋白质组能够表征大肠杆菌和耐辐射奇球菌对羰基化的易感性,确定表型上重要的蛋白质靶点,为目标易感性提供分子解释,并支持蛋白质内在特性在极端氧化应激生存中的作用。
图1 学习理念和工作流程
A羰基化位点分布、蛋白质对活性氧的脆弱性和应激表型之间的关系。B结构系统生物学工作流程用于蛋白质组范围内的羰基位点预测。红色圆圈=羰基位点(CS);黑色圆圈=非氧化R KPT残基;灰色蛋白质区域=非RKPT残基。
实验结果
1. 与大肠杆菌相比,γ射线对耐辐射奇球菌的靶向性蛋白损伤更大
为了研究细菌蛋白质的氧化损伤,培养物暴露于对大肠杆菌致死的急性剂量γ辐射(6.7kGy)中,但产生55-70%的耐辐射奇球菌存活,并通过质谱测量蛋白质羰基和相对丰度的变化。(图1B, 2, 数据集EV1).根据先前的工作,需要对大肠杆菌致命的辐射剂量,以观察对耐辐射奇球菌生存的任何有害影响。此外,我们选择的剂量接近报告的最高剂量(7kGy),用于从整个细胞裂解物和透析样品的散装蛋白质羰基化测量,为模拟小分子抗氧化剂对蛋白质的外在保护的影响提供了基础。为了限制新的蛋白质合成在整个和随后的辐照,细菌培养保持在0℃附近使用自定义机架设计(数据集EV1和EV2)。重要的是,这导致了不同的相对蛋白质丰度,特别是由于氧化损伤(材料和方法),区分了我们的结果与以前的蛋白质组学的研究。无论每种物种的辐照情况如何,提取时的蛋白质浓度都是相似的(附录表S1),从同一物种中提取的蛋白质样品的SDS-PAGE条带模式也在质量上相似(附录图S2)。总之,这些结果表明,细胞膜完整性在辐射中被保存。
正如预期的那样,我们观察到在未辐照或辐照条件下,大肠杆菌中的蛋白质(在1373个已鉴定的蛋白质中的102个中的~700CS)比在未辐照或辐照条件下的耐辐射奇球菌(1264个已鉴定的蛋白质中的70个中的400CS)更多(图2A和表EV1)。使用相同的氧化还原蛋白质组学技术,耐辐射奇球菌的检测率与暴露于UVB的光杆菌(鉴定了1221羰基化蛋白的62个)的检测率相似。耐辐射奇球菌总蛋白羰基化较少可能是由于其有效的ROS解毒机制。CS饱和曲线表明,在耐辐射奇球菌中检测到的羰基化事件比大肠杆菌(分别为85%和27%;图EV1B)的所有体内事件的覆盖率更大,这与这些物种之间氧化应激敏感性的差异是一致的。与大肠杆菌(20;图2A)相比,以辐射依赖的方式检测到的独特蛋白质略多)。基于对大肠杆菌体内所有羰基化的估计覆盖率低得多,我们认为对大肠杆菌蛋白质组的广泛损伤-导致更多的降解和聚集的蛋白质-阻碍了质谱鉴定某些羰基化肽。
相对蛋白质定量提供了明确的证据,以对比差异蛋白质损伤区分这些生物体(图2B和表EV2)。虽然在大肠杆菌中只有6种蛋白质表现出显著的>2倍的差异相对丰度(配对t检验,P<0.05),但163种蛋白质总体上表现出>2倍的变化,尽管在复制过程中具有较高的变异性。在耐辐射奇球菌中,81种蛋白质的相对丰度变化>2倍;平均变化幅度更大,变异率低于大肠杆菌。我们检测到的至少一种CS的蛋白质在相对丰度上比耐辐射奇球菌中的其他蛋白质下降得更多(未配对的t检验,P=0.031),这说明羰基化与蛋白质降解程度之间的预期关系。然而,这种关系在我们的大肠杆菌数据中不那么突出(未配对t检验,P=0.104)。因此,虽然大肠杆菌总体上积累了更多的蛋白质羰基,但它们在不同的蛋白质物种中的分布更广泛,提供了更多的蛋白质特异性机制的证据,以保护在大肠杆菌中不存在的耐辐射奇球菌中的ROS。
还进行了类似的相对肽定量。对于耐辐射奇球菌,148个肽代表134个独特的蛋白质,相对丰度显著增加(折叠变化> 2,满足标准,假发现率为0.05),一个肽显著降低(折叠变化< 0.5,满足标准)。对于大肠杆菌,26个肽代表25个独特的蛋白质在辐照后相对丰度显著降低,没有肽显著增加。在这两个物种中,没有一个单独的羰基化肽在相对丰度上发生显著变化。这些观测结果通常与这些物种受到辐照时预期的对比反应平行。然而,当汇集肽来评估整个蛋白质水平上的丰度变化时,获得了更大的统计能力。这在一定程度上是因为随机错过了胰蛋白酶位点和翻译后修饰导致在肽水平上量化时肽同一性不完善。
图2 鸟枪氧化还原蛋白质组学数据概要
A一种总基含羰基的蛋白质,通过猎枪氧化还原蛋白质组学测量,在三个生物复制中检测到,每一个大肠杆菌和耐辐射奇球菌都有和没有辐照。左轴是检测到的作为羰基化的序列唯一蛋白的数量。右轴是在含有至少一个羰基的肽中检测到的总的羰基化(红色)或不氧化(黑色)位点的数目。条纹表示仅在辐照样品中检测到的羰基化蛋白和羰基位点。另见附录图S1。B 用质谱法测定了辐照后大肠杆菌(左)和耐辐射奇球菌(右)相对蛋白质丰度变化的B火山图,其生物复制与图2A相同。黑圈点是那些蛋白质的显著变化(配对,双面t检验P值<0.05) >2倍或<0 .5倍。红点是至少检测到一个羰基化肽的蛋白质。考虑意义的折叠变化和P值截断用虚线表示。另见图EV1。
通过基因本体论(GO)生物过程项富集分析和蛋白质丰度校正,对具有实质性相对丰度变化(< 0.5倍或> 2倍)的蛋白质进行了广泛的功能表征。这些蛋白质在大肠杆菌中没有明显的过度或代表不足的GO注释。与此相反,>2倍相对增加的耐辐射奇球菌蛋白被参与翻译和更广泛的蛋白质代谢的蛋白质过度表达(表1),包括许多核糖体亚基。此外,具有<0.5倍变化的耐辐射奇球菌蛋白在氮化合物生物合成中代表性不足,间接地暗示了氨基酸和核苷酸合成的重要性。因此,在氧化应激下,对耐辐射奇球菌蛋白质氧化的抗性优先保护蛋白质组再生的关键过程。
表1 具有高相对丰度变化的耐辐射奇球菌蛋白中富集的基因本体论术语
2. 氨基酸组成保护免受氧化损伤
虽然羰基化RKTP残基的相对频率普遍证实了先前的研究,但我们发现赖氨酸在耐辐射奇球菌(比1.77与1.66)中与γ辐照下的脯氨酸一样容易发生羰基化反应(图3A),在大肠杆菌中的比例较小(比1.17与1.43)。脯氨酸羰基化经常导致多肽自裂解,这可能解释了细菌核糖体蛋白质相对非核糖体蛋白质相对较低的脯氨酸含量,这是一种进化适应,有助于保护翻译免受氧化应激。相反,赖氨酸,被发现更频繁地结合到蛋白质中,缺乏类似的机制在羰基化时自切。
选择性氨基酸组成是一种主要的适应生物,已经进化到在不同的环境生态位中茁壮成长。在允许条件下,大肠杆菌和耐辐射奇球菌表达蛋白质组的组成比较(图3B)显示了可氧化氨基酸之间的显著差异。赖氨酸和精氨酸在生理pH处均带正电荷,ROS敏感性不同,使用差异显著。虽然高敏感赖氨酸被发现在耐辐射奇球菌中的使用频率较低,但较低敏感精氨酸被过度表达(分别为0.71倍和1.57倍)。在这两种物种中,可重复氧化的含硫氨基酸、半胱氨酸和蛋氨酸是罕见的,但在允许条件下(分别为0.53倍和0.17倍),在耐辐射奇球菌中的流行率要低得多)。表面的甲硫氨酸和半胱氨酸有助于保护蛋白质免受许多生物体由于自身可逆氧化而产生的氧化损伤。然而,半胱氨酸和蛋氨酸在代谢上是昂贵的(即化学计量学上消耗最多ATP)用于细菌合成,而耐辐射奇球菌是蛋氨酸的辅助营养物质,这可能解释了它们在生长较慢的耐辐射奇球菌中的流行率明显降低,尽管预期对抗性有好处。色氨酸和酪氨酸是两种代谢不贵的氨基酸,在某些蛋白质中作为综合抗氧化剂发挥作用,在耐辐射奇球菌中比在大肠杆菌中更丰富。
为了评估氧化应激对已鉴定蛋白质中氨基酸患病率的影响,我们比较了大肠杆菌和耐辐射奇球菌γ辐射后氨基酸组成的变化(图EV2)。虽然大肠杆菌中只有7种氨基酸发生了显著变化,但其中16种却发生了显著变化。两种物种的RKPT中最大的下降是赖氨酸,进一步支持结合赖氨酸是γ辐照下蛋白质氧化损伤的重要介质。赖氨酸有时可以在蛋白质中交换组氨酸,并仍然保持蛋白质功能。值得注意的是,相对组氨酸在大肠杆菌中的患病率略有增加(+2%),辐照后耐辐射奇球菌的患病率显著增加(+11%),这表明耐辐射奇球菌已经进化出更多由非碳基组氨酸而不是赖氨酸组成的蛋白质作为另一种蛋白质-内在保护机制。事实上,在这些物种的功能同源物和同工酶序列(附录图S3)中,我们发现耐辐射奇球菌中的组氨酸组成比大肠杆菌中的组氨酸组成大10%,占总组氨酸和赖氨酸的一部分(配对t检验,P< 6×10-60)。照射后,大肠杆菌(+4%)和耐辐射奇球菌(+8%)的酪氨酸患病率显著增加,半胱氨酸仅在耐辐射奇球菌中显著增加(+18%)。大肠埃希菌(-13%)和放射性十二烷(+45%)最显著的下降是蛋氨酸。这一对比表明,在氧化应激条件下,耐辐射奇球菌中存在一种更有效的蛋氨酸亚砜还原酶系统。总之,这些结果证实了蛋白质的内在特性,即使在初级结构中,大肠杆菌和耐辐射奇球菌之间的差异,并影响哪些蛋白质能够承受ROS引起的氧化损伤的冲击。
图3 辐照前后蛋白质组学数据中氨基酸的患病率
A 单个RKPT残基的普遍程度和羰基化形式在实验测量的肽中的普遍程度,结合每个生物体的这两种条件的所有三个生物复制。比例在每对杆上方给出。通过两个比例的双尾z检验(P值<0.01;见材料和方法),每个RKPT与各自的羰基化状态之间的所有比例都有显着性差异,这意味着羰基化比例不是简单地由RKPT的相对流行率决定的。另见附录图S1。B 大肠杆菌和耐辐射奇球菌照射前所有典型氨基酸的流行率,将每种情况下的所有三个生物复制体结合起来。比例在每对杆上方给出。通过两个比例的双尾z检验,物种之间的所有比例都有显着性差异(P值<0.01)。另见图EV1和EV2。
3. 基于结构和序列的模型预测蛋白质对羰基化的脆弱性
(1)基于结构的模板功能工程
本研究的计算阶段(图1B)涉及三维结构的蛋白质组范围推导,以研究导致ROS易感性的分子性质(图4A,表EV3,以及材料和方法)。由于晶体结构的蛋白质组覆盖不完全(耐辐射奇球菌蛋白< 3%),分子特征的计算需要单链蛋白的高通量建模,我们对耐辐射奇球菌进行了新的建模,并使用了已发表的大肠杆菌模型。在图EV3A中总结了通过可用的建模策略来推导耐辐射奇球菌蛋白的挑战。使用多个结构质量指标(附录表S3)从替代方法(附录表S2)中选择每个蛋白质的最佳代表性模型)。通过这些指标,模型通常与耐辐射奇球菌蛋白的晶体结构进行比较评估(图EV3B和表EV4)。获得了>95%的耐辐射奇球菌蛋白(图EV3C)的最有代表性的模型,未来用更高质量的模型或实验确定的结构代替可以提高我们的算法的性能。
作者首次利用三维结构(图4A,表EV3,附录表S4,材料和方法)在多个空间尺度上设计了分子特征来预测羰基化。对所有RKPT的特征进行了计算。这些特征定量地总结了羰基位点的分子环境。局部结构性质的统计摘要被计算为多半径内相邻残基的规范属性值的总和和方法,以解释尺度的梯度。这一特征工程策略使更多的分子性质和空间维度的结合比可能的单独使用序列来表示蛋白质。
(2)结合基于结构和序列的机器学习方法
除了结构衍生的特征外,作者还实现了简单的基于序列对齐的特征工程来预测CS(图4B)。作者在蛋白质组学数据中定义了一个以每个由羰基化肽覆盖的RKPT为中心的局部邻域,并使用对齐评分矩阵作为潜在的预测特征,对这些区域进行了逐对序列比对。这种基于对齐的方法对于特定的序列基序是不可知的,同时仍然利用跨CS的任何有用的局部序列同源性。
将来自羰基化肽的所有RKPT映射到各自的蛋白质结构和序列,以分配羰基化和非碳基化残基。与以前的CS预测工作不同,作者没有假设任何给定的RKPT都是确定性的羰基化的。蛋白质羰基化是一个固有的随机过程。因此,作者采取了一种概率方法,使用了所有的羰基化肽数据,而不考虑位点冗余或发生在一个肽中的羰基化,而在另一个肽中的非碳基化。以前的方法也经常抽样未经修饰的RKPT在所有检测到的肽,无论是否羰基化,以确定阴性的训练。与非碳化肽相比,未修饰的RKPT在另一个残基上含有羰基的肽上更好地代表负数据,因为可以肯定的是,这些分子直接暴露在ROS中,但没有与ROS反应。
图4 特征工程
A 从分子性质的三维特征工程。只能用原子分辨率结构确定的初始性质,在氨基酸序列的上下文中,或仅依赖于氨基酸同一性的初始性质在左边表示。此属性列表是考虑的所有属性的非冗余缩写集(详细信息见附录表S4和材料和方法)。右边特征矩阵的列是在矩阵下面表示的空间尺度上交替的性质和均值。p=a分子性质;I=RKPT残基;K=邻残基;R=半径长度。另见图EV3。B 基于B序列同源性的机器学习特征是通过执行锚定在中心残基上的所有RKPT位点(±10残基)的序列对齐来计算对齐分数,然后通过主成分分析(PCA)将这些特征减少到计算上可管理的数量).
利用基于结构的特征和基于序列的特征,通过Logistic回归训练CS的独立概率估计器,然后将其组合成一个叠加模型。每个独立的模型和堆叠模型都是通过LET-1-OUT验证来评估的,并通过接收机工作特性(ROC)分析来量化它们的性能(图5A来自表EV5和EV6中的数据)。在残差尺度上,作者的叠加模型优于(AUC范数=0.73)其每个基于结构和序列的组件。在训练前洗牌每个特征产生随机性能(AUCnorm=0.54),强烈支持工程特征的预测能力。通过评估模型的性能,以预测蛋白质规模的脆弱性氧化(图5B)通过计算CS富集度量。预测训练集蛋白的羰基化富集与测定的羰基化肽的富集密切相关(SpearmanQ=0.82,置换试验P-值=1.3×1022大肠杆菌和SpearmanQ=0.87,置换试验P-值=7.2和1021耐辐射奇球菌),表明该模型可以预测不同蛋白质物种的相对羰基化倾向。由于优先的敏感性,该模型倾向于预测比实验导出的更高的富集值(大肠杆菌平均为1.9倍,耐辐射奇球菌平均为1.7倍),但考虑到体内羰基化事件的实验采样不足,这些预测的富集值是合理的(图EV1B)。
图5 蛋白质羰基化预测器的多尺度验证
A 残留尺度验证:由离开-1-退出验证导出的CS预测器的接收器操作特性(ROC)曲线。在y=x处的虚线黑线对应于偶然期望的性能。左上角=最后的预测器,由堆叠结构和基于序列的模型训练。顶部中间=预测器只训练于基于结构的特征。右上=预测器只训练基于序列的特征。左下方=概率估计器的理论最大预测能力(AUC=0.98)。底部中间=相同的算法,用于最终预测器,但所有的特征事先洗牌。右下角=CSPD模型是利用来自大肠杆菌的金属催化氧化(MCO)位点数据建立的。另见图EV3和EV4。B 蛋白质规模验证:预测的CS富集从离开验证到CS富集之间的比较,从所有的羰基化肽测量的大肠杆菌(左)和耐辐射奇球菌(右)。每个点代表不同的蛋白质种类。预测概率加权CS富集=(训练集位点的羰基化概率之和)/(实验中相应肽中的残基数)。实验测量概率加权CS富集=(跨越训练集点的经验氧化概率之和)/(实验中相应肽中的残基数)。实线为拟合回归线,虚线表示95%置信区间的边界。
(3)分子特性解释了羰基化的脆弱性
虽然我们在建模中包含了400个基于结构的特征,但仅有7个Logistic回归系数为非零:与ROS(reactivity_res)的相对反应性、密码子多样性、RKPT位点是否为苏氨酸残基、分子体积、局部溶剂可达比表面积、局部正电荷和局部赖氨酸残基。密码子多样性本身不太可能是因果关系。相反,从实验(图3A)来看,这一特征与耐辐射奇球菌中羰基化流行率具有相同的等级顺序,因此γ特异性反应性的偶然代理。苏氨酸是目前为止两种物种中RKPT最不频繁的羰基化反应(图3A),在模型中包含这一特征(Thr_res)反映了这种与ROS反应的较低倾向。
除了区分RKPT的反应性特征外,从三维结构导出的ROS敏感性的所有其他解释特性(图6)。易获得ROS促进羰基化(图6A)。残基的分子体积越低,由于较低的空间效应,它就越有可能与ROS反应。同样,较低的局部比表面积周围的近表面部位表明较少的可能性屏蔽周围的结构,如图6D的突出。局部正电荷通过吸引带负电荷的超氧自由基来促进羰基化(图6B)。高度反应位点的共定位可能导致进行性蛋白错折叠,使邻近残基暴露于ROS(图6C)。在作者的模型中,相邻的赖氨酸残基有助于羰基化的概率,在数据中,赖氨酸是γ辐照下最常见的羰基化RKPT(图3A)。极性导致富含赖氨酸区域的溶解度也可能有助于这一效应。没有相邻赖氨酸的位点不太可能被羰基化(图6D)。
图6 分子特性预测蛋白质易受羰基化的影响。
A-D示例容易发生羰基化的部位。(A)DRA0302_P252、(B)DR0099_P51和(C)b0911_K411;以及示例成熟站点(D)b3313_P69。B-数据信息:显示了中心RKPT侧链的所有原子,羰基原子位置为红色(预测和测量羰基化)或黑色(预测和测量不氧化),并标记为含有氨基酸的1字母代码。在8A范围内的正(蓝色)和负(粉红色)电荷被标记。可羰基赖氨酸位点(紫色)在8A内被标记。中心CS5A内的分子表面为深灰色。另见图EV3。
(4)我们的算法还扩展到金属催化氧化的预测
作者应用开发的羰基化位点和蛋白质检测(CSPD)来预测训练集的CS(图5A)。数据的CSPD性能基本上是随机的(AUC范数=0.53)。值得注意的是,CSPD是利用金属催化氧化(MCO)数据开发的,该数据来自一组23个羰基化大肠杆菌蛋白质,这些蛋白质来自于在与作者的阴性对照相似的条件下制备的样品。然而,当在收获指数相细胞后将样品保存在冰上时,研究人员没有报告他们的样品有任何类似的温度处理。这样,在较高的温度下制备的样品允许蛋白质的合成和周转,这将导致比作者测量的更少的可检测的羰基化蛋白质。此外,以前的研究人员进行了2D-SDS-PAGE检测,只切除了标记为羰基化的可见斑点,这可能进一步限制了从样本中鉴定出的不同羰基化蛋白质的数量。总之,作者在大肠杆菌阴性对照中鉴定了82种羰基化蛋白,其中10种与以前的研究人员的数据相同。由于CSPD无法从γ辐照推广到羰基化,部分原因可能是上述实验差异,以及每个特定来源的ROS的影响不同。因此,为了更直接地比较算法性能,作者还使用算法制作了一个模型,使用相同的氧化还原蛋白质组学数据来预测MCO,用于开发CSPD(图EV4)。在这个数据集上,CSPD表现出适度的正性能(AUCnorm=0.58),由于作者将所有羰基化肽与上述定义的羰基化和非碳基化残基结合在一起,与先前报道的性能存在差异。因此得出结论,CSPD与MCO数据过度拟合,依赖于确定性蛋白质羰基化的假设和蛋白质组学数据中定义非碳化残基的较少严格的标准。
此外,MCO预测叠加模型(AUC范数=0.75)优于γ诱导氧化模型,在叠加结构-(AUC范数=0.72)和基于序列的(AUC范数=0.67)模型方面具有更好的协同作用。这种性能差异可能是由于MCO的产物相对少的多样化,而不是γ诱导的氧化。在MCO中产生ROS更局部化,由于它依赖于Fe或Cu离子的存在来驱动反应,因此影响比γ诱导的氧化更少的蛋白质。事实上,来自γ辐射实验的数据不仅包括来自水辐射分解的ROS引起的CS,而且还包括由于天然ROS来源引起的基础细胞氧化:包括MCO和细胞呼吸。因此,γ辐照氧化比MCO更多样化和复杂,对学习结构和序列更具挑战性。
4. 种内和种间蛋白质易受羰基化影响的差异
(1)耐辐射奇球菌蛋白质组的维持是保护不受羰基化
用未加权羰基化富集法(图7和表EV7)比较了大肠杆菌和耐辐射奇球菌之间的同源和同工酶(附录图S3),并根据大肠杆菌和耐辐射奇球菌的蛋白质组范围CS预测计算了它们的未加权羰基化富集(图7和表EV7),以揭示这些蛋白质组之间和内部不同的功能类别和单个蛋白质。参与抵抗和恢复氧化应激的功能类包括:核糖体、核糖体组装、翻译、蛋白质伴侣、蛋白酶和肽酶、氨基酸和肽转运、DNA修复、DNA损伤反应和修复调节、天然ROS产生、ROS解毒、ROS反应、金属转运、萜类化合物合成和聚胺积累。
根据蛋白质-内在和外在因素对它们的羰基化倾向进行了比较(图7)。垂直距离y=x对角线表示相对程度,在相同的ROS用量的情况下,一个同系物在本质上是敏感的,仅在羰基化富集的基础上。蛋白质-外在因素,如耐辐射奇球菌中的Mn依赖清除系统和抗氧化类胡萝卜素除黄素,也有助于蛋白质氧化的物种间差异。这种蛋白质外在因素通过减少活性氧的有效细胞剂量而起着广泛的作用。急性γ剂量为7kGy,与本研究大致相同,由于透析可去除的小分子,大肠杆菌裂解液中的蛋白质羰基约为耐辐射奇球菌(材料和方法)的3.78倍。假设这些因素在不利于特定蛋白质保护的情况下在全球范围内发挥作用,这些外部因素区分正源之间羰基化的脆弱性的程度可以通过计算垂直距离y=x/3.78对角线来结合蛋白质-内在因素来模拟(图7)。通过这个模型,特别是易感蛋白更多地受益于有效地降低剂量的ROS在耐辐射奇球菌中。
在特定的功能类别中,大肠杆菌和耐辐射奇球菌对ROS的相对脆弱性不同(图7)。作者预测大肠杆菌核糖体蛋白的内在易感性比所有同源物(未配对t检验P值=0.01)大2.4倍以上)。考虑到外源性ROS的保护,预测核糖体蛋白是大肠杆菌中最受欢迎的功能类(1.5倍,未配对的t检验P-值=1.2×1026),这与辐射后相对丰度增加的核糖体蛋白中核糖体蛋白富集一致。大肠杆菌中的蛋白伴侣平均比耐辐射奇球菌(未配对t检验P值=0.02)更易受到伤害,这一差异因大于所有正向生物的差异而进一步区分(未配对t检验P值=0.003),以及在考虑外部保护时(未配对t检验P值=0.02)更大1.14倍)。.参与多胺合成和摄取的大肠杆菌蛋白被预测比所有同源物(未配对t检验Pvalue=0.04)具有超过3.7倍的内在脆弱性。通过观察到蛋氨酸在辐照后保留的耐辐射奇球菌蛋白中的使用占显著地位,作者预测,甲硫氨酸亚砜还原酶作用于蛋白结合的蛋氨酸MSRB和MSRP对大肠杆菌羰基化的本质敏感性都是1.4倍。在耐辐射奇球菌的外部保护中,MSRP也在第94百分位。
图7 预测蛋白质易受羰基化影响的物种间比较
每个圆圈代表物种之间不同的蛋白质对(同源或同工酶)。每个图显示相同的点值,但突出了与氧化应激相关的不同功能类别的蛋白质。y=x对角线是比较同源物之间羰基化的内在脆弱性的参考。y=x/3.78对角线是比较同系物之间内在和外在羰基化性质的参考。椭圆虚线包围在平均坐标的3个标准差和参考线y=x距离的3个标准差内的点,包括~91%的所有数据点。这个参考区域区分了远离主要种群的离群点。与氧化应激过敏相关的实验证据的异常者被标记为他们的蛋白质名称。另见附录图S3和图EV5。
、
(2)物种间异常值的比较揭示了参与氧化应激抵抗的蛋白质
预测的内在羰基化脆弱性中的不异常值(图7)。有111个同源对大于3个标准差的距离分布的平均值或大于3个标准差远离平均垂直距离的y=x对角线。我们根据三个特性对这些异常值进行了分组:(1)与蛋白质组的其余部分相比,具有内在的敏感性或鲁棒性;(2)耐辐射奇球菌与大肠杆菌之间的比较内在脆弱性;(3)ROS解毒在大肠杆菌上的相对作用(图EV5)。
根据上述三种特性,预测相对于大肠杆菌而言,耐辐射奇球菌中具有明显更本质或额外保护作用的蛋白质分为三组。第一组蛋白质预测高度羰基化倾向,但耐辐射奇球菌比大肠杆菌更易受到本质上和外在上的保护。平均而言,这12种蛋白质在大肠杆菌中的CS富集量是大肠杆菌的1.4倍,在耐辐射奇球菌的外部保护中高于第99百分位数。蛋白质组学在两种生物中检测到的10种蛋白质中,有8种细菌在大肠杆菌中的负γ诱导相对丰度变化比耐辐射奇球菌更大,大肠杆菌与耐辐射奇球菌的比例中位数为0.47。核糖体亚单位由11种蛋白质组成,其中8种在大肠杆菌中是必需的。大肠杆菌rpmI基因敲除对氧化应激过敏。过表达rpmG增加了丝裂霉素C对氧化应激的抗性,GroS过表达减少了蛋白质羰基的积累。其中7种蛋白质在放射性十二烷中表现出氧化应激诱导的表达。第2组蛋白在这两个物种中被预测为类似的内在羰基化倾向,但在耐辐射双歧杆菌中具有明显的外源保护作用。平均而言,这22种蛋白质在耐辐射奇球菌的外在保护中高于第86百分位。在蛋白质组学检测到的两种生物中的13种蛋白质中,有11种显示出更积极的r诱导的耐辐射奇球菌相对丰度变化。在这一组中,13种蛋白质是核糖体亚基。在大肠杆菌中,PSTS基因敲除对氧化应激过敏,RPSL突变体已被证明影响氧化应激耐受性,其他13个是必需基因。在耐辐射奇球菌中,RPSS和HUPA敲除对氧化应激非常敏感,并且在氧化应激过程中发生RPSS、RPST、RplQ、RPSM、RpmB、RPLK、RPSL、THPRPR、RpmE、NRDH、RplR、RPLV和RPSR的过表达。预测3组蛋白对大肠杆菌羰基化反应的敏感性明显高于对耐辐射奇球菌。平均而言,这27种蛋白质在大肠杆菌中的CS富集量是大肠杆菌的1.9倍,在耐辐射奇球菌中的外源性保护水平超过了95。在大肠杆菌中,rpmF和ICD敲除对氧化应激过敏,OSMY也参与氧化应激抵抗。在耐辐射奇球菌中,XSEB基因敲除对氧化应激非常敏感,ADK、ICD、malE、OSMC、PPIA、RPLB、rpmC、RPSC和YceI在氧化应激下高度表达。这些组的蛋白质对羰基化较高的抗性使耐辐射奇球菌有别于大肠杆菌,并描述了可提高大肠杆菌抗逆性的转基因。
未预测的物种间异常值明显更能保护耐辐射奇球菌中的ROS,分为两组。第4组蛋白质被预测为对两种物种的羰基化具有高度内在的鲁棒性,因此不能从耐辐射奇球菌的外部保护中获得实质性的好处。在这五种蛋白质中,有三种在大肠杆菌中更易受到本质上的伤害,包括在大肠杆菌中必不可少的SECE和FDX,FDX在耐辐射奇球菌的氧化应激下高度表达。据预测,5组蛋白在本质上比在大肠杆菌中更容易受到脱氧核糖核酸化的影响。这14种功能多样的蛋白质包括三个已知的氧化应激-超敏基因敲除突变体;然而,在图7中,除了2之外,所有蛋白质仍然位于y=x/3.78之上,这表明外部保护仍然可以补偿这些物种之间的内在脆弱性差异。
讨论
在这项研究中,我们成功地开发了一种高度整合的系统生物学方法,预测氧化应激的蛋白质靶点,并在跨越氨基酸残基、蛋白质分子和蛋白质功能类的多个生物尺度上为细胞表型提供机械解释。这是蛋白质氧化预测技术发展的一个重大进展,也是该领域现如今的需要。作者提供了广泛的证据来证实蛋白质的内在特性导致蛋白质氧化速率的差异的理论,并通过参与细菌反应表型的关键蛋白质的功能影响对氧化应激的脆弱性。多条证据支持核糖体蛋白对ROS的敏感性与蛋白质组的其余部分有很强的区别,并在辐射抗性中起着关键作用-并通过类比也起到干燥耐受性的作用。此外,结果不仅鉴定了氧化蛋白,而且还表征了羰基化精确位点的解释分子性质,提供了比以前的研究更精细的分子性质的分析,导致差异蛋白氧化。
最近的一项研究报告了大肠杆菌和耐辐射奇球菌电离辐射下的蛋白质氧化产物。与作者报道的结果相比,研究人员进行了五个重复的实验,确定了更多但数量相似的肽和蛋白质。与作者的结果一样,他们的结果确定了一个相对较小的肽含有氧化产物,并且12%的肽的丰度变化大多较小。虽然有一些类似的发现,但作者的研究在几个重要方面与之前的研究人员的研究结果不同。在辐照处理中,作者用电子束直线加速器照射的辐射比它们的1kGy大7倍,这可能导致了在本研究中通过水辐射分解产生更高的ROS。重要的是,以前的研究人员既没有在他们的搜索数据库中包括赖氨酸、脯氨酸或苏氨酸残基的羰基化,也没有对这些不稳定的氧化产物进行任何稳定的衍生化。因此,他们的数据很可能低估了实际的羰基化事件。只使用相对绝对质量(RAM)广泛分析了ROS靶向的蛋白质的特异性,并得出结论,靶理论并没有完全解释这种特异性(即蛋白质由于其相对大小和丰度而在ROS易感性上存在差异)。本文研究的主要目标之一是利用机器学习模型,通过ROS确定羰基化蛋白和位点特异性的分子性质。
作者的模型表明,蛋白质内在特性和全球ROS解毒的结合意味着抗耐辐射奇球菌氧化应激的重要蛋白质,并解释了照射后相对丰度变化的靶向模式,这些变化在大肠杆菌中是不可观察到的。通过多种机制来防止ROS的产生,在像耐辐射奇球菌这样的空气中,干燥耐受性的与大肠杆菌这样的兼性厌氧菌形成了鲜明的对比。与在缺氧环境中进化的厌氧祖先细菌相比,这种对比可能更极端,因此理论上不会面临来自高ROS条件的选择性压力,从而进化出这种保护机制。因此,作者怀疑适应,如内在保护蛋白质免受ROS是相对罕见的,可能是不太普遍的厌氧菌。
那些被预测主要依靠内在特性来避免羰基化的耐辐射奇球菌蛋白是对更敏感物种产生抗性的候选转基因。氨基酸的使用,区分D.弧度与大肠杆菌和分子性质预测蛋白质羰基化包括一套设计原则,在合成蛋白质工程工作时可用于控制ROS耐受性。作者建立的分析策略不仅可以应用于其他系统中氧化应激的研究(如人类疾病、衰老和载人航天探索),还可以应用于其他形式的翻译后修饰,更广泛地应用于蛋白质的分子性质,扩展和丰富蛋白质组学分析。