单细胞蛋白质组学| DO-MS
技术背景
今天介绍的技术方法来源于DO-MS: Data-Driven Optimization of Mass Spectrometry Methods 这篇文章,发表于2019年9月11日的Journal of Proteome Research(蛋白质组研究期刊)。液相色谱-串联质谱法(LS-MS/MS)的蛋白质定量结果取决于一系列相关的参数,而参数之间的相关性对解决LS-MS/MS中的特定问题提出了挑战。DO-MS是针对于单细胞蛋白质定量过程中优化参数的工具方法,并能够诊断定量过程中出现的问题并提出相应的解决方案。这篇文章的作者团队同样也开发了基于LS-MS/MS的单细胞蛋白质定量方法SCoPE-MS(见单细胞蛋白质组学| ScoPE-MS)。关于DO-MS的详细介绍,可以进入官网https://do-ms.slavovlab.net/
介绍
通过结合液相色谱法和串联质谱法的技术方法(LS-MS/MS)能有效识别和定量生物体中大量的蛋白质。近年来,LS-MS/MS的研究取得了新的突破。LS-MS/MS不仅能够分析蛋白质复合物的功能、蛋白质合成的调控、RNA的选择性翻译、血液中的稀有细胞、蛋白质的构象等生物学问题,而且在灵敏度、通量、鲁棒性等方面的提高保证了其具有同时对几千个细胞定量几千种蛋白质的能力。
尽管LS-MS/MS的蛋白质定量方法是非常有效的,这种方法需要对仪器中设定的一些相关的参数进行最优化。最优化这一步骤对于定量单细胞蛋白质或者外泌体这样的低输入量样本是很关键的。对于LS-MS/MS的优化过程和质控环节通常是在质谱仪的软件或者其他的指定软件中人为地对参数进行调整。但是这几种工具并不能够对SCoPE-MS的分析提供所有需要的指标。因此,作者团队开发了优化LC-MS/MS参数的模块化和交互式工具DO-MS。DO-MS同样也可以对定量中的问题进行诊断并提出相应的解决方案。
技术原理和功能
LC-MS/MS方法希望在洗脱图谱中肽的峰值处进行提取肽分子,因为这样的提取方式能够最大化提取肽的数量和纯度。尽管现在并没有方法能够准确定位肽的峰值,但可以通过优化仪器中设定的参数,从而最大化进入串联质谱分析的肽的比例或者能够尽量使提取的位置接近肽的峰值。例如,DO-MS利用MaxQuant进行估计,通过可视化距离峰值的偏移长度的分布实现优化过程(图a-c)。
图a-c分别比较了肽积聚时间不同对MS得到的肽分子数目造成的影响。在图a中由于肽积聚的时间过短,要比到达肽的峰值处相对较早。肽积聚时间在1000ms时相比于250ms和500ms,更接近肽峰值的时间点。在图b和图c中,由于500ms和1000ms中肽积聚的时间更充分,因此可识别肽段的比例显著高于250ms。
作者通过这个例子能够说明肽积聚的时间较长时,能够有效提高低丰度样本中进入质谱分析中可识别肽段的数量,同时积聚时间是影响肽峰值定位的重要因素。
在蛋白质样本中含有非蛋白质的污染物是非常普遍的。最好的情况是污染物的丰度很低,并能够在洗脱过程中与肽段进行分离,但也会遇到丰度高,不能在洗脱过程中与肽段进行分离的情况。低输入量样本对样本中的污染更加敏感。DO-MS能够帮助区分样本中的污染成分和蛋白质,同时也能帮助使用者区分亲水性污染物和疏水性污染物。DO-MS能够清楚地反映污染分子的密度和可识别肽之间的潜在关系。(图a-d)
例如a、b图中反映的是样本1和样本2中污染物和蛋白质的前体强度的分布。样本2中能检测到污染物的含量更高,而能检测到的肽分子的数目更少。图c反映的是通过电荷态检测到样本1与样本2中污染物和蛋白质的数量,电荷态等于1时接近为污染物,大于1时接近为蛋白质。图d评估了样本中的污染物对肽识别产生的影响。
虽然数据分布的统计包含的信息量相比于常规的分析总结更多,但是对比不同样本之间的数据分布结果可能具有误导性。因此,当对比由DO-MS产生的分布图时,控制每个样本数据分布的组成是极其关键的。
图a-b反映的是验证钙添加剂对胰蛋白酶消化作用产生影响的对比试验,样本2中添加了Cacl2试剂。图a的结果似乎能够表明样本1能够更有效地将肽段传递到质谱分析仪器中,添加CaCl2不利于酶的消化作用。但是这种对比受到了样本之间肽谱匹配差异的影响,因此对比需要建立在共同肽段的基础上,所以得到的结论是相反的:添加CaCl2有利于酶的消化作用。
在研发SCoPE-MS和mPOP的过程中,作者团队发现了一系列帮助诊断SCoPE-MS样品问题和对低输入量样品的仪器参数进行优化的指标。图a-b是两个通过指标对问题进行诊断的例子。RI(报告离子)的强度分布含有很高的信息量。低强度的RI可能是由于错误的细胞分离、消化、标记所导致的,RI的强度过高与污染和交叉标记有关。而SCoPE-MS的定量准确度可以通过比较载体通道和单细胞通道定量结果的相关性进行评估。
总结
这个技术方法是作者团队在SCoPE-MS后发表的一篇优化SCoPE-MS仪器设定的参数,并从数据对问题进行诊断的一篇文章。技术方法涉及的相关代码已经发布在Github上:https://github.com/SlavovLab/DO-MS,这个方法同样也是基于本地的Rshiny平台搭建的软件工具。
选择这篇文章的目的是这种方法贯穿了作者之后发表的一系列单细胞蛋白质定量技术的相关文章,尤其是去年刚发布的SCoPE2也应用了这种技术方法。这个软件并没有涉及比较复杂的算法,主要是通过结合生物学问题和数据分布特征对问题进行分析的。