科研 | 中国科学院:使用分子动力学辅助筛选离子液体以作为深层次蛋白质分析的萃取剂(国人佳作)
编译:阿昊,编辑:Emma、江舜尧。
原创微文,欢迎转发转载。
蛋白质组学的深入研究有助于加深对蛋白质功能的认识。不幸的是,许多在信号网络中起关键作用的高疏水性蛋白质和低丰度蛋白质在样品制备过程中很容易丢失,这主要是由于极少数萃取剂能同时满足对膜蛋白溶解能力强和酶相容性好的要求。因此,从庞大的化合物库中快速、有效地筛选出理想的萃取剂已迫在眉睫。本文通过研究萃取剂对膜蛋白溶解和胰蛋白酶相容性的内在机理,建立了一个分子动力学模拟系统,进而缩小了蛋白质组学分析时离子萃取液体的候选范围。模拟结果表明,离子液体中阳离子基团与膜蛋白之间的范德华作用力是决定蛋白质增溶的主导因素。结合实验数据,1-十二烷基-3-甲基咪唑氯化物(C12Im-Cl)入选了候选名单。鉴于C12Im-Cl的优点,研究者提出了一种基于C12Im-Cl的样品制备方法(i-FASP),利用这种方法,在一次实验中从103个HeLa细胞(∼100ng蛋白质)中成功地鉴定出3300个蛋白质,比传统的FASP方法提高了53%。进一步成功地将i-FASP法应用于人肝癌及癌旁组织的无标记相对定量,其准确度、重现性和覆盖率均明显优于常用的FASP法。以上结果表明,i-FASP方法可以作为生物样品的深度覆盖蛋白质组学分析的通用工具。
论文ID
实验设计
实验结果
1.离子液体筛选及模拟
为了从众多的化学试剂中筛选出一种理想的萃取剂,在实验前建立一个有效的平台来缩小候选范围是至关重要的。研究者利用分子动力学(MD)系统,模拟了小分子与蛋白质之间的相互作用,阐明了萃取剂对膜蛋白溶解和胰蛋白酶生物相容性的内在机理。由于研究者之前的蛋白质组学研究中发现几种离子液体具有很好的性能,因此将通过独立选择阳离子和阴离子基团应用于模拟系统中,以筛选出候选萃取剂。
结果表明,BR(bacteriorhodopsin)与CnIm-Cl之间的相互作用能随着烷基侧链长度的增加而增强,但在C12Im-Cl处达到平衡。通过评估基于CnIm的ILs(several ionic liquids)和其他常用阴离子基团进一步证明了这一规律。模拟结果表明,BR和C12Im基离子液体与不同阴离子基团的相互作用力无明显差异。然而,由于CnIm-Br和CnIm-BF4的水溶性随着烷基侧链长度的增加而急剧恶化,因此含有Cl-和ILS更适合作为蛋白质组分析的萃取剂。
结合以上结果和研究者之前的实验结果,C12Im-Cl被列入对膜蛋白具有强溶解能力的理想萃取剂的候选名单。以十二烷基硫酸钠(SDS)作为模拟系统的参考,SDS是目前公认的最强的洗涤剂之一,具有很高的溶解能力。结果发现,与C12Im Cl和BR之间的紧密相互作用(图1a)相比,SDS和BR的互作能力小得多(图1b),这与研究者之前的结果一致,SDS比C12Im-Cl具有相对较弱的溶解能力。进一步研究MD模拟在蛋白质提取剂预筛选中的性能,1-丁基-3-甲基咪唑硫氰酸盐(C4Im-SCN)是一种离子液体,在实验中可以非常有效地提取蛋白质,研究者对其进行了MD模拟,结果表明,C4Im-SCN与BR的相互作用力远小于C12Im-Cl。为了揭示C12Im-Cl高效增溶膜蛋白的机理,比较了不同作用力对总能量的贡献。如图1a所示,BR-C12Im-Cl体系的构象表明,吸附在BR表面的是烷基链,而不是C12Im-Cl的阳离子环,C12Im-Cl主要与膜蛋白的疏水氨基酸残基结合(图1c)。因此,C12Im-Cl具有较强的疏水相互作用,可以有效地溶解膜蛋白。
作为两个独立的事件,模拟结果与实验数据完全吻合,说明分子动力学模拟系统可以作为筛选蛋白质组分析最佳萃取剂实验程序的重要补充。
图1 细菌视紫红质(BR)萃取剂构象模拟系统
BR表面与(a)C12Im-Cl阳离子基团或(b)SDS阴离子基团之间的吸附情况;(c)C12Im-Cl与BR表面的结合位点。BR呈紫色,C12Im-Cl呈青色,SDS呈灰色。
2. i-FASP法的建立
基于C12Im-Cl在膜蛋白溶解和胰蛋白酶生物相容性方面的优越性,本研究将C12Im-Cl用于大量样品膜蛋白的分析。然而,C12Im-Cl被强阳离子交换去除,导致样品丢失,这限制了其在微量样品和蛋白质组学深度覆盖分析中的应用。在每一个步骤中,研究者都建立了一种基于离子液体的过滤辅助样品制备方法(i-FASP)来实现这项工作中的深入蛋白质组分析(图2a)。以1×106个HeLa细胞为样本,用含C12Im-Cl的裂解缓冲液在95℃下对细胞进行裂解并提取蛋白质,研究者观察到提取的蛋白质浓度随着C12Im-Cl浓度的增加而增加(图2b)。选择含10%(w/v)的C12Im-Cl作为最佳体系(图2c)。
随后,原位烷基化、脱盐和消化被集成在一个截止分子量为10kda的过滤器上。与传统的以SDS为萃取剂的FASP法不同,C12Im-Cl/胰蛋白酶溶液具有良好的相容性,不需要重复洗涤步骤,在10 mM NH4HCO3中用胰蛋白酶过滤消化后,用等体积的水洗脱残余肽,无需额外的脱盐步骤进行肽纯化。因此,相对于FASP,样品制备时间可缩短约4小时(图2d)。为了进一步证实i-FASP的潜能,研究者对1×106个HeLa细胞进行了蛋白质组定性分析。首先,测定了残留C12Im-Cl在LC-MS/MS上的保留行为,以评价C12Im-Cl与MS分析的相容性。洗脱残留的C12Im-Cl,直到流动相由80% ACN(v/v)组成,对肽的鉴定没有负面影响。
图2 i-FASP方法的性能评价
(a) i-FASP方法流程图。(b)C12Im-Cl浓度对蛋白质提取的影响。(c)三种萃取剂提取蛋白质效率的比较。(d)i-FASP(实线)和FASP(虚线)法样品制备时间的比较。
总的来说,i-FASP方法鉴定了3339个蛋白质,与FASP方法(图3a)相比提高了21.6%,并且用i-FASP方法检测了87%的蛋白质。此外,i-FASP方法在生物三倍体中获得了81.0%的高重复性,与通过FASP方法获得的79.6%的重复性相比(图3b)。
令人印象深刻的是,i-FASP法鉴定出的含有缺失裂解位点的肽的百分比为12.7±0.3%(n=3),是FASP法(27.5±0.8%)的两倍。随后,对所鉴定肽的亲水性进行了研究,与FASP方法相比,使用i-FASP方法(如图3c所示)。图3d中所示的散点图表明,许多更大和更基本的肽仅由i-FASP鉴定。C12Im-Cl加合可能会导致质子转移的降低,这将在研究者今后的工作中进一步研究。此外,i-FASP和FASP方法的蛋白质回收率通过使用25µg的BSA作为标准蛋白来测量,并且根据先前的工作通过紫外检测(214 nm)对产生的胰蛋白酶进行定量。结果,FASP法的回收率为66±1%(n=4),远低于i-FASP法的90±5%(n=4)。此外,在不同的起始样品量下,i-FASP方法的回收率在80%到100%之间。这可能是因为残留的C12Im-Cl有利于减少蛋白质和肽的非特异性吸附。
为了进一步研究所开发的样品制备方法的性能,分别用i-FASP和溶液消化法处理C12Im-Cl从HeLa细胞中提取的蛋白质。由于原位处理的样品损失较低, i-FASP法的蛋白质鉴定提高了35%,并且用i-FASP方法检测了82%的蛋白质。与溶液法相比,i-FASP法具有更高的重复性。预计由于超滤装置在蛋白酶消化前去除了杂质,i-FASP法鉴定的肽中有6.1%的缺失裂解位点,而溶液中消化法得到的肽只有68.3%被完全消化。
以上结果表明,i-FASP方法可以对疏水性和亲水性蛋白质进行分析,回收率高。新方法具有三种优势,一是高浓度下C12Im-Cl对疏水性蛋白质有很好的溶解能力;二是引入超滤装置后,大部分C12Im-Cl被NH4HCO3洗涤耗尽,最大限度地减少了剧烈洗涤造成的样品损失;第三,由于少量的C12Im-Cl具有酶友好性,样品中残留的萃取剂有助于使疏水性蛋白质在旋转柱表面均匀分布,确保其暴露于酶消化条件下。
图3 106个HeLa细胞的定性蛋白质组分析结果
(a)用i-FASP和FASP方法鉴定的蛋白质重叠,和(b)用i-FASP方法鉴定的生物三倍体蛋白质的重叠。(c)GRAVY值和的分布。(d)i-FASP特异性肽(diamond)、FASP特异性肽(round)和共享肽(circle)的分子量(Mw)与等电点(pI)。
3. 微量细胞样品的定性蛋白质组分析
微量细胞蛋白质组学是生物学和临床领域的重要研究课题,由于样品制备繁琐,对微量样品进行深度覆盖的蛋白质组分析仍然很困难。基于其良好的性能,将i-FASP方法应用于1000个HeLa细胞的蛋白质分析,在样品制备1h和RPLC-MS/MS分析后5h内,可鉴定出20528±226个肽,对应3329±41个蛋白质(n=3),较FASP鉴定的数量(10613±310肽,对应2173±26个蛋白质,n=3)有明显提高。用i-FASP制备的103个HeLa细胞样品中鉴定出的蛋白质丰度约为5.9个数量级,比FASP的4.8个数量级高。
另外,近90%的FASP方法鉴定的蛋白质被i-FASP方法所覆盖(图4a,b),利用DAVID软件研究了所鉴定蛋白的细胞组分分布和生物学功能。用i-FASP法鉴定的蛋白质中,有963种被鉴定为膜蛋白,其中32.1%的蛋白质具有一个以上的跨膜结构域(TMD)。而在FASP法中,只有741种被鉴定为膜蛋白,其中26.7%的蛋白质被认为具有≥2个TMDs(图4c)。由于其高疏水性,很难用FASP方法提取和鉴定膜包埋肽,例如,跨膜蛋白14C(GN:TMEM14C)是一种4-TM蛋白,由于其MEPs的高比例,无法用FASP方法进行鉴定,而用i-FASP方法可获得高达67%的序列覆盖率(图4d)。如图4e所示,大多数高丰度蛋白质,如细胞骨架蛋白波形蛋白(基因名:VIM)通过i-FASP和FASP方法成功地鉴定出来。然而,对于中间蛋白和低丰度蛋白,用FASP方法进行唯一鉴定的只有少数,而用i-FASP方法进行唯一鉴定的蛋白质数量至少是后者的三倍,包括极低丰度的蛋白质。用DAVID软件分析了用i-FASP方法鉴定的蛋白质的细胞成分,低丰度蛋白质大部分被划分为细胞质、细胞核、质膜、膜和胞外体蛋白,而高丰度蛋白质的亚细胞器顶端属于细胞核、细胞质、胞外体和线粒体(图4e)。以上结果证明了i-FASP预处理高疏水性和低丰度蛋白质的优越性,有利于提高蛋白质组分析的覆盖率。
图4 103个HeLa细胞的蛋白质组定性分析结果
比较用i-FASP和FASP方法制备的1000个细胞样本中常见蛋白质的序列覆盖率(a)和丰度(b);****用双尾Wilcoxon检验,i-FASP和FASP方法之间p<0.0001。用i-FASP和FASP方法制备的1000个细胞样品中,检测了(c)跨膜结构域(TMDs)、膜包埋肽(MEPs)和(e)拷贝数的分布。此外,(d)TMEM14C的拓扑结构,包括用i-FASP方法鉴定的四种MEP(红色标记氨基酸),如插图所示。(e)用i-FASP方法鉴定的高丰度、中丰度和低丰度蛋白质的细胞组分分布如插图所示。
4.人肝癌组织蛋白质组的无标记定量分析
Label free定量分析方法具有覆盖面广、操作简便等特点,广泛应用于不同样品的分析。然而,它对蛋白质鉴定的高重复性和灵敏度要求极高。基于i-FASP方法在蛋白质组定性分析方面的优越性,将其应用于人肝癌组织的无标记定量蛋白质组分析。与细胞和其他组织样品相比,人肝组织中高脂肪含量(5-10%)会严重影响随后的胰蛋白酶消化和LC-MS/MS分析,尤其是肿瘤组织。在传统的去脂方法中,从富含脂肪的组织中提取的蛋白质通常用丙酮沉淀,造成严重的样品损失。
在研究者的i-FASP法中,用甲醇、乙醇和异丙醇等体积的NH4HCO3作为洗涤缓冲液,在C12Im-Cl去除过程中去除油脂。在蛋白质鉴定性能良好的基础上,选择甲醇与等体积的NH4HCO3混合作为最佳洗涤缓冲液。用i-FASP法对人肝癌进行处理。作为对照,同样数量的样品采用FASP法进行处理。总的来说,i-FASP法从肝癌组织中平均鉴定出7176个蛋白质(对应56492个肽),与用FASP法鉴定的蛋白质和肽数相比增加了6%和16%。
此外,i-FASP方法获得了重复实验之间较高的Pearson相关系数,证明了该方法的良好重现性。这些结果可归因于i-FASP法的消化效率提高和操作简便,用i-FASP方法获得更广的覆盖范围和更好的重复性是实现基于MS/MS的无标记蛋白质组定量方法高准确度和精密度的先决条件。通过i-FASP和改良的FASP方法在所有三个重复中量化的蛋白质分别接受Benjamini-Hochberg(BH)FDR评估,而那些通过1%BHFDR阈值的蛋白质被保留在火山图中(图5a),共有4352个和3946个蛋白质分别用i-FASP和m-FASP方法定量。据研究者所知,这是目前最大的肝细胞癌的定量蛋白质组数据集。基因本体(GO)分析表明,虽然与细胞粘附、mRNA剪接和细胞核tRNA输出等生物过程相关的蛋白质上调,但参与线粒体功能相关的生物过程的蛋白质如氧化还原过程、电子传递和三羧酸循环下调(图5b)。癌细胞中细胞核和线粒体调节功能的差异可能是由于线粒体有独立于细胞核的基因组系统,它们有自己的转录、翻译和蛋白质组装机制。考虑到线粒体电子传递系统通过重新改变癌细胞中生物能量向糖酵解作用,有助于癌细胞的代谢重构,研究者的分析结果提出了一种可能性,即线粒体电子传递障碍可能是肝癌发生的部分原因。
有趣的是,通过使用STRING软件,发现大多数蛋白(未报道与肿瘤相关)与癌细胞相关蛋白密切相关,得分最高的两个网络是动脉硬化和肝脏炎症。预测的调控因子包括C-C趋化因子受体(CCR2)、过氧化物酶体增殖物激活受体γ-辅酶激活因子(PPARGC1A)、核受体(NR1I3)和过氧化物酶体酰基辅酶A氧化酶(ACOX1)可能是肝癌的生物标志物候选物,但在未来的研究中还需要进一步的生物学验证。
图5 人肝组织游离蛋白质组定量分析
(a)用i-FASP方法定量分析差异表达蛋白的火山图和(b)基因本体分析。(c)i-FASP法鉴定125种差异表达蛋白的亚细胞定位。(d)从Ingenuity Pathway分析数据库和研究者输入的125个差异表达蛋白质的输入数据中生成与疾病相关的分子数。
讨论
蛋白质组分析的样品制备通常包括从生物物种中提取蛋白质和蛋白酶消化。因此,萃取剂的蛋白质溶解能力和蛋白酶相容性是进行全面蛋白质组分析的关键因素。本研究开发了分子动力学模拟系统,对实验方法起辅助作用,有助于缩小萃取剂候选范围,从分子水平揭示萃取剂对膜蛋白溶解和胰蛋白酶生物相容性的内在机理。C12Im-Cl是一种基于甲基咪唑离子液体,其烷基链与膜蛋白有很强的相互作用。
基于C12Im-Cl的优点,提出了一种基于离子液体的样品制备方法i-FASP,用于蛋白质组学的深度覆盖分析,特别是对微量样品中低丰度和高疏水性的蛋白质。i-FASP法具有良好的蛋白质提取能力和与胰蛋白酶消化的良好相容性,在样品制备过程中具有较高的效率和吞吐量。当用于细胞和组织的定性分析时,i-FASP在深覆盖蛋白质组分析中显示出巨大的应用前景。结合定量蛋白质组策略和i-FASP在膜蛋白和低丰度蛋白分析中的优良性能,本研究以高准确度和深度覆盖率,对许多差异表达的蛋白质进行了鉴定和定量。这些结果显示了研究者的i-FASP方法的巨大潜力,为了解疾病的机制和发现新的生物标志物提供了丰富的资源。