科研 | Allergy:桦树、桤木和榛树常见致敏树花粉的比较蛋白质组学
编译:Y.too,编辑:Tracy、江舜尧。
原创微文,欢迎转发转载。
除了已知的过敏原,花粉中的其他蛋白质可以帮助过敏个体的免疫反应的发展。未知的蛋白质过敏原在系统发育相关物种中的贡献是明显的,尽管先天过敏原的同源性很高,但潜在的过敏原程度却可能相差很大。本研究旨在鉴定桦树(Betula pendula)、榛树(Corylus avellana)和桤木(Alnus glutinosa)三种常见且高度相关的致敏树种花粉中其他潜在致敏蛋白。为此,我们对三种花粉进行了全面、比较的蛋白质组学筛选。为了最大限度地提高蛋白质回收率和覆盖率,我们在样品制备过程中采用了不同的蛋白质提取和分离策略,结果,我们报告了每个花粉种2500-3000个鉴定的蛋白质。鉴定出的蛋白质可进一步用于许多注释步骤,从而深入了解肽酶,肽酶抑制剂和其他可能的过敏原性蛋白质在这三种物种中的差异分布。此外,我们进行了功能富集分析,证实了它们虽然蛋白质谱相对不同,但它们之间具有高度的物种相似性。我们对两种非常重要的过敏原花粉类型——榛子花粉和赤杨树花粉(甚至没有转录组学数据)的蛋白质组学进行了初步研究,并将其与桦树花粉进行了比较,本研究的数据集可以很容易地用作蛋白质数据库,从而为进一步的功能研究提供基础。
论文ID
实验设计
1. 采用SDS-PAGE法、荧光染色技术、LC-MS/MS分析对三种相关壳斗目物种的花粉提取物整体蛋白表达模式和蛋白质组学进行研究;
2. 通过FASP法、丙酮法和TCA法,探究桦木、桤木和榛木花粉蛋白质样品制备方法的互补性;
3. 利用Andromeda(MaxQuant)和Mascot两个搜索引擎对不同花粉种类的蛋白质进行鉴定;
实验结果
1. 三种相关壳斗目物种的花粉提取物显示出独特的蛋白质谱和过敏反应
为了分析和观察3种相关的壳斗目花粉类型的可溶性和总蛋白质组的整体蛋白表达模式,我们首先进行了SDS-PAGE,然后对蛋白进行荧光染色。由于技术上的挑战,桦树花粉可溶性提取物的制备方法与其他两种不同。凝胶分析指出,三种过敏花粉的可溶性蛋白组分的蛋白质图谱存在显著差异(图1A),除了可能是因为桦木提取物制备方法不同外(需要摇晃更长时间[10小时而常规4小时]才能产生相当数量的蛋白质),这也可能是由于花粉释放蛋白质的效率不同。值得注意的是,致敏性PR-10蛋白成员的大小为17 kDa,这使它们处于观察到的质量范围处于低端,很可能对应于刚好低于20 kDa的粗蛋白带(图1A);另一方面,苛刻的裂解条件导致三个物种中蛋白质分布相当相似,证实了这些提取物作为总蛋白组分的有效性(图1A)。
为了研究三种花粉蛋白的致敏潜能,我们研究了它们的特异性免疫球蛋白(IgE)抗体反应,为此,我们将可溶性和总蛋白组分中的蛋白质转移到硝化纤维素膜上,并与患者血清孵育(有五个人对桦树过敏,或者对这三种都过敏)。正如预期的那样,在可溶性部分中,大多数强效过敏原位于略低于20 kDa的区域,与PR-10蛋白家族成员的大小相对应(图1B),然而,尽管种间高度相似,但三种花粉类型的可溶性提取物的过敏原分布却出奇独特,特别是在50 ~ 110 kDa的区域(图1B)。在总蛋白质组部分中,只有PR-10蛋白对应的蛋白质过敏原组能够结合IgE,但程度较小,原因很可能是严重的裂解导致更强的变性和过敏原蛋白构象的丢失,使它们不容易被IgE识别。
考虑到这三种物种独特的蛋白质和过敏原谱,我们接下来使用LC-MS/MS进行了更详细的蛋白质组学分析。在缺乏现有蛋白质数据库的情况下,我们采用了图2所示的多步骤分析流程,对这三个物种的花粉蛋白质组进行了鉴定和注释。考虑到从可溶性和总蛋白质组中获得不同的蛋白质谱,为了获得最佳的蛋白质组覆盖率,我们使用了两种不同的提取方法和三种不同的蛋白质样品制备方法进行随后的LC-MS/MS分析。
图1 三种高度亲缘的壳斗目(桦树、桤木和榛木)的花粉显示出不同的蛋白质谱和不同的致敏潜能
A. 单个花粉蛋白提取物的SDS-PAGE。B. 将可溶性蛋白质组(每个花粉种类3个)和总蛋白质组(每个花粉种类3个)与收集自5个过敏个体的血清孵育后进行抗蛋白质印迹实验。
2. 互补的蛋白质样品制备方法
分离出水溶性花粉蛋白后,我们测试了三种不同但常用的样品制备方法,用丙酮、三氯乙酸(TCA)从单个花粉提取物中沉淀出三次(榛子)或四次(桦树和桤木)的蛋白质,或应用FASP法纯化蛋白质(图2),样品制备方法不同程度地影响了三种花粉水溶性组分中鉴定出的蛋白质总数。通过FASP法、丙酮法和TCA法,我们分别在桦树花粉蛋白质组中鉴定出1189、1082和1149个蛋白质,对获得的蛋白质总数的影响不大(图3A)。我们在桤木花粉提取物可溶性部分的FASP、丙酮和TCA沉淀中分别鉴定出1102、779和694个蛋白。Hazel的FASP方法共鉴定出929个蛋白,其中丙酮沉淀942个,而TCA沉淀后仅鉴定出540个蛋白,此外,数据分析显示,所有三种植物的不同制备方法都可以提取到不同的蛋白质(图3A)。三种花粉制剂(TCA、丙酮或FASP)中均检测到38% - 72%的鉴定蛋白,而每种制备方法中特异鉴定的蛋白贡献也相当高,在不同花粉种类和沉淀技术中从8%到30%不等(图3A)。因此,为了确保最大的信息覆盖范围,在后续的分析步骤中,我们使用了所有三种花粉样品制备方法收集的数据。
这三种蛋白混合在一起后,我们在桦木的水溶性部分鉴定出1525个蛋白,桤木的1274个蛋白,榛子的1213个蛋白。在桦木、桤木和榛木中,水溶性部分鉴定出的蛋白质绝大部分(分别为1244(82%)、837(66%)和910(75%))蛋白也在总蛋白质组中鉴定出,如图3B所示。尽管如此,仍有相当数量的蛋白质仅在水溶性蛋白质组分中被鉴定出来(282种(桦木),437种(桤木)和303种(榛木);图3B),这些蛋白质只有在长时间接触水后才有可能释放出来。
图2 蛋白质组学的工作流程图
从桦树、桤木和榛树花粉中分离蛋白质,得到可溶性组分(0.1% Triton-X在PBS中温和提取)和总蛋白组(使用锆珠和丙酮沉淀进行强烈机械溶解)。可溶性提取物采用三种不同的方法处理,消化后进行LC-MS/MS分析。蛋白质数据库是从公开的花粉(桦树)、叶子(桤木)和柔荑花序(榛子)RNA-seq数据中创建的,使用的是Trinity de novo转录组组装和凸纹比对。生成的fasta文件作为Mascot和MaxQuant蛋白鉴定数据库和blastx蛋白注释数据库。然后使用来自不同蛋白质制剂(可溶性组分和总蛋白质组)的数据汇集的蛋白质数据库匹配(搜索输出),用于Pfam、MEROPS和基因本体(GO)和AllFam注释。
图3 不同蛋白质样品制备方法的互补性
A. 用不同的蛋白质沉淀和再溶解方法分析花粉蛋白组的可溶性部分(用含有0.1% Triton X-100的PBS孵育提取)。维恩图显示了每种方法鉴定出的蛋白质的数量。B. 可溶性蛋白(PBS, 0.1% Triton X-100)与总蛋白部分(锆珠,1% SDS)鉴定蛋白的比较。C-D. 三种壳斗目花粉鉴定蛋白的Pfam家族。Venn图描述了在可溶性蛋白质组(C)和总蛋白质组(D)中注释的Pfam家族的重叠。
3. 数据库注释和蛋白质分类
我们利用Andromeda (MaxQuant)和Mascot两个搜索引擎对不同花粉种类的蛋白质进行鉴定。在所有情况下,原始的蛋白质组数据(.fasta文件在附录S1中)都是通过序列读取档案(SRA)中公开的RNA-seq数据下Trinity de novo转录组组件创建的蛋白质数据库进行搜索的,如附录2所述(图2)。在创建fasta蛋白数据库文件时,为了能每个Trinity标识符提供一个蛋白名称,我们使用blastx工具对重新组装的Trinity数据库进行注释,将其与几个系统发育密切相关物种的NCBI非冗余(nr)蛋白序列进行匹配,每个Trinity标识符的前两项(e <0.001)列为蛋白质名称。为了获得更可靠的肽酶注释,我们还可以通过blastx从头开始对转录的新转录物进行手工整理MEROPS肽酶数据库,以允许匹配的最大e值为10-4。在这两种情况下(blastx搜索相关的NCBI nr蛋白,blastx-MEROPS搜索肽酶注释),获得的结果都作为附加注释添加到Trinity标识符列表中。
蛋白数据库匹配的结果将通过Pfam、AllFam、Allergome、MEROPS和GO富集进行深入的功能注释。
3.1 Pfam家族和Allergome注释
Pfam数据库识别表明同源的序列相似性,并据此将相似的蛋白质分配到一个蛋白质家族。结果表明,在可溶性蛋白组分中,桦木有684个Pfam族,桤木有512个,榛木有509个(图3C);另一方面,通过对总蛋白质组的注释,桦木的Pfam家族数为1214个,桤木的Pfam家族数为905个,榛木的Pfam家族数为1131个(图3D)。在可溶性蛋白质组和总蛋白质组中,桦木的Pfam分析产生的注释数量最多,因为在桦树的情况下,花粉的转录本可以用于创建新组装的Trinity数据库,而桤木和榛子树则没有;桤木以叶片的转录组为研究对象,榛木以柔荑花序的转录组为研究对象。
我们从每个花粉种类的可溶性和总蛋白组分中获取包含Pfam注释的组合数据集,搜索已知的过敏原(主要是PR-10蛋白家族成员),利用过敏原分子数据库Allergome平台进一步证实其致敏性。
在注释的Pfam家族中,我们在3种花粉的可溶性蛋白组和总蛋白组中分别鉴定出98个和173个不同的蛋白酶家族,而在可溶性组分中发现的98个蛋白酶家族中,有34个不同家族的蛋白质可以在可溶性组分中特异鉴定。
3.2 肽酶和过敏原注释
为了更仔细地研究肽酶,我们从鉴定蛋白的blastx蛋白名、Pfam和MEROPS鉴定的结果列表中提取了被鉴定为MEROPS中具有较高可信度的肽酶蛋白,然后,这个提取的肽酶和肽酶抑制剂列表被过滤,以去除标记为非肽酶同源物的MEROPS条目。根据其催化活性的机理,我们将肽酶进一步划分为六类,即天冬氨酸-半胱氨酸-、金属-、丝氨酸-、苏氨酸-肽酶和来历不明的肽酶(图4),而蛋白酶在总蛋白组(图4A)和整个可溶性组分(图4B)中的分布与只在可溶性组分中发现的蛋白酶的分布不同(图4C),因为可溶性部分更可能代表鼻粘液和内皮细胞接触花粉的生理状态。
在三种花粉的总蛋白质组中,最丰富的是丝氨酸水解酶家族,占所有注释蛋白酶的32%- 36%(图4A),而在桦树的总蛋白质组中,丝氨酸蛋白酶含量相对较高,组合可溶性组分也是如此(图4B);然而,单独观察可溶性部分特有的蛋白酶时,趋势不同:与其他肽酶相比,桤木中丝氨酸水解酶的相对丰度(61%)远高于桦木(39%)(图4C)。
在可溶性部分中检测到最突出的丝氨酸水解酶家族之一是枯草蛋白酶的Pfam家族(PF00082),它们是丝氨酸水解酶,具有保守的Asp / Ser / His催化三联体。从这个家族中,我们在桦树中发现了14种蛋白酶,在榛树中发现了10种蛋白酶,在桤木中发现了2种蛋白酶,其中仅在可溶性级分中鉴定出了总共5种(桦树中有2种,榛树中有3种)。根据AllFam数据库,目前已知该Pfam家族有23种过敏原,而在枯草蛋白酶旁边,另一个丝氨酸水解酶家族,即羧肽酶(PF00450)脱颖而出。在桦木的可溶性组分中,我们在桤木11和榛木3中共发现了12个该家族成员,其中有6个(桤木和桦木各3个)只在可溶性组分中被发现。AllFam目前只列出了来自这个家族的两种过敏原(Api m 9和Tri a CPDW-II)。
在总蛋白质组中,第二丰富的水解酶是金属肽酶(图4A),在可溶性组分中,第二丰富的是半胱氨酸水解酶(图4B,C),而在桦木、桤木和榛木的可溶性部分,我们分别鉴定出了不同的半胱氨酸蛋白酶家族成员(PF00112),其中仅在可溶性部分就鉴定出了7个半胱氨酸蛋白酶家族成员。半胱氨酸蛋白酶在过敏中的作用已经被提出,因为它们可以破坏上皮细胞的紧密连接。AllFam列出了13种源自Pfam家族的过敏原,如来自室内尘螨的Der p1,它被证明具有半胱氨酸蛋白酶活性,也参与上皮屏障的破坏。
此外,我们还在桦木、桤木和榛木的可溶性组分中分别检测到了16、4和8个不同的Pfam家族。在这些家族中,可能最占优势的是氨基肽酶Pfam家族(PF01433),花粉氨肽酶也被报道能破坏上皮细胞的完整性;然而,AllFam并没有列出任何与这个家族相关的过敏原。
最后,除了不同的蛋白酶,我们进一步报道了桦木可溶性组分中12个不同Pfam家族的蛋白酶抑制剂,桤木中6个,榛花粉中12个(表S13-S21)。花粉蛋白酶抑制剂可以影响蛋白酶的活性,从而调节过敏反应,例如,我们在桤木和榛木中检测到比桦木更多的胱氨酸蛋白酶抑制剂(半胱氨酸蛋白酶抑制剂PF16845)。丝氨酸蛋白酶抑制剂(属于丝素家族[PF00079],[PF05922]和马铃薯抑制剂I [PF00280])也是如此,它们在桤木和榛木中比在桦木中更丰富,这可能表明桦树的半胱氨酸和丝氨酸水解酶比其他两种树种更活跃,这可能导致其更高的过敏潜能。
3.3 功能分析
最后,我们采用GO对所有鉴定的蛋白进行功能分析,以获得潜在功能多样性的初步指示。我们将GO术语提升到第2级,提供了GO类中蛋白质分布的概述。为了估计功能配置文件的相似性(如图S1所示),我们计算了Spearman等级相关性,而在所有的GO类中,所获得的档案相关性几乎是相同的。桦木、桤木和榛木的蛋白质组成分不同,但总体上它们的GO曲线非常相似(表1和图S1)。
图4 MEROPS注释的已鉴定的肽酶亚科以及肽酶抑制剂在三种不同花粉中的分布
展板代表MEROPS注释肽酶和肽酶抑制剂的总数,以及与每个物种MEROPS注释肽酶总数相比,不同类型肽酶的相对分布(百分比)。A,确定的肽酶和肽酶抑制剂在总蛋白组和可溶性蛋白组组合(从可溶性蛋白组和珠解的肽酶和肽酶抑制剂)中的分布(左:确定的肽酶/肽酶抑制剂的确切数目;右图:与此蛋白质组部分中鉴定的肽酶总数相比的肽酶类型的分布(百分比),(B)鉴定的肽酶和肽酶抑制剂在可溶性部分的分布(来自可溶性部分的肽酶和肽酶抑制剂)(左图:确切数目鉴定的肽酶/肽酶抑制剂;右图:与此蛋白质组部分中已鉴定的肽酶总数相比的肽酶类型的分布(以百分比表示),(C)已鉴定的肽酶和肽酶抑制剂的分布仅在可溶性部分中鉴定的肽酶和肽酶抑制剂(但不在总蛋白质组/珠解中;左:确定的肽酶/肽酶抑制剂的确切数目;右图:肽酶类型的分布与该蛋白质组部分中已鉴定的肽酶总数的比较(百分比)。
表1 可溶性蛋白功能谱之间的Spearman等级相关性
AG, Alnus glutinosa;英国石油公司、桦木属翻车机;CA, Corylusavellana;GO total, Level 2 GO term classes;GOBP, GO生物过程;GOCC,细胞室;GOMF, GO分子功能。
讨论
过敏是世界范围内巨大的经济和健康负担。长期以来,对不同过敏源物种引起不同过敏反应的原因确定仅基于对其主要蛋白过敏原的调查(如Fagales目中PR-10蛋白家族的成员)。然而,对于更密切相关的物种,其过敏原的结构同源性和交叉反应性相当高,但它们的致敏潜力仍然可能完全不同。例如,alder (Aln g 1)和hazel (Cor a 1)的主要过敏原与Bet v 1的序列相比,氨基酸序列的一致性分别为79%-83%。然而,桦树花粉仍然是欧洲最强的过敏原,这表明其他潜在的、非致敏花粉蛋白可能导致不同的过敏反应。我们也证明了这三种花粉表现出不同的过敏反应(图1B),我们下一步将对这些新的、强效的过敏原进行更深入的分析和注释。这本身就是一个挑战,因为有时新的、潜在的强效过敏原的识别可能会被其他更占优势的过敏原掩盖。最近,新发现的橄榄过敏原Ole e 15(亲环素)的二聚体形式与最常见的橄榄过敏原Ole e 1的糖基化形式具有相同的分子质量。我们需要对过敏和非过敏花粉蛋白进行详细的分析,因为过敏原免疫治疗的成功率并不令人满意,尽管它与特定的致敏模式有关。虽然在某些病例中用重组过敏原蛋白治疗已获成功,但另一项研究显示,对于对草粉过敏的儿童,当将获得的致敏图谱与8种猫尾草分子的制备进行特异性免疫治疗时,只有4 %的患者有与实验过敏原特异性制备中提出的致敏图谱完全匹配的致敏图谱。在其他96%的患者中,观察到每个患者的敏化特征和过敏原特异性制剂的组成之间不匹配性,表明敏化特征具有广泛的异质性。因此,这可能表明重组蛋白治疗可能会错过重要的过敏原,从而导致免疫功能低下和过度。
近年来,不同类别的蛋白酶在过敏方面得到了重视,一些过敏原本身也被描述为蛋白酶,如来自屋尘螨的Der p1作为参与破坏上皮屏障的半胱氨酸蛋白酶,Der p3、6和9作为丝氨酸蛋白酶。此外,在过敏源中也发现了蛋白酶,例如,白桦树扩散,榛子花粉扩散。同样重要的还有丝氨酸和半胱氨酸蛋白酶。如前所述,当暴露在白桦扩散物中时,丝氨酸蛋白酶可以降解上皮细胞中的紧密连接,而添加丝氨酸蛋白酶抑制剂AEBSF(4-(2-氨乙基)苯磺酰氟)可以阻止这一过程。半胱氨酸蛋白酶和E-64半胱氨酸蛋白酶抑制剂也得到了类似的结果。由于上皮屏障功能的丧失为过敏原进入和发展过敏反应提供了机会,因此对已鉴定的半胱氨酸和丝氨酸蛋白酶的进一步研究非常有意义。在本研究中,我们详细概述了蛋白酶在三个高度相关的花粉物种中的分布。对于桦树,根据已发表的对市售桦树花粉水提液的蛋白质分析,我们也检测到丝氨酸水解酶是桦树花粉中含量最丰富的蛋白酶家族(图4A )。此外,我们还报告了三个花粉(例如花粉)特有的Pfam蛋白酶家族的综合列表(桦树可溶性蛋白组分75个,总蛋白组分142个),其中13个与以前报道的市售桦树花粉水提液相匹配;同样,在我们的数据中,我们也鉴定了几乎所有已鉴定的蛋白质,包括过敏原和其他代谢酶,这些蛋白质来自Erler等人2011年报道的不同来源的桦树花粉的1D/2D蛋白质组学研究。除了蛋白酶,值得一提的是,不同的蛋白酶抑制剂(也存在于花粉中)可以调节蛋白酶的活性并影响致敏反应。在这方面,我们也报告了三个物种中检测到的不同蛋白酶抑制剂的详细列表,这可以作为未来过敏原研究的坚实基础(图4和表S13-S21)。此外,最近的研究表明,上皮细胞本身通过先天淋巴样细胞2分泌IL-33和胸腺基质淋巴生成素等细胞因子,积极调节下游过敏机制。因此,进一步了解花粉蛋白的含量、功能及其与鼻黏液和上皮细胞蛋白质组的相互作用,有可能阻断这些蛋白对上皮细胞的刺激以及随后的过敏性级联反应。
结论