值得借鉴:零代码分析加免疫组化上3分!
大家好,今天和大家分享的是一月份发表在Genomics(IF:3.16)杂志上的一篇文章,“Systemic analysis of the expression and prognostic significance of PAKs in breast cancer”,文章中作者使用Oncomine 数据库,并结合免疫组化标本,以及多个在线分析网站,对乳腺癌中的PAKs基因家族进行了表达以及预后指标的系统分析。
systemic analysis of the expression and prognostic significance of PAKs in breast cancer乳腺癌中PAKs表达及预后意义的系统分析
一、研究背景
PAK(p21活化激酶)在多种细胞过程中起到关键作用,在部分肿瘤中,针对PAK1的抑制剂已经被证明对于肿瘤生长有着抑制作用,PAK1 mRNA的高表达也预示着结直肠癌,肝细胞癌,胃癌,头颈癌和食道小细胞癌的预后不良,家族的其他成员也在其他的肿瘤研究中显示出与预后较强的相关性。但PAK的表达以及预后价值在乳腺癌中的研究不多,因此,作者希望通过公共数据库来探究PAK的mRNA表达以及蛋白质表达水平的预后价值。
二、研究思路
三、结果解析
1、乳腺癌中PAKs家族mRNA与蛋白质的表达
通过Oncomine数据库,检测到PAKs家族在乳腺癌中与正常组织有明显的表达差异。其中PAK1,PAK2,PAK4显著上调,PAK3,PAK5显著下调。对于PAK6 mRNA水平,肿瘤组织和正常组织之间没有显著差异。
随后采用GEPIA数据库进行乳腺癌组织与正常组织的转录水平比对,发现PAK3下调,PAK4和PAK6显著上调。另外分析了PAKs与肿瘤分期的关系。(补充表1)
图1:在不同癌症中PAK mRNA表达水平的Oncomine分析。
颜色指示阈值(p值≤0.05;倍数变化≥2;基因表达差异排位(gene rank)≤10%;数据类型:mRNA)。与正常组织相比,红色框表示靶基因在肿瘤组织中的过表达,而蓝色框表示该基因的下调。表达的强弱用颜色深浅表示。
表1:Oncomine数据库中不同数据集的PAKs基因表达差异对比数据
图2:GEPIA数据库中PAKs的mRNA表达水平箱线图
2、免疫组化观察PAKs蛋白表达并加以验证
作者先在HPA(Human Protein Atlas analysis)网站上获得了乳腺癌中PAK家族的免疫组织切片,并在来源于90个患者的180个标本中,检测了PAK4乳腺癌组织以及附近的正常乳腺组织的蛋白表达。
图3:作者通过网站来源的免疫组化数据进行蛋白表达的观察
可见PAK1,PAK2,PAK4在癌组织中表达升高。
图四:样本免疫组化结果
a图展示了免疫组化标本中,相比正常组织,PAK4在癌组织中过表达。
b图是所有样本的免疫组化评分柱状图,可以看到两组的表达有显著的差异。
3、KM Plotter探究PAKs表达与预后指标之间的关系
通过KMplotter的分析,作者发现:
PAK4的过表达与较差的RFS有关,PAK3、PAK5的表达与良好的RFS有关。PAK3升高与PPS不良有关。
PAK1,PAK2,PAK6表达与乳腺癌患者的预后指标没有显著的统计学意义。
此外,作者还进行了PAK家族表达与不同乳腺癌亚型的预后关系:
PAK1高表达与基底样型更长的OS以及更长的DMFS相关,而在管腔A型中则与较差的OS和PPS相关
PAK3的高表达与基底样型更长的OS和RFS相关,但在两种管腔型中表现出相反的现象。
PAK4的高表达与管腔B型较差的RFS相关,PAK6的上调与基底样型更差的RFS相关。
因此,作者还对不同ER / PR / HER2型的乳腺癌患者分析了PAK的预后价值:
HER2-型中,PAK1的高表达与更好的RFS和DMFS相关。
HER2-和PR-型中,PAK3的表达上调预示了较差的DMFS。
PR +型中, 高PAK5表达预示着更长的RFS;而ER-型中,高PAK5表达预示着更短的PPS。
表2:使用KM plotter对PAKs表达进行预后分析
表3:针对不同亚型中PAKs表达与预后指标中的分析
表4:针对不同ER / PR / HER2型的乳腺癌患者分析PAK的预后价值
4、乳腺癌中PAKs基因互作与蛋白互作分析
作者在这里使用了三个网页工具分别进行了mRNA表达相关性分析,Gene层次互作分析,STRING蛋白互作分子分析:
cBioPortal进行乳腺癌组织中mRNA表达相关性分析,发现PAK5-PAK1,PAK5-PAK3两对基因表达显现正相关,而PAK3-PAK4这一对基因表达显现负相关。
GeneMANIA 在基因层面上分析了PAK的关系,显示所有的PAK都有共享的蛋白结构域,发现了PAK1-PAK2,PAK4-PAK5以及PAK4-PAK6之间存在物理相互作用,PAK1和PAK3以及PAK3与PAK6之间有共定位的关系。共表达只显示出PAK3-PAK5的关系,遗传相互作用中发现PAK1-PAK5的关系。
STRING :在蛋白表达水平上鉴定PAK的相互作用,显示PAK1在基因共现,文本挖掘和蛋白质同源性中PAK2与PAK3的相互作用。共表达只显示PAK1与PAK3的关系。并且发现PAK4在文本挖掘和蛋白质同源性方面与PAK7(PAK5)相互作用。
图5:mRNA表达相关性分析,Gene层次互作分析,STRING蛋白互作分子分析的可视化结果
5、乳腺癌患者中PAKs的遗传改变与预后指标的关系
作者通过使用cBioPortal分析了乳腺癌中PAKs的遗传改变。分析结果显示,PAKs遗传变异的百分比分别为16.88%(187/1108),15.87%(172/1084), 分别为2.2%(18/817),0.85%(7/825)。
并使用一个数据集分析了PAK的遗传改变频率(PAK1,9%; PAK2,11%; PAK3,4%; PAK4,8%; PAK5,5%; PAK6,5%)。
随后作者进行了PAKs遗传变异病例与生存结果分析。发现具有PAKs基因改变的病例与OS恶化相关。DFS没有发现显著差异。此外,作者还建立了PAKs和50个改变的邻近基因网络。
图6:遗传改变概率图/生存分析/基因互作网络
a)TCGA Provisional 数据集, TCGA PanCancer 数据集, TCGA Cell 2015 数据集, TCGA Nature 2012 数据集中的PAKs遗传改变。
b)基于TCGA Provisional 数据集的PAK改变频率。
c)Kaplan-Meier图,比较有/无PAK基因改变的情况下的OS。
d)Kaplan–Meier图比较了有无PAK改变的情况下的DFS。
e)PAK与50个最频繁改变的邻近基因之间的基因-基因相互作用网络。
6、乳腺癌患者中PAK相关基因的功能富集分析
作者为了研究PAK及其改变的邻近基因功能,使用Metascape分析了GO和KEGG通路。
图7 GO富集分析,KEGG富集分析以及蛋白质富集分析结果
a-b:结果显示前20个GO富集:
分子功能:蛋白激酶活性,Rac GTPase结合,ephrin受体结合。
细胞成分:粘着斑。
生物学过程:Fc受体信号通路,转移酶活性的正调控,跨膜受体蛋白酪氨酸激酶信号通路,凋亡信号通路,蛋白自磷酸化,免疫应答调节细胞表面受体信号通路,参与吞噬作用,DNA生物合成过程的正向调节,蛋白水解的正向调节,凋亡过程的正向调节,肽基酪氨酸磷酸化,肌动蛋白细胞骨架组织,生长调节,心脏发育,对有机氮化合物的细胞反应。
c-d:排名前9位的KEGG途径是ErbB信号传导途径,FcγR介导的吞噬作用,蛋白酶体,上皮细胞的细菌入侵,癌症中的MicroRNA,hippo信号传导途径,小细胞肺癌,胰岛素抵抗,麻疹。
e-f:蛋白质-蛋白质相互作用富集分析,发现生物学功能主要与ErbB信号通路,粘着斑,Ras信号通路,蛋白酶体,爱泼斯坦-巴尔病毒感染等有关。
小结
本篇文章也是比较简单的单基因表达结合临床的套路,作者先利用Oncomine数据筛选出PAKs基因家族在乳腺癌中差异表达,再利用GEPIA比较乳腺癌与正常组织PAKs的转录水平。通过HPA网站上的免疫组化数据观察乳腺癌中的PAKs家族蛋白表达,并用自己的标本做了免疫组化的验证。随后使用KM Plotter网站进行了多种情况下PAKs表达与预后指标的相关性分析,之后利用cBioPortal计算乳腺癌浸润癌PAKs mRNA表达相关性、GeneMANIA分析PAK基因水平关系、STRING构建PAKs蛋白家族相互作用PPI网络。文章还分析了遗传改变与预后指标的关系,同样是使用了cBioPortal以及KMPlotter网站进行,文章最后使用了metascape网站进行PAK基因家族功能富集分析,并构建了通路相关的蛋白互作网络。整篇文章相对而言实验简单,也没有任何需要代码的步骤,文章除了一组免疫组化的图片及统计图表,所有图例都来自于在线的工具。