非肿瘤纯生信数据挖掘用最简单分析就可以了
大家好,今天和大家分享的是2020年1月发表在 Peer J (IF=2.379) 上的一篇文章:“Identification of key biomarkers and immune infiltration in the synovial tissue of osteoarthritis by bioinformatics analysis”。作者挖掘GEO数据库中骨关节炎(Osteoartritis, OA)相关表达谱芯片数据,进行差异表达基因分析,GO和KEGG富集分析、PPI网络构建、模块分析等生信分析,最后还结合了免疫浸润与RT-PCR验证关键基因。
Identification of key biomarkers and immune infiltration in the synovial tissue of osteoarthritis by bioinformatics analysis
通过生物信息学分析鉴定骨关节炎滑膜组织中的关键生物标记物和免疫浸润
一、研究背景
骨关节炎(Osteoartritis, OA)是最常见的慢性退行性关节病,多见于中老年人,60岁以上老年人患病率极高,严重者甚至可致残。相关研究显示滑膜炎可能是OA重要的病理变化之一,在OA中滑膜甚至在软骨变性发生之前就可能显示出明显的病理变化。因此,该研究旨在识别OA滑膜组织与正常滑膜组织中关键基因表达的变化和免疫浸润差异,为理解OA疾病发展和病理过程提供新的思路。
二、分析流程
三、结果解读
1. 筛选差异表达基因(DEGs)
作者从GEO数据库中下载了系列号为GSE12021、GSE55235和GSE55457的基因芯片,均来自GPL96平台,芯片类型为Affymetrix Human Genome U133A。三个基因芯片中均包含了正常滑膜组织与OA滑膜组织样本。接着,作者使用sva包对数据批次校正和标准化,利用limma包对上述3个数据集进行差异表达基因分析,以P<0.05和|log2 fold change (FC)|>2为筛选条件。作者共筛选出106个DEGs(38个上调,68个下调),结果以火山图和热图的形式呈现(图1A, 图1B)。
图1.DEGs的热图与火山图
2. DEGs的GO和KEGG富集分析
作者使用clusterProfiler包对DEGs进行GO和KEGG通路富集分析,并以p<0.05为筛选标准。GO富集分析显示DEGs主要参与抗原结合、肽聚糖结合、细胞因子受体结合等生物过程(图2A, 表1);KEGG通路富集分析显示DEGs主要在类风湿性关节炎、IL-17信号通路、细胞因子-细胞因子受体相互作用等通路富集(图2B, 表2)。
图2.DEGs的GO和KEGG分析图
表1.DEGs的GO分析结果
表2.DEGs的KEGG通路富集分析结果
3. PPI网络构建和模块分析
作者将DEGs导入到STRING线上数据库进行蛋白互作分析(confidence score>0.4, number of interactors=0),并利用Cytoscape软件对PPI进行可视化(图3A)。应用Cytoscape软件中的MCODE插件对PPI进行模块分析,标准为degree cutoff=2, node score cutoff=0.2, k-core=2, max. depth=100。结果显示,最显著的模块具有14个关键基因,其中上调基因以红色表示,下调基因以蓝色表示(图3B)。
图3.DEGs的PPI网络和功能模块
4. 关键基因的GO和KEGG富集分析
作者使用clusterProfiler包对关键基因进行GO和KEGG通路富集分析,并以p<0.05为筛选标准。GO富集分析显示关键基因主要参与细胞因子受体结合、细胞因子活动、受体配体活动等生物过程(图4A, 表3);KEGG通路富集分析显示关键基因主要在类风湿性关节炎、IL-17信号通路、Kaposi肉瘤相关疱疹病毒感染等通路富集(图4B, 表4)。
图4.关键基因的GO和KEGG分析图
表3.关键基因的GO分析结果
表4.关键基因的KEGG通路富集分析结果
5. 免疫细胞浸润结果
作者使用CIBERSORT反卷积算法对标准化后的基因芯片数据进行分析,计算22种免疫细胞占比(p<0.05),包括初始B细胞、记忆性B细胞、浆细胞、CD8T细胞、初始CD4T细胞、未活化CD4记忆T细胞、活化CD4记忆T细胞、滤泡辅助性T细胞、调节性T细胞、γδT细胞、未活化NK细胞、活化NK细胞、单核细胞、M0巨噬细胞、M1巨噬细胞、M2巨噬细胞、未活化树突状细胞、活化树突状细胞、未活化肥大细胞、活化肥大细胞、嗜酸性粒细胞、中性粒细胞(图5)。
作者进一步通过PCA分析发现OA和对照组的免疫细胞浸润情况存在差异(图6)。图7中对照组为蓝色,OA组标记为红色,结果显示记忆性B细胞、初始CD4T细胞、未活化CD4记忆T细胞、调节性T细胞、活化NK细胞、未活化树突状细胞、未活化肥大细胞、活化肥大细胞、嗜酸性粒细胞在正常样本和肿瘤样本中的占比比较,差异有统计学意义(p<0.05)。其中,与对照组相比,OA滑膜组织中记忆性B细胞、调节性T细胞、未活化树突状细胞、未活化肥大细胞的占比较大。
图5.正常滑膜组织与OA滑膜组织免疫细胞的浸润组成
图6.正常滑膜组织与OA滑膜组织免疫细胞的PCA图
图7.正常滑膜组织与OA滑膜组织免疫细胞浸润差异的小提琴图
6. 关键基因的RT-PCR验证
作者收集了6例OA患者滑膜组织与9例正常滑膜组织的临床标本,应用TRIzol法提取RNA,逆转录合成cDNA,随后进行PCR扩增。使用GAPDH作为内参,2-△△Ct法进行mRNA相对定量分析,one-way ANOVA进行统计学分析(p<0.05)。结果显示14个关键基因中,11个相对表达水平与微阵列杂交结果一致,CXCL3,GADD45B,MCL1则未观察到统计学差异(图8)。
图8.正常滑膜组织与OA滑膜组织关键基因的RT-PCR结果
小结
目前,OA的病因及发病机制尚不明确。因此分析OA的潜在发病机制对于诊断预后和鉴定药物治疗的靶点至关重要。作者挖掘GEO数据库中OA相关表达谱芯片数据,分析差异表达基因后,通过clusterProfiler包进行GO分析和KEGG通路富集分析预测靶基因功能和相关通路,利用STRING平台及Cytoscape软件构建PPI网络,MCODE插件对PPI进行模块分析,最终筛选出与OA密切相关的关键基因,并对关键基因进行了GO和KEGG通路富集分析。此外,作者还对芯片数据进行了免疫浸润分析。最后作者通过RT-PCR对临床样本中的关键基因进行了验证,进一步确定了关键基因与OA的密切联系。