非肿瘤低分灌水思路
An Integrated Network Analysis of mRNA and Gene Expression Profiles in Parkinson’s Disease
帕金森病mRNA和基因表达谱的综合网络分析
一、研究背景
帕金森病(Parkinson’s disease, PD)是第二位最常见的神经系统退行性疾病,主要临床表现为运动迟缓、肌强直、静止性震颤等。PD的主要病理改变为α-突触核蛋白在神经元胞体内沉积,形成路易小体,从而导致黑质中的多巴胺能神经元丢失。目前,PD的发病机制尚未明确,但已有研究表明其可能与环境因素、药物使用、接触杀虫剂、基因缺陷等因素有关。相关研究报道,PD患者体内的miR-181a通过抑制p38 MAPK信号通路和JNK信号通路从而调节细胞凋亡与自噬。作者旨在通过生信分析手段,从高通量数据中挖掘与PD相关的mRNA数据,最终筛选出差异表达基因,为明确PD的发病机制提供新的线索。
二、分析流程
三、结果解读
1. 筛选差异表达基因(DEGs)
作者从GEO数据库(Gene Expression Omnibus)中分别下载了10个包含黑质样本和6个包含全血样本的mRNA表达谱数据集(表1, 表2),并对其进行了标准化和log2转换。作者使用metaMA包计算p值,通过Benjamini-Hochberg法进行多重比较和FDR(false discovery rate)校正。FDR<0.01者被定为差异表达基因(DEGs)。
表1.GEO数据库中10个包含黑质样本的数据集
表2.GEO数据库中6个包含全血样本的数据集
在194个黑质相关样本中,作者共筛选出2151个DEGs(1076个上调,1075个下调),结果以热图形式呈现(图1)。在770个全血相关样本中,作者共筛选出1629个DEGs,其中699个上调,930个下调(图2)。
图1.黑质相关样本的DEGs热图
图2.全血相关样本的DEGs热图
2. DEGs的GO和KEGG富集分析
作者利用GeneCodis3在线分析工具对DEGs进行GO功能富集分析和KEGG通路富集分析。
黑质相关样本DEGs的GO分析显示,DEGs主要在细胞凋亡、细胞死亡、凋亡调控等生物过程富集(图3A);KEGG通路富集分析显示DEGs主要在氧化磷酸化、帕金森病、MAPK信号通路、神经营养因子信号通路、Wnt信号通路、Notch信号通路等通路富集(图3B)。
图3.黑质相关样本DEGs的GO和KEGG分析图
全血相关样本DEGs的GO分析显示,DEGs主要在细胞凋亡、细胞增殖负向调控等生物过程富集(图4A);KEGG通路富集分析显示DEGs主要在MAPK信号通路、Wnt信号通路、神经活动配体-受体相互作用、氧化磷酸化等通路富集(图4B)。
图4.全血相关样本DEGs的GO和KEGG分析图
3. DEGs的PPI网络构建
作者使用BioGRID数据库进行蛋白质互作分析,利用Cytoscape软件对PPI网络进行可视化。
作者根据黑质相关样本中上调最显著的20个DEGs和下调最显著的20个DEGs构建了PPI网络。结果显示,PAN2、SORT1、CRYAB、DLK1具有最多的相邻节点数(图5)。而全血相关样本中,PRKCD、PLAUR、GABARAPL1、PRDX2具有最多的相邻节点数(图6)。
图5.黑质相关样本DEGs的PPI网络图
图6.全血相关样本DEGs的PPI网络图
4. 筛选普遍差异表达基因
作者将黑质和全血相关样本的DEGs通过Venn图取交集,获得了169个普遍差异表达基因(The common DEGs),其中80个上调,89个下调(图7A)。GO分析显示,普遍差异表达基因主要富集在细胞凋亡、程序性细胞死亡、程序性细胞死亡的负向调控等生物过程(图7B);KEGG通路富集分析显示其在氧化磷酸化、溶酶体、帕金森病、阿尔兹海默症、亨廷顿舞蹈病等通路富集(图7C)。PPI网络显示,PSMA1和SDHA是其中的关键基因(图7D)。
图7.普遍差异表达基因的GO和KEGG分析图、PPI网络图
5. 验证普遍差异表达基因
作者使用包含黑质和全血样本数据的GSE22491进行验证。在GSE22491中,共包含36个上调普遍差异表达基因和45个下调普遍差异表达基因,其中21个上调和14个下调普遍差异表达基因与前述结果一致。如图8所示,CENPB、COL9A1、FCGRT、DMPK显著上调,ATP6V1H、PIP4K2A、PSMA1、TRIM58 显著下调。
图8.普遍差异表达基因的验证
小结
作者利用GEO数据库中的高通量数据,结合metaMA包识别了DEGs,并通过GO和KEGG富集分析阐明了DEGs参与的生物过程和信号通路,利用BioGRID数据库和Cytoscape软件构建PPI网络。作者进一步对DEGs进行筛选,将黑质与全血DEGs的交集定义为普遍差异表达基因。最后,作者使用GSE22491数据集对普遍差异表达基因进行验证。作者的研究筛选出了PD患者的普遍差异表达基因,这些基因可能通过MAPK、Wnt和Notch信号通路参与PD的发病机制,基于此的进一步研究对解释PD发病机制具有重要意义。
然而,本研究也存在一定不足,如数据处理过程中未进行批次校正可能引入一定干扰因素,使实验结果不够严谨。