同一科室一批数据一套分析发2遍?
最近,土笋冻在解读文献的时候发现一篇“超级有趣”的文献,同一个科室靠着同一套路发了2篇相似度很高的文章!
这不,美名其曰:数据集的多次利用!
作者在2020年七月发表在Medicine(IF=1.552)上的“Identification of key genes in calcific aortic valve disease by integrated bioinformatics analysis”,研究的疾病同样也是CAVD,文章所采用的三个数据集中,有两个正是本文(等会小编解读的这篇文章)所用数据集,两篇文章的思路大致一致,作者也来自同一单位!虽然在可视化上面作图不是用的同一套分析,但是这样的“风险规避”也太666了吧!
感兴趣的读者可以仔细比较这两篇文章哦。(PMID: 32030260 & 32702920)
第一篇文章的单位:Department of Cardiovascular Surgery, the First Affiliated Hospital, School of Medicine, Zhejiang University, Hangzhou, China.
第二篇文章的单位:
aDepartment of Cardiothoracic Surgery
bDepartment of Bone Marrow Transplantation Center
cDepartment of Surgical Intensive Care Unit, The First Affiliated Hospital, College of Medicine, Zhejiang University, Hangzhou, Zhejiang Province, P.R. China.
第一篇文章2019年6月28日投稿;
第二篇文章2019年10月27日投稿;不排除之前在其他杂志被拒;
以下是在PubMed中的截图:
大家觉得这会是巧合吗?
欢迎留言讨论!
回到正题,解读文献部分!
今天给大家带来的是2019年12月发表在Journal of Thoracic Disease(IF= 2.046)杂志上的文章“Identification of key genes and pathways in calcific aortic valve disease by bioinformatics analysis”(就是刚刚说的极其雷同的姊妹篇之一)。这篇文章通过DEGs筛选、GO分析、KEGG分析以及PPI网络构建,进一步对hub基因以及模块分析鉴定的基因簇进行通路分析,筛选了钙化性主动脉瓣疾病的核心基因与通路。
Identification of key genes and pathways in calcific aortic valve disease by bioinformatics analysis用生物信息学方法鉴定钙化性主动脉瓣疾病的关键基因和通路
一.研究背景
钙化性主动脉瓣疾病(CAVD)是老年人最常见的心脏瓣膜疾病。目前,导致CAVD病进展的关键基因和信号通路仍知之甚少。本研究旨在通过生物信息学分析探索CAVD病的分子机制。
二.分析流程
三.结果解读
1.鉴别差异表达基因
从GEO数据库下载GSE51472和GSE83453数据集,使用MetaDE包合并数据集后筛选DEGs。共发现107个DEGs(53个上调基因,54个下调基因)(表1)。对两个数据集的基因表达谱通过热图可视化,显示每个数据集中的107个DEGs是一致的(图1)。
表1.筛选CAVD的DEGs
图1. 差异基因在两个数据集中的表达模式热图
2.GO分析
完成DEGs筛选后使用DAVID进行GO分析(表2)。
表2.GO分析结果
生物过程
上调:免疫应答,细胞外基质的组织,通过MHC-II类分子进行抗原加工和呈递,正调节T细胞增殖,趋化性。
下调:脂肪酸β-氧化,细胞粘附,细胞骨架组织,细胞对过氧化氢的反应。
细胞成分
上调:MHC-II类分子复合物,细胞质膜,细胞表面,细胞外泌体,细胞外空间。无下调
分子功能
主要是MHC-II类的结合和受体活性
3.KEGG通路分析
使用KOBAS在线分析工具进行KEGG通路分析(表3)。
表3.KEGG通路分析结果
上调:吞噬体,补体和凝血级联反应,白细胞跨内皮迁移,细胞粘附分子(CAM),抗原加工和呈递。
下调:AGE-RAGE信号通路,氨基酸(组氨酸,β-丙氨酸,色氨酸)和脂肪酸的代谢。
4.PPI network(蛋白质-蛋白质相互作用网络)
使用STRING数据库识别由DEGs编码的蛋白质之间的相互作用(combined score >0.4),使用Cytoscape软件对PPI网络进行可视化。相互作用程度较高的基因被认为是hub基因,并对hub基因进行通路富集分析。
总共获得了61个节点和143个蛋白质对(图2A)。
degree of interaction≥10的前5个hub基因是VCAM1、MMP9、ITGB2、RAC2和vWF。
通路富集分析表明,这些hub基因主要参与白细胞跨内皮迁移和细胞粘附(图2B)。
图2. PPI网络分析结果
作者随后使用Cytoscape中的MCODE插件进行模块分析(阈值:MCODE得分> 3和节点数> 4),并对模块中的基因进行通路富集分析。
MCODE检测到包含HLA-DPA1,HLA-DRA,HLA-DMA,HLA-DMB和CD74的重要蛋白质簇(图3A)。
通路富集分析表明,这些基因主要参与抗原加工和呈递以及CAMs(图3B)。
作者还对包含ALDH2,HIBCH,ACADVL,ECHDC2,VAT1L和MAOA的独立下调的蛋白簇(图3C)进行了通路富集分析,显示这些基因主要参与脂肪酸和各种氨基酸的代谢(图 3D)。
图3. PPI网络分析结果
小结
作者利用GEO数据库,分析差异表达基因后,进行GO分析和KEGG通路富集分析,利用STRING数据库及Cytoscape软件构建蛋白质-蛋白质相互作用(PPI)网络,并进一步对hub基因以及模块分析鉴定的基因簇进行通路分析,筛选出VCAM1,MMP9,ITGB2,RAC2,vWF和ALDH2是CAVD进程中的关键基因。免疫细胞浸润可能在CAVD进程中起关键作用,而ALDH2介导的解毒作用可能在CAVD进程中起保护作用。