其实,数据挖掘也不一定需要做生存分析
很多小伙伴总是担心没有生存时间,做不了生存分析,发不了文章,这种想法是错误的,因为数据挖掘完全可以不做生存分析。今天要分享这篇文章就是没有做生存分析的,作者主要是利用了GEO数据发现了2型糖尿病和结直肠癌之间病理生理学关联的关键基因,这篇文章发表在J Cell Physiol,这个杂志最新IF达到3.9,听说接受率能达到50%,审稿周期快,平均2个月,大家可以关注一下这个期刊。
论文题目
The key genes underlying pathophysiology association between the type 2-diabetic and colorectal cancer
这。。。摘要
尽管在许多研究中糖尿病(DM)被报道为结直肠癌(CRC)的独立危险因素,但潜在的病理生理学仍不清楚。我们研究了糖尿病和CRC的差异表达基因(DEG),以揭示2型糖尿病(T2D)和CRC之间潜在的病理生理学关联。从GEO数据库下载T2D(GSE55650),CRC(GSE8671)和二甲双胍处理的细胞系(GSE67342)的基因表达谱。用t检验和方差分析鉴定T2D样品与其对照样品之间的DEG。在聚类分析和功能富集分析后,构建蛋白质 - 蛋白质相互作用(PPI)网络以寻找二甲双胍治疗中糖尿病和CRC的潜在基因。总之,我们在T2D和CRC样本之间鉴定了583个重叠基因,169个常见DEG和414个独立DEG。共同基因包含89个上调(DEGs1)和80个下调基因(DEGs3);独立的DEG包含糖尿病中的270个下调基因(DEGs4)和CRC中的144个下调基因(DEGs2)。在富集分析中,Ribosome途径被独立的DEG显着富集。常见基因主要富含一些炎症相关通路。二甲双胍的两个靶基因与六个中枢基因(HADHB,NDUFS3,TAF1,MYC,HNFF4A和MAX)显着相互作用,表达值发生显着变化(P <0.05,t-检验)。总之,有人提出六个中枢基因可能在二甲双胍治疗糖尿病和CRC的过程中发挥重要作用。然而,具体的病理学还有待进一步研究。
分析内容和思路
1、下载GEO数据
2、差异表达分析
3、Pathway富集分析
3、取交集差异基因
4、PPI分析及筛选hub基因
5、比较两种条件下,hub基因的表达变化
好了,本次分享就到这里。
学习的分割线