这篇文章数据挖掘的套路很简答?

文章题目:Gene expression microarray analysis reveals prognostic markers of survival inhigh grade astrocytomas

摘要:(Goole翻译)

目的:高级星形细胞瘤(HGA)是一种侵袭性脑肿瘤,总是相关的

预后差。在本文中,我们旨在探索HGA的遗传预后生物标志物。

方法:从26个获得的26个脑肿瘤样品的全基因组表达谱HGA患者从Gene Expression Omnibus下载。风险基因通过TCGA数据库中的数据对HGA的预后进行鉴定和验证。蛋白质 - 蛋白质建立了风险因子基因相互作用(PPI)网络,并建立了重要模块筛选。对风险基因和药物靶标进行功能和通路注释基因进一步分析。

结果:共有598个基因被确定为重要的预后危险基因,例如

关卡激酶1,钾内向整流通道,亚家族J,成员6,白细胞

受体酪氨酸激酶和未表征的LOC283887。所有HGA预后的风险基因

在细胞周期,有丝分裂以及有丝分裂后期均显着富集。而基因

在网络模块中主要参与细胞周期,有丝分裂细胞周期等功能

和细胞周期过程。此外,网络模块中的基因主要参与了网络

通路如细胞周期和细胞周期,有丝分裂。药物靶点分析显示七个

在Drugbank数据库中记录了基因,并且有多达32个药物记录

CHEK1。

结论:基于615低级胶质瘤和胶质母细胞瘤样品表达谱的数据验证CHEK1的预后效果。我们提出CHEK1作为预后HGA生物标志物。我们的工作可能为HGA治疗提供候选目标。

我们来看一下作者做了那些东西:

1、GEO的下载和矫正

2、根据高低表达画ROC曲线和生存曲线

3、PPI

4、GO 和 pathway富集分析

5、药物靶点分析

6、利用TCGA数据做Cox回归分析

通过以上分析,作者得出一个结论:CHEK1可以作为HGA预后的生物标志物。其实,我们完全可以拿到oncomine做一个验证,这样文章能发更高的分数。这次分享就到这里。

分享结束

(0)

相关推荐