GEO数据挖掘只分析一张芯片,还能发文章吗
曾经很多人问过我们,GEO数据挖掘只有一张芯片,还能发文章吗?我们的答
案:肯定能。今天就给大家分享一篇只分析了一张芯片的文章,这篇文章2018年8月份发表在BioMed Research International,BioMed Research International最新影响因子为2.58,作者是中国的研究者。
论文题目
Identification of Key Genes and Pathways in Triple-Negative Breast Cancer by Integrated Bioinformatics Analysis
论文摘要
目的:三阴性乳腺癌是指不表达雌激素受体(ER),孕酮受体(PR)或人表皮生长因子受体2(Her2)的乳腺癌。本研究旨在确定关键途径和基因,并找出三阴性乳腺癌(TNBC)的潜在起始和进展机制。
方法:我们从Gene Expression Omnibus(GEO)数据集下载了GSE76275的基因表达谱。该微阵列Super-Series组由265个样品的基因表达数据组成,其中包括67个非TNBC和198个TNBC。接下来,鉴定了所有差异表达的基因(DEG),其中p <0.01且倍数变化≥1.5或≤-1.5。
结果:列出了56个上调基因和151个下调基因,基因本体论(GO)和京都基因和基因组途径百科全书(KEGG)富集分析为执行。这些显着改变的基因主要参与生物学过程,称为前列腺腺形态发生,内耳形态发生,细胞成熟,消化道形态发生,自主神经系统发育,单价无机阴离子稳态,神经嵴细胞发育,树突延伸调节和神经胶质细胞增殖,免疫系统过程称为细胞分化,免疫应答调节和巨噬细胞活化。基因主要参与称为卵母细胞减数分裂的KEGG途径。使用来自cBioPortal整合的癌症基因组图谱(TCGA)的数据集对所有DEG进行生存分析,其中SRY相关HMG-box 8(SOX8),雄激素受体(AR)和染色体9Open阅读框152(C9orf152)的扩增是Nik相关激酶(NRK)和RAS癌基因家族30(RAB30)与预期寿命呈正相关(p <0.05)。
结论:这些鉴定的通路和基因有助于了解TNBC的发展机制。此外,SOX8,AR,C9orf152,NRK和RAB30等关键基因和通路可能是治疗TNBC的有前途的靶标。
文章思路和分析内容
1、在GEO数据库只下载了一张芯片GSE76275
2、进行差异表达分析,画张热图,画张火山图
3、将差异基因进行GO富集分析
4、将差异基因进行KEGG富集分析
5、将差异基因进行PPI分析
6、对筛选出的关键基因做生存分析
7、最终,作者通过以上分析,得出这样的结论:这些鉴定的通路和基因有助于了解TNBC的发展机制。此外,SOX8,AR,C9orf152,NRK和RAB30等关键基因和通路可能是治疗TNBC的有前途的靶标。
其实,这些文章的套路非常简单,即使这么简单也能发两三分的文章,下面是我们总结的套路流程图:
END