R语言GEO数据处理(六)

# 5. 差异分析 -----------------------------------------------------------------

library(limma)

design=model.matrix(~group_list)

fit=lmFit(exp2,design)

fit=eBayes(fit)

deg=topTable(fit,coef=2,number = Inf)

colnames(deg)

#加probe_id列,把行名变成一列

library(dplyr)

deg <- mutate(deg,probe_id=rownames(deg$probe_id));head(deg)

#加symbol列,去重复

deg <- inner_join(deg,ids,by="probe_id");head(deg)

deg <- deg[!duplicated(deg$symbol),]

#标记上下调基因

logFC=0.1  #变化超过2倍的视为差异基因

P.Value = 0.01  #P值小于等于0.01视为显著

k1 = (deg$P.Value < P.Value)&(deg$logFC < -logFC)

k2 = (deg$P.Value < P.Value)&(deg$logFC > logFC)

change = ifelse(k1,"down",ifelse(k2,"up","not"))

deg <- mutate(deg,change);head(deg)

table(deg$change)

#加ENTREZID列,用于富集分析

library(ggplot2)

library(clusterProfiler)

library(org.Hs.eg.db)

s2e <- bitr(deg$symbol,

fromType = "SYMBOL",

toType = "ENTREZID",

OrgDb = org.Hs.eg.db)#人类

deg <- inner_join(deg,s2e,by=c("symbol"="SYMBOL"));head(deg)

write.csv(deg,file = "mydata.csv",row.names = T)

save(group_list,deg,logFC_t,P.Value_t,file = "mydata.Rdata")

(0)

相关推荐

  • Cadence 建立 最简单的器件Library ---Symbol

    今天从基础开始学习Cadence,建议一个简单的器件symbol. 选择这个LDO ,SGM2036 ,从规格书中找到典型应用电路: 点击File ,选择New中的library. 完成如下一个sym ...

  • Probe id 如何转换为gene symbol?

    之前有很多人问我们,有时候没有DataSet full SOFT file文件,只有图二的界面,该怎么办呢? 我们可以下载Series Matrix File(s),然后进行分析 但是这样得到的仅有p ...

  • R语言GEO数据处理(一)

    # 1. GEO数据下载 ----------------------------------------------------------------- rm(list=ls())   #清空环境 ...

  • R语言GEO数据处理(二)

    #1. GEO数据的下载 ##1.1 方法一:下载RAW Data数据 ##1.2 方法二:下载series Matrix表达数据 rt <- read.table("GSE56814 ...

  • R语言GEO数据处理(三)

    # 2. 提取表达和临床信息 --------------------------------------------------------------- ##2.1 通过pData函数获取分组信息 ...

  • R语言GEO数据处理(四)

    # 3. id转换 ----------------------------------------------------------------- ##方法一:使用R包转换 index = gse ...

  • R语言GEO数据处理(五)

    # 4. PCA分析 ---------------------------------------------------------------- library(FactoMineR) libr ...

  • R语言GEO数据处理(七)

    # 6. 可视化展示 ---------------------------------------------------------------- ##6.1 火山图 library(ggplot ...

  • 各类统计方法R语言实现(六)

    今天是各类统计方法R语言实现的第六期,我们主要介绍多元线性回归.回归诊断. 多元线性回归 多元线性回归指的是用多个自变量预测一个因变量,且自变量与因变量之间为线性关系,在分析过程中要考虑交互项的问题. ...

  • R语言GEO数据挖掘-功能富集分析

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO数据挖掘. 功能富集分析   在得到了差异基因的基础之上,进一步进行功能富集分析,这里 ...

  • R语言GEO数据挖掘01-数据下载及提取表达矩阵

    欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO数据挖掘. 这一节的内容包括应用 GEOquery包下载芯片数据,提取表达矩阵,提取m ...