GEO在线分析工具
GEO2R是GEO在线分析工具,基于此工具可以对部分GEO样品数据进行基因差异表达分析。该工具主要针对芯片数据,借助R 及Limma包完成分析过程,用户只需要在网业上进行简单的点击等手动操作即可获得分析结果。
以下内容,将利用案例数据GSE106876 (B细胞淋巴瘤9个样本数据)进行演示。
GEO2R分析页面
通过GEO主页Tools,点击Analyze a Study with GEO2R,可进入GEO2R分析页面(网址:https://www.ncbi.nlm.nih.gov/geo/geo2r/),页面显示如下图A。
在搜索栏中输入GEO accession 搜索需要分析的数据,注意,登录号只能是GSE登录号。以GSE106876为例,搜索结果如下图B。若对应的GSE数据不能利用GEO2R在线工具分析,网址会进行提示。
差异分组
搜索出所有样品之后,选择Define groups,选定差异比较分组的样品(如果是多平台数据,请先确定平台)。在Define groups下拉输入框中,先输入control,点击Enter键,确定第一个分组,同样输入第二个分组tumour,设定第二组。(注意先后顺序,对照在前,处理在后)。
选中样品之后,点击分组(control or tumour),例如案例中control选中了三个样品,tumour选中三个样品,具体见下图。
设定分组之后,点击Top250,可以依据网址的默认设置参数,进行差异分析,并显示分析结果的前250个(如下图)。列表结果中会显示出计算的相关数据,包括P值,logFC,以及相关的基因信息等等,而通过页面Save all results,可以针对所有的数据分析下载保存,不限于Top250。
点击左侧单个探针ID,可以查看到该ID对应数据变化的分布情况,如下图所示,由样本数据中该探针对应的表达量变化图片,结合logFC 值-3.68,可以看到,该探针对应的基因出现了下调(P.adjust=0.0256)。
数据分布
基于选中的六个样品,选择Value distribution,点击veiw,可以查看该六个样品的数据分布情况,显示结果为box 分布图(如下图)。如果需要所有样品的数据分布图,删除分组设置即可。
参数修改
点击Options,可以进入差异比较的参数设置页面(如下图),可以对P值矫正方法,数据转换方法,以及相关信息显示进行修改。
其他
此外,还可以通过Profile Graph 查找单基因表达谱,以及通过R script,查看改组差异分析对应的R代码。