[数据库介绍]一站式表达谱数据分析

表达谱数据分析的时候,经常包括各种各样的分析。比如差异表达分析,富集分析,GSEA,蛋白相互作用分析等等等等。NetwordAnalyst(https://www.networkanalyst.ca/)是一个一站式分析转录组数据的数据库。在这里我们可以分析常见的一些分析。

基本介绍

数据库一共包括 五种分析方式:

  1. 输入网络数据:比如从蛋白相互作用数据库下载下来的网络对应数据来进行可视化。其实功能类似于简易版的cytoscape。下图就是输入数据后得到的默认网络。

  2. gene list input:如果我们已经有目标基因了,需要进行富集分析;蛋白相互作用分析等。同时我们也可以输入多个数据集的结果,然后得到venn图相关的重叠结果进行分析。

  3. Gene Expression Table: 我们来输入RNA-seq或者microarray的表达矩阵,来进行下一步分析。

  4. Raw RNA-seq Data: 输入RNA-seq的 fastq格式的数据来进行下游分析。

  5. Multiple Gene Expression Tables: 输入多个数据集的表达矩阵,来对多个数据集进行整合的分析。

由于网站的功能很多,但是后续分析的结果类似,所以我们就用Multiple Gene Expression Tables来进行演示。

Multiple Gene Expression Tables

数据输入

点击Multiple Gene Expression Tables后,我们可以看到这样上传数据的界面。上传的表达矩阵的样本不能大于1000

我们通过点击Add New来上传表达矩阵。表达矩阵应该是是这样的一个格式。

第一行是样本的变化,同时用 #来增加一个NAME的表示代表第一列为基因名。

第二行是本次实验设计的分组。

后面的行数则为表达矩阵,第一列基因ID

PS:

我们使用实例文件来进行分析,实例文件包括三个数据集,两个RNA-seq以及一个芯片数据。

上传数据完成后,点击Proceed下一步。这里会提示我们是否想要下载一个融合的数据集,如果想要下载的话,可以点击Download。我们点击Next可以进行下一步

质量评估

分析的第一步就是对数据进行质量评估,评估每个样本的分布,这个网站提供了两种对于样本评估的方式。PCA图密度图

同时网站还提供了,对于不同数据集进行batch effect批次效应的矫正。

通过通过矫正完,可以看到矫正完的PCA图密度图

进行批次效应完事儿,我们点击Proceed

荟萃分析

通过完质量评估,并且去掉批次效应后,我们可以进行荟萃分析来结合不同数据库的结果来得到重叠的结果。数据库提供了不同的进行数据结果融合的方法,同时也给了推荐指数。

我们选择第一个点击submit,然后点击Proceed

差异基因

通过上面两部,我们可以得到差异表达基因。

同时我们点击View可以看到这个基因在每个数据集当中的变化。

接下来我们点击Proceed

下游分析

在下游分析中,网站给了现有的一些常用的分析。这些平时我们都是通过不同的软件来做的,但是这个网站整合到一起了。

PS:而且用一种正确的方式整合到一起了。(真的会有人会用差异分析的结果去做GSEA的)。

由于分析的结果较多,我们以Netword Visual Analytics来对来对其中的结果进行说明。剩下的大家可以自己去点点看。点击Netword Visual Analytics后,会让我们来选择用什么数据集。我们可以选择重叠的数据集也可以选择各自的数据集。我们选择融合的数据集。

点击完后,我们可以看到,很多目前文章里面做的网络都可以进行做。其中包括·蛋白相互作用分析(PPI); 转录调控网络; 疾病/药物相关网络共表达网络

而且网站对于一个分析也有很多其他的数据库可以选择。例如基因的蛋白相互作用(Generic PPI)。就可以选择string或者IMEx数据库。

我们选择好点击OK后,即可得到。对于网络的分析的一个初步的结果

下载

所有分析的结果,我们都可以下载下来

PS:其实目前很多基础的芯片数据分析的文章用这个网站就够了。而且方法也对,不会让一些不是很懂用法的虽然使用分析方式。当然同样的,这些也是最基本的分析方法,特别的还是需要自己分析的。

(0)

相关推荐

  • 肿瘤miRNA靶点预测数据库

    miRNA作为ncRNA的一类.其主要发挥功能的主要方式是通过和基因形成双向互补链进而来影响基因的表达.因此通过miRNA和基因序列是否互补就可以遇到miRNA可能的靶基因了.这个基本上就是经典的预测 ...

  • 数据库使用的隐藏技巧

    对于网络端的数据库而言,其实很多用法都很简单,我们只需要按照作者给提供的界面,选择合适的输入内容,就可以出来相对应的结果了.本公众号自开通以来也介绍了很多实用的数据库这次呢,就和大家分享一个一个数据库 ...

  • [数据库推荐]多基因转录因子调控网络预测

    我们之前做转录因子调控预测的时候,通常都是基于单一基因来做的,随着测序技术的成熟,我们在做完组学数据分析的时候,经常可以得到很多的基因.如果我们要寻找这么多基因共同转录因子的话,要怎么办呢?这次介绍的 ...

  • 怎么样查找正常组织的基因表达谱数据?

    大家可以收藏一下. 数据库介绍 RNA-Seq Atlas - 通过下一代测序在正常组织中进行基因表达谱分析的参考数据库 RNA-Seq Atlas是一个基于网络的RNA-Seq基因表达谱和查询工具库 ...

  • 生信神器之一站式表达谱数据分析

    表达谱数据分析的时候,经常包括各种各样的分析.比如差异表达分析,富集分析,GSEA,蛋白相互作用分析等等等等.NetwordAnalyst(https://www.networkanalyst.ca/ ...

  • SEO建站入门篇域名、空间、服务器、程序、数据库介绍

    锦绣大地SEO培训基地,拥有大量黑白帽SEO项目实战管理经验,擅长整站优化权重提升.在SEO内页排名技术.单页面优化.渗透劫持.发包技术.快排技术.整站优化技术.长尾词策略等上有打破常规的秘籍. 知识 ...

  • 利用NBI可视化+influxDB时序数据库构建物联网大数据分析平台

    什么是时序数据库        先来介绍什么是时序数据.时序数据是基于时间的一系列的数据.在有时间的坐标中将这些数据点连成线,往过去看可以做成多纬度报表,揭示其趋势性.规律性.异常性:往未来看可以做大 ...

  • 第75天: Python 操作 Redis 数据库介绍

    Redis 作为常用的 NoSql 数据库,主要用于缓存数据,提高数据读取效率,那在 Python 中应该如果连接和操作 Redis 呢?今天就为大概简单介绍下,在 Python 中操作 Redis ...

  • 第78天: Python 操作 MongoDB 数据库介绍

    MongoDB 是一款面向文档型的 NoSQL 数据库,是一个基于分布式文件存储的开源的非关系型数据库系统,其内容是以 K/V 形式存储,结构不固定,它的字段值可以包含其他文档.数组和文档数组等.其采 ...

  • 疫苗设计数据库介绍

    随着疫情的发展,目前对于新冠疫苗相信很多人都有一定了认识.当然在新冠之前也就存在其他疾病的疫苗了.疫苗的接种可以有效的防止我们受到其他物种感染的影响.之前常见的还有天花疫苗,HPV疫苗这类.因此对于很 ...

  • EDQM数据库介绍

    EDQM数据库介绍

  • DEAP数据库介绍--来自于音乐视频材料诱发得到的脑电数据

    更多技术干货第一时间送达 DEAP数据库简介 DEAP[1](Database for Emotion Analysis usingPhysiological Signals),该数据库是由来自英国伦 ...

  • 【金猿产品展】Yonghong Z-Suite——一站式大数据分析平台

    永洪科技产品 本产品由永洪科技投递并参与"数据猿年度金猿策划活动--2020大数据产业创新服务产品榜单及奖项"评选. 大数据产业创新服务媒体 --聚焦数据 · 改变商业 永洪一站式 ...