GEO数据库介绍 (一)
昨天通过岛上生活来和大家了解了一下基本的生信分析文章的思路是什么样子的从荒岛求生看公共数据库生信分析文章。今天就和大家来学习一下GEO数据库,这个存放公共高通量测序数据的地方。
简介
GEO数据库(https://www.ncbi.nlm.nih.gov/gds/)是一个储存芯片、二代测序以及其他高通量测序数据的一个数据库。利用这个数据库,我们可以检索到其他一些人上传的一些实验测序数据。
不涉及任何检测原理的角度来说的话,所谓的高通量检测,其实就是一次性检测很多指标变化的技术。例如我们说的表达谱数据,就是来检测基因表达水平。比如我们要对一个人来进行高通量检测的话,就能知道这个人上万个基因的表达水平了。
基本使用
由于GEO数据库和我们之前介绍的gene数据库 [数据库推荐]gene:基因相关信息查询 以及我们常用来搜索文献的pubmed都是一个机构的。使用这个数据库,我们需要做的就是就是就是提供检索式。检索式可以是简单的几个关键词,也可以是制定特殊的检索式。
例如我们直接搜索gastric cancer。
检索结果介绍
我们检索完之后的主要界面是这个样子的。
我们一般可以用到的进一步筛选的过程就是:
在样本类型当中寻找自己想要的物种。
由于GEO包括了很多不同组学的数据,如果我们有特定的检索目的的话,我们可以在 Study Type当中来选择合适的数据类型。
默认的检索结果的排序是基于检索相关性来排序的。而我们再找目标数据的时候。有时候需要看样本量,一般来说样本量越大其实也就越好的。所以我们可以改变一下检索结果的排序。
具体数据集介绍
每一个数据集,我们可以在检索界面上下面的信息当中看到。
如果想要查看数据集的详细信息,我们就可以点击数据集的相关链接,就可以到了了。关于数据集内的详细信息。由于篇幅的限制,我们明天再做介绍。接下来是我们岛上的生存日记。
GEO岛上日记1.0
上岛的第一天,首先,我们可以观察一下我们这个岛,这个岛的中间由河流分成了,三个部分。由于上岛的第一天什么都没有,自身业务能力还是太差。所以也没办法进入到别的地方去。只能在很小的范围内活动了。
岛上生活的第一天,就是熟悉熟悉周围的环境,一穷二白来到岛上的我,除了一双勤劳的双手。第一次到一个地方,还是有有一个坐的地方,所以我就想自己动手做一个凳子(胃癌)。同样是制造凳子,基于材料的不同我们就可以制造不同样式的凳子。经过我在岛上的疯跑,我发现岛上有很多材料可以做凳子,比如说,我就发现了石头和木材。
利用石头我就可以造一个石头凳子,利用木材就可以造一个木头凳子。
由于我感觉石头凳子太硬了。坐的屁股疼,最后我决定做了一个木头椅子。