对于网络端的数据库而言，其实很多用法都很简单，我们只需要按照作者给提供的界面，选择合适的输入内容，就可以出来相对应的结果了。本公众号自开通以来也介绍了很多实用的数据库这次呢，就和大家分享一个一个数据库的隐藏技巧吧。这个技巧就是数据库的DOWNLOAD功能。

Download 下载

我们使用的很多数据库，其实数据库里面的所有内容都是分析好的。我们在使用数据库的时候，其实就是在所有的结果里面去寻找我们想要的数据结果。类似于一个检索的功能。而这些分析好的数据，很多网站也都提供了下载的功能，通过下载的功能，我们就可以得到和这个数据库有关的结果结果。例如，我们在之前介绍的多基因转录因子富集的数据库当中([数据库推荐]多基因转录因子调控网络预测)，这个网站就提供了数据下载的功能。

为什么要下载所有数据

很多人，可能会问。既然数据库都提供了检索功能了。那为什么还需要特意的去下载离线数据库呢。这个东西又大又占空间。为什么还要下载下来的呢？

1. 数据库的所有数据的重要性

首先呢，我们都知道，现在二代测序的数据有很多，但是对于二代测序数据的结果分析，如果要从原始数据开始的话，那就要从 fastq 的序列数据开始进行质控呀；进行去除接头呀；比对呀……等等一系列操作。而这些操作的呢，往往需要代码来进行操作。例如我们要安装bowtie2这个软件，可能就需要下面这样操作:

对于很多医学人员来说。能看懂代码基本都是不可能的，更别说写代码了。而数据库的存在，就相当于我们跳过了前面的一些数据分析的过程，可以直接得到最终的数据。这样我们就可以转换为我们能看到的数据了。至于有人觉得可能说，万一数据库分析错了呢。。。相信我，人家专门分析这些数据的人，知道的肯定比你看一篇帖子知道的多。。。

例如还是上面数据库的CHEA3数据库。我们看下载里面包括了多种多样的数据。其中就包括ENCODE数据库当中所有CHIP-seq数据分析的结果。这个时候我们把这个数据库下载下来，就相当于获得了所有ENCDOE数据库当中所有chip-seq分析的结果了。

2. 数据库的不稳定性

有时候我们会碰到这种情况，我们之前经常使用的数据库，有一天发现打不开了。。。而且之后很久都打不开了。。这个不是说你的网不好了。有可能就是经营这个数据库的团队，把这个数据库给关闭了。至于为啥呢，有可能是用相同的空间去开发新的数据库了，也有可能就是公开这么久了。就想关闭了。毕竟经营还是要花钱的。至于说和基于这个数据库发表的文章啥的。反正当时发表的时候是能用的。那文章发表了。。。谁还在乎这个呢。。所以说吧，如果有经常使用的数据库，而恰好有数据下来的功能。最好还是把原始数据下载下来，不然有一天人家把数据库关闭了。。你怎么办。。

3. 数据结果的DIY

对于相同的数据，我们每个人基于自己的课题可能有不同的想法和用法的。网上的数据库有时候会基于自己想法了设计相对应的检索方式，这样有可能不适合我们做自己想做的事情。这个时候我们只要下载了所有数据库的数据，就可以根据自己的的需要来进行自己相对应的检索了。

比如说：ChEA3数据库。这个数据库的主要目的是寻找共同调控多基因的转录因子。但是万一我有只有一个基因，我就想找这个基因的转录因子是什么。怎么办。那我们就可以把原始数据下载下来，然后单独的检索这个基因就可以得到结果了。更比如说，我就只相信chip-seq的结果。对于转录组的共表达结果保有怀疑。那我就可以把这个数据库里面，里面三个和chipseq有关的数据下来下载，然后通过各自数据的检索，最后交叉比对。得到最终想要的结果。

写在最后

前面已经讲了数据库所有结果下载的重要性，也说明了为什么要下载这些结果。所以建议大家，如果之后还看到有用的数据库的时候，正好有数据库下载的按钮。如果觉得会经常用，可以考虑把结果下载下来。以后我们在介绍数据库的时候，也会考虑说一句这个数据库有没有下载功能。这样大家就可以考虑要不要下载原始数据了。

数据库使用的隐藏技巧

1. 数据库的所有数据的重要性

2. 数据库的不稳定性

3. 数据结果的DIY

相关推荐