用viroblast搭建本地blast网站
写在写在前面的前面
高通量测序已然普及。要把某个并不太复杂的物种基因组挂到一个相对粗糙的染色体水平,或许花费只需10w上下(*不看人力*)。大多数课题组从经费上,事实已经能够承受。虽然已报道的植物仅仅300多个,但更多课题组早已有自己组装好的基因组。**基因组项目,从某个角度来说,是该项目负责人在做的公益项目**。一方面是人力物力的输出,另一方面,我们很清楚,投入与收益很少能够对等。基因组的公布**或共享**事实上,就是在在免费的公共服务。
回到主题,如果更好地让一个基因组测序结果充分地得到利用,那么最直接的,就是建立相应的网站并分享给有需要的人或课题组。
课题组研一成员老饕给实验室搭建了一个实验室内部使用的Blast网页服务。我便要其将操作流程整理并投稿至**生信札记**,并希望对有需要的朋友有参考意见。以下全文:
写在前面
由于我们实验室的主要研究对象是荔枝,而在ncbi上的blast中还没收录荔枝基因组信息,所以使用起来不是那么方便。那么我们能不能实现一个本地的blast网站,使我们可以用荔枝的基因信息作为query,以荔枝的整个基因组作为Database,进行blast搜索呢?
答案是肯定的,目前我知道的有几个工具可以实现我们的目的——
viroBlast
SequenceServer
wwwblast
这里我用的是 viroBlast。
实现过程
首先,要安装一些使用 viroBlast 的依赖软件。
1. 安装 blast+,使用conda安装blast,也可以去ncbi上下载相应的blast+压缩包,然后再自行安装。
conda install blast
2. 安装 服务器 apache2,因为我们要搭建的是一个网页版的blast。 如果你像我一样已经安装了xampp集成包,也可不用直接单独安装apache2。
sudo apt-get install apache2
3. 安装PHP,因为viroBlast是用PHP编写的,所以我们需要有PHP。当然,如果你安装了xampp,同样也不用单独安装PHP,这些在xampp中都包含着。
sudo apt-get install libapache2-mod-php php php-gd
4. 下载viroblast。要下载viroblast,首先先要去其官网申请许可。当然在GitHub上也可以找到资源下载。https://indra.mullins.microbiol.washington.edu/viroblast/viroblast.php
进入官网,然后点击Download
然后选择 Academic License ,点击之后填写相关信息并提交,就会收到被授予许可的邮件以及下载链接。
5. 有了下载链接之后,我们就可以下载 viroBlast啦,以下是我获得的链接。
wget http://indra.mullins.microbiol.washington.edu/viroblast/download.php?ID=viroblast.tar.gz
6. 解压
tar -zxvf viroblast.tar.gz
7. 移动viroblast 文件夹到相应的位置。
如果你是单独安装的apache2, 那么移动到 /var/www/html 下:
mv viroblast /var/www/html/
如果你是跟我一样,安装的xampp, 那么移动到 /opt/lampp/htdocs/ 下:
mv viroblast /opt/lampp/htdocs/
8. 通过网页查看viroblast是否安装成功。打开浏览器,网页访问:http://主机IP/viroblast/viroblast.php,显示如下说明安装成功:
9. 然后再用makeblastdb构建自己所需要的blast数据库(本地blast库构建代码语法如下):
makeblastdb -in db.fasta –dbtype prot/nucl -parse_seqids -out dbname
将核酸库放在/viroblast/db/nucleotide下
将蛋白库放在/viroblast/db/protein下
10. 设置好数据库之后,如图配置 viroblast.ini 文件。
11. 至此,viroBlast 已经完全配置好并且可以正常使用啦! 如果想更改一下前端页面的样式或者伪装一下Logo, 那么可以自行修改viroblast.php文件。
写在最后
读研半年多,
收获了很多东西,
但似乎,又失去了某些东西,不管是人或者事。。
嗯,生命不息,修行不止