MAC版: 保姆式SRA Toolkit下载原始数据
本期和大家分享糯米饭在使用SRA Toolkit下载NCBI-SRA原始数据的一些Tips,时间宝贵,直接上干货。
1.明确Project:SRP119720,打开浏览器,输入:
https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP119720&o=acc_s%3Aa
2.下载:Accession List「获得SRR_Acc_List.txt」;其打开后格式如下「糯米饭使用的是TextMate软件」当然你用其他的txt编辑器也是可以的;
3.安装SRA Toolkit软件
打开浏览器,输入
https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software
点击MacOS 64 bit architecture后下载得sratoolkit.2.9.6-1-mac64.tar.gz
鼠标双击sratoolkit.2.9.6-1-mac64.tar.gz后解压
4.安装Aspera connect
打开浏览器,输入
https://downloads.asperasoft.com/connect2/
点击Download Aspera Connect 3.9.9「按步骤下载安装」
鼠标双击IBMAsperaConnectInstallerOneClick-3.9.9.177872.dmg「安装」
5.添加Aspera connect在终端中路径「建议先学Linux中vim编辑和环境变量」
打开终端
输入
vim ~/.bashrc
光标向下移动,按下键盘i「进入insert模式」
复制
export PATH=/Users/apple/Applications/Aspera\ Connect.app/Contents/Resources:$PATH
按下键盘ESC「进入安全模式」
输入:wq后回车「保存」
输入
source ~/.bashrc
改变SRA Toolkit软件下载默认路径『Optional』
若不修改,则下载到~/ncbi/public/sra 目录下
打开终端
进入sratoolkit中bin文件夹:输入
cd /Users/apple/Desktop/sratoolkit.2.9.6-1-mac64/bin
./vdb-config -i
按上下键移动,到Change,回车后选择对应的目录『该目录必须为空』,移动到Save回车后,移动到Exit回车
7.开始下载原始数据
打开终端
输入
for sample in $(cat /Volumes/RNAseq/SRP119720/SRR_Acc_List.txt) ; do
/Users/apple/Desktop/sratoolkit.2.9.6-1-mac64/bin/prefetch ${sample}
done
解释:
/Volumes/RNAseq/SRP119720/SRR_Acc_List.txt「放置SRR_Acc_List.txt文件的绝对路径」
/Users/apple/Desktop/sratoolkit.2.9.6-1-mac64/bin「放置sratoolkit软件的绝对路径」
然后你的电脑就开始嗖嗖嗖地下载原始数据啦~~
编辑:糯米饭
校审:糯米饭