技术贴 | 宏转录组专题 | DDBJ数据库:宏转录组测序数据下载
本文由阿童木根据实践经验而整理,希望对大家有帮助。
原创微文,欢迎转发转载。
DDBJ(DNA Data Bank of Japan)是与NCBI的GenBank,EMBL的EBI数据库齐名的世界三大DNA 数据库之一。DDBJ由日本研究机构于1983年建立。DDBJ数据库不仅已经收录了20多万个研究的600多万样本的测序数据,而且现在还保持每日更新。
DDBJ数据库地址:https://www.ddbj.nig.ac.jp/index-e.html
DDBJ数据库收录的数据有:
人、动物、植物、土壤、水体等样本的基因组、转录组、表观组、外显子组、宏基因组、宏转录组等多组学数据。
如何从DDBJ中获取宏转录组测序数据?
1从宏转录组研究的文章中找到DDBJ DRA编号,例如:
2打开DDBJ数据库,点击进入Sequence Read Archive (DRA)。
3点击进入Search。
4在Accession中输入DRA编号(例如:DRA006303),点击Search。
5点击进入FASTQ目录,右键鼠标获取DRR110568_1.fastq.bz2和DRR110568_2.fastq.bz2的下载链接。
6在linux环境中下载,解压fastq文件。
下载
wget ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA006/DRA006303/DRX103657/DRR110568_1.fastq.bz2 &
wget ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA006/DRA006303/DRX103657/DRR110568_2.fastq.bz2 &
解压
bzip2 -d DRR110568_1.fastq.bz2 &
bzip2 -d DRR110568_2.fastq.bz2 &
这样我们就获得了两个样本的宏转录组测序的fastq文件。