助力科研基金申请:微生物组测序分析步骤和预算模板
微生物组测序分析包括菌群结构谱、宏基因组和宏转录组,但是目前宏转录组研究较少。所以,本文介绍菌群结构谱、宏基因组测序分析的主要步骤和预算,以助大家申请相关科研基金。本文介绍三种模式:(1)单独的菌群结构谱,即只研究菌群种类和丰度,该模式的特点是所需资金少,但研究的深度浅;(2)单独的宏基因组,研究菌群种类和丰度的同时,研究菌群所携带的基因的功能和丰度,该模式的特点是研究的深度深,但所需资金多而且风险较大;(3)菌群结构谱+宏基因组,该模式的特点是先投入较少的资金较大范围的筛选样品,然后从中挑出某些样本投入较多的资金深入研究,实现较深研究深度的同时规避风险。如有疑问或想和深圳微生太科技有限公司合作,可以联系江舜尧。电话:13391510601,微信13391510601或17316279151。第一部分 步骤和预算第一种模式:单独的菌群结构谱1.1 步骤:① 利用菌群采样器(或其他工具,如冻存管)采集待测样本(如果样本是人类粪便,建议使用菌群采样器采样,详细信息点击:一种基于菌群采样器的粪便菌群采样方法);② 使用宏基因组 DNA 提取试剂盒提取样本(如粪便)中的总 DNA;③ 以细菌16S rRNA 基因的V3~V4可变区序列为靶标,以带有barcode 序列的338F-806R为引物(或其他靶标和引物,见表1),进行 PCR 扩增,获取 PCR 产物;表1 各种引物及其序列测序类型引物名称引物序列长度测序平台细菌16S rRNA515F5'- GTGCCAGCMGCCGCGG-3'392bpPE250平台,土壤等环境样本推荐使用907R5'- CCGTCAATTCMTTTRAGTTT-3'细菌16S rRNA338F5'- ACTCCTACGGGAGGCAGCAG-3'468bpPE300平台,粪便等样本推荐使用806R5'- GGACTACHVGGGTWTCTAAT-3'真菌ITSITS5F5'- GGAAGTAAAAGTCGTAACAAGG300bp左右PE250平台,欲获得较丰富的种类者推荐使用ITS1R5'- GCTGCGTTCTTCATCGATGC真菌18S547F5'- CCAGCASCYGCGGTAATTCC420bpPE300平台,欲获得较准确的种类者推荐使用V4R5'- ACTTTCGTTCTTGATYRA④ PCR 产物经过定量及文库构建后,利用 Illumina MiSeq PE300平台(根据实际情况调整)进行高通量测序,获取细菌16S rRNA 基因的V3~V4 可变区碱基序列信息(根据实际情况调整);⑤ 利用 QIIME 软件,对测序序列进行质控及 OTU(分类学操作单元)聚类,OUT代表序列与Greengenes数据库(或其他数据库,见表2)进行比对分析,获取 OTU 对应的分类单元(包括门纲目科属种)及其相应的丰度信息;表2 各序列比对数据库测序基因建议比对数据库数据库网址16S rRNAGreengeneshttp://greengenes.secondgenome.com/Silvahttp://www.arb-silva.deRDPhttp://rdp.cme.msu.edu/18S rRNASilvahttp://www.arb-silva.deITSUNITEhttps://unite.ut.ee/⑥ 计算 Chao1、ACE、Shannon 和 Simpson 等度量指数,评估样品中细菌菌群的丰富度和均匀度;⑦ 综合应用 PCA 分析、Metastats 分析、LEfSe 分析、ANOVA 方差分析等方法寻找各组样品中的特征菌;⑧ 应用 RDA 分析关联菌群结构和环境因子(如动物生理生化指标),寻找与环境因子(或动物病理生理特征)存在正相关或负相关的菌群;⑨ 应用PICRUSt 软件,预测各组样本菌群的代谢功能,从中找出有差异的组分。1.2 预算:X*550元/例=Y元。建议单价按550-500元预算,样本多时,单价偏低,样本少时,单价偏高。该预算比市场价高,这样做是为了不至于被动。表3 菌群结构谱测序分析预算明细实验步骤单价(元)样本数总价(元)DNA提取50X50XPCR扩增100X100X文库构建80X80X测序200X200X数据分析120X120X共计(元)550X注:① 如果不是按550元做预算,记得调整明细。② 如果样本是人类粪便,建议增加菌群采样器的预算,每份样本用一个采样器,单价为55-50元(该预算比市场价高)。③ 本预算按照从DNA提取到数据分析全外包的模式,这样外协检测费在标书总预算中会占比较高。如果一定要降低检测费比例,标书中做预算时可以将DNA提取费做成购买DNA提取试剂盒的费用,如美国Omega菌群DNA提取试剂盒,2000元/盒,50次装(即理论上可以提取50份样品)。此部分可以加倍预算,即,如果需要提取100份样本,可以预算购买4个50次装的试剂盒。第二种模式:单独的宏基因组2.1 步骤:① 利用菌群采样器(或其他工具,如冻存管)采集待测样本(如果样本是人类粪便,建议使用菌群采样器采样,详细信息点击:一种基于菌群采样器的粪便菌群采样方法);② 使用宏基因组 DNA 提取试剂盒提取样本中的总 DNA;③ 总 DNA 经过随机打断,连接接头和PCR扩增富集等处理,构建测序文库;④ 利用 Illumina HiSeq 4000高通量测序平台进行宏基因组测序,获得样品宏基因组序列;⑤ 测序原始数据质控后利用 SOAP denovo 组装软件进行组装,再利用 MetaGeneMark 软件进行 ORF(Open Reading Frame,开发阅读框)预测,经 CD-HIT 软件去冗余后获得非冗余基因集,采用SoapAligner 软件,综合应用各样本的测序数据,获得各样品中各基因的丰度表;⑥ 从非冗余基因集出发,与 NCBI 的 NR 数据库进行比对,获得基因的物种注释信息,及物种丰度表;⑦ 从非冗余基因集出发,进行代谢通路(KEGG),同源基因簇(eggNOG),碳水化合物酶(CAZy)的功能注释和丰度分析,获得基因功能丰度表;⑧ 基于物种丰度表和功能丰度表,进行丰度聚类分析、PCA 分析、样品聚类分析、显著性差异分析(包括Metastats 和LEfSe)、代谢通路比较分析,挖掘各组样本之间的物种组成和功能组成差异,为进一步深入研究xxxxx提供支撑。2.2 预算:Z*5500元/例=W元。建议单价按5500-5000元预算,样本多时,单价偏低,样本少时,单价偏高。该预算比市场价高,这样做是为了不至于被动。表4 宏基因组测序分析预算明细实验步骤单价(元)样品数总价(元)DNA提取200Z200Z文库构建600Z600Z测序900Z900Z数据分析3800Z3800Z共计(元)5500Z注:① 如果不是按5500元做预算,记得调整明细。② 如果样本是人类粪便,建议增加菌群采样器的预算,每份样本用一个采样器,单价为55-50元(该预算比市场价高)。③ 本预算按照从DNA提取到数据分析全外包的模式,这样外协检测费在标书总预算中会占比较高。如果一定要降低检测费比例,标书中做预算时可以将DNA提取费做成购买DNA提取试剂盒的费用,如美国Omega菌群DNA提取试剂盒,2000元/盒,50次装(即理论上可以提取50份样品)。此部分可以加四倍预算,即,如果需要提取100份样本,可以预算购买8个50次装的试剂盒。第三种模式:菌群结构谱+宏基因组3.1 步骤:3.1.1 菌群结构谱部分:① 利用菌群采样器(或其他工具,如冻存管)采集待测样本(如果样本是人类粪便,建议使用菌群采样器采样,详细信息点击:一种基于菌群采样器的粪便菌群采样方法);② 使用宏基因组 DNA 提取试剂盒提取样本(如粪便)中的总 DNA;③ 以细菌16S rRNA 基因的V3~V4可变区序列为靶标,以带有barcode 序列的338F-806R为引物(或其他靶标和引物,见表1),进行 PCR 扩增,获取 PCR 产物;表1 各种引物及其序列测序类型引物名称引物序列长度测序平台细菌16S rRNA515F5'- GTGCCAGCMGCCGCGG-3'392bpPE250平台,土壤等环境样本推荐使用907R5'- CCGTCAATTCMTTTRAGTTT-3'细菌16S rRNA338F5'- ACTCCTACGGGAGGCAGCAG-3'468bpPE300平台,粪便等样本推荐使用806R5'- GGACTACHVGGGTWTCTAAT-3'真菌ITSITS5F5'- GGAAGTAAAAGTCGTAACAAGG300bp左右PE250平台,欲获得较丰富的种类者推荐使用ITS1R5'- GCTGCGTTCTTCATCGATGC真菌18S547F5'- CCAGCASCYGCGGTAATTCC420bpPE300平台,欲获得较准确的种类者推荐使用V4R5'- ACTTTCGTTCTTGATYRA④ PCR 产物经过定量及文库构建后,利用 Illumina MiSeq PE300平台(根据实际情况调整)进行高通量测序,获取细菌16S rRNA 基因的V3~V4 可变区碱基序列信息(根据实际情况调整);⑤ 利用 QIIME 软件,对测序序列进行质控及 OTU(分类学操作单元)聚类,OUT代表序列与Greengenes数据库(或其他数据库,见表2)进行比对分析,获取 OTU 对应的分类单元(包括门纲目科属种)及其相应的丰度信息;表2 各序列比对数据库测序基因建议比对数据库数据库网址16S rRNAGreengeneshttp://greengenes.secondgenome.com/Silvahttp://www.arb-silva.deRDPhttp://rdp.cme.msu.edu/18S rRNASilvahttp://www.arb-silva.deITSUNITEhttps://unite.ut.ee/⑥ 计算 Chao1、ACE、Shannon 和 Simpson 等度量指数,评估样本中细菌菌群的丰富度和均匀度;⑦ 综合应用 PCA 分析、Metastats 分析、LEfSe 分析、ANOVA 方差分析等方法寻找各组样本中的特征菌;⑧ 应用 RDA 分析关联菌群结构和环境因子(如动物生理生化指标),寻找与环境因子(或动物病理生理特征)存在正相关或负相关的菌群;⑨ 应用PICRUSt 软件,预测各组样本菌群的代谢功能,从中找出有差异的组分,为深入挖掘菌群的功能、剖析作用机制做铺垫。3.1.2 宏基因组部分:① 通过上述菌群结构谱的研究,筛选出关键节点的样本,进行宏基因组测序,以深入挖掘菌群的功能,并剖析作用机制,具体为:② 使用宏基因组 DNA 提取试剂盒提取样本中的总 DNA;③ 总 DNA 经过随机打断,连接接头和PCR扩增富集等处理,构建测序文库;④ 利用 Illumina HiSeq 4000高通量测序平台进行宏基因组测序,获得样本宏基因组序列;⑤ 测序原始数据质控后利用 SOAP denovo 组装软件进行组装,再利用 MetaGeneMark 软件进行 ORF(Open Reading Frame,开发阅读框)预测,经 CD-HIT 软件去冗余后获得非冗余基因集,采用SoapAligner 软件,综合应用各样本的测序数据,获得各样本中各基因的丰度表;⑥ 从非冗余基因集出发,与 NCBI 的 NR 数据库进行比对,获得基因的物种注释信息,及物种丰度表;⑦ 从非冗余基因集出发,进行代谢通路(KEGG),同源基因簇(eggNOG),碳水化合物酶(CAZy)的功能注释和丰度分析,获得基因功能丰度表;⑧ 基于物种丰度表和功能丰度表,进行丰度聚类分析、PCA 分析、样本聚类分析、显著性差异分析(包括Metastats 和LEfSe)、代谢通路比较分析,挖掘各组样本之间的物种组成和功能组成差异,为进一步深入研究xxxxx提供支撑。3.2 预算:即菌群结构谱和宏基因组的总和。但是菌群结构谱的样本数大于宏基因组的,两者可以大概按照5:1的比例计算。明细见以下两个表格。表3 菌群结构谱测序分析预算明细实验步骤单价(元)样品数总价(元)DNA提取50X50XPCR扩增100X100X文库构建80X80X测序200X200X数据分析120X120X共计(元)550X表4 宏基因组测序分析预算明细实验步骤单价(元)样品数总价(元)DNA提取200Z200Z文库构建600Z600Z测序900Z900Z数据分析3800Z3800Z共计(元)5500Z注:① 如果不是按550元和5500元做预算,记得调整明细。② 如果样本是人类粪便,建议增加菌群采样器的预算,每份样本用一个采样器,单价为55-50元(该预算比市场价高)。③ 本预算按照从DNA提取到数据分析全外包的模式,这样外协检测费在标书总预算中会占比较高。如果一定要降低检测费比例,标书中做预算时可以将DNA提取费做成购买DNA提取试剂盒的费用,如美国Omega菌群DNA提取试剂盒,2000元/盒,50次装(即理论上可以提取50份样品)。菌群结构谱部分,此部分可以加倍预算,即,如果需要提取100份样本,可以预算购买4个50次装的试剂盒;宏基因组部分,此部分可以加四倍预算,即,如果需要提取100份样本,可以预算购买8个50次装的试剂盒。第二部分 基础知识一 结题报告模板