转录组测序和表达谱测序之间的区别
1. 英文名称:RNA-seq(Transcriptome)
2. 产品的定义:
通过RNA测序,既想得到样本中序列的信息,又需要对序列的表达进行定量和分析。
那么,对于没有参考基因组的物种,RNA-seq(Transcriptome) 当然就是需要:
a.进行de novo拼接,对拼接得到的Unigene进行注释;
b.然后计算de novo得到的Unigene的表达量。所以,这个分析就包含了核酸序列分析和核酸表达定量分析。
对于已有参考基因组的物种,RNA-seq(Transcriptome) :
a.会对测序结果进行基于参考基因组的比对和拼接,从而分析样本中转录本的可变剪切、基因融合、SNP变异等此类针对转录本序列的分析;
b.在序列分析的基础上,在分析转录本的表达量。所以,这个分析也包含了核酸序列的分析和核酸表达量的分析。
3. 对测序的要求:因为涉及到序列的拼接和组装,所以转录组测序对数据量的要求较高(一般单个样本的测序量> 4G),同时一般要求使用双末端测序(Paired end)的数据。
表达谱测序
1. 英文名称:RNA-seq(qualification)
2. 产品的定义:
Qualification,顾名思义,这个产品的定义就是只对样本中mRNA进行定量分析,而不需要分析mRNA序列的变化。通常此类分析,需要参考序列。参考序列可以是:基因组序列(有参考基因组的物种)或转录组序列(无参考基因组物种,转录组de novo拼接的结果)。
对此类产品的分析要求仅仅是:将测序得到的数据比对到参考序列上,然后计算参考序列的在样本中的对应表达,而不需要去分析参考序列在样本中是否发生了序列变化(可变剪切、基因融合、SNP等)。
3. 对测序的要求:
因为仅仅是定量分析,所以表达谱对测序的要求较低。一般单个样本的测序量2~3G足够,同时单末端测序(single End)和双末端测序(paired End)的数据均可以分析。
新时期的变化
由于测序技术不断发展,测序成本不断下降。目前,当个样本的测序量一般都已经超过4G,而且大部分项目都使用双末端测序的策略。所以,这些数据都已经足够支持进行转录组分析的要求。所以,现在没有必要进行转录组和表达谱的区分,可以统称为RNA-seq。对用户来说,所需要关心的是:公司的RNA-seq分析可以提供哪些后续的分析?是否可以满足你的科研的需求。