哪怕是到了2018年,RNA-seq仍然可以不做重复
先申明,只是说可以,但是并不推荐这样做!!!
很多benchmark文章推荐做RNA-seq的时候,每个处理最好是做5个以上的重复,当然,研究者为了节约经费,通常只做3个重复,更有甚者做两个也行。但是只做一个,往往就麻烦了,因为没办法进行常规的统计学检验看处理前后的差异表达的显著性。
但是2018年二月的一篇文章,仍然是不做重复,文章是: Transcriptional Regulation of the Warburg Effect in Cancer by SIX1
文章背景
这个转录因子 sine oculis homeobox 1 (SIX1) 在器官发育过程起着非常重要的作用,如下:
Six1 knockout (KO) mouse embryos have defects in several organs
Six1 KO mice die shortly after birth. SIX1 is overexpressed in many cancers
Increased SIX1 expression predicts poor clinical outcomes.
SIX1 can promote tumor growth and metastasis.
以前没有SIX1基因在cancer metabolism的研究,所以作者探究 它,如下:
To identify SIX1 downstream effectors, we performed RNA sequencing(RNA-seq) using SIX1 stable knockdown (KD) ZR75-1 breast cancer cell line or control cell line.
发现了1900个受SIX1基因调控的基因,这个转录组数据上传到了GEO,GSE93925 所以我看了看,赫然发现,居然只有两个样本。
但是作者对这1900个受SIX1基因调控的基因做KEGG富集分析,发现了 他想要的 glycolysis pathway被富集出来。
所以作者挑选感兴趣的基因看了看热图;
而且,更重要的是用了 Real-time RT-PCR confirmed the altered expression of known SIX1 target genes and 11 glycolysis-related genes 这样的实验验证。
而且作者的转录组数据分析结果与2009年的一个 MCF7 breast cancer cellsoverexpressing SIX1芯片数据比较了
虽然转录组测序只做了一个,但是实验环节,都是5个重复的。
Moreover, compared with SIX1 WT ZR75-1 cells, SIX1 KO cells generated by CRISPR/Cas9showed markedly reduced GLUT1, HK2, PFKL, ALDOA, GAPDH, PGK1, ENO1, PKM2, and LDHA, but not GPI and PGAM1, at the mRNA and protein levels
那么给大家留几个问题:
转录组测序是测序深度重要还是生物学重复重要呢?比如,100M的reads测一个样本,还是选择测2个样本,每个样本是50M的reads呢?
生物学重复是3个最佳吗?这个数字是咋来的呢?或者6更佳?