转录组讲师带你读文献(9)-玉米种子发育早期的高时间分辨率转录组景观
我在我在04-转录组笔记推文任务列表(半年期)里面安排了6个经典综述和10篇转录组应用文献给大家,可惜愿意沉下心了认真苦学的并不多。(https://share.mubu.com/doc/14uneHKvPg)
所以安排转录组讲师给大家做一下领读:
今天要分享的这个研究,其实可以被单细胞技术变革!
文章信息
标题:High Temporal-Resolution Transcriptome Landscape of Early Maize Seed Development 标题:玉米种子发育早期的高时间分辨率转录组景观 杂志:The Plant Cell(IF9.618),Mar 2019 通讯:Jinsheng Lai ,China Agricultural University中国农业大学
主要结论
早期玉米(Zea mays)种子经过双受精后经历了几个发育阶段,在短时间内完全分化,但这一高度动态和复杂的发育过程的遗传控制仍有很大的未知。在这里,我们报告了一个高时间分辨率的转录组调查,使用在种子发育的前6天间隔4或6小时收集的31个样本。这些随时间变化的转录组被清楚地分为四个不同的组,分别对应于双受精、群落细胞形成、细胞化和分化的阶段。在玉米种子发育早期共检测到22790个表达基因,其中转录因子(transcription factor, TFs) 1415个。其中,在种子中特异性表达的基因有1093个,其中TFs有110个,且仅在种子发育的特定早期表达,表现出较高的时间特异性。**分别有160、22、112和569个种子特异性基因在授粉后的前16 h、群落细胞形成、细胞化和分化阶段主要表达。**此外,网络分析预测了1317个TFs和14540个基因之间的31,256个相互作用。本文报道的高时间分辨率转录组图谱为阐明种子发育的遗传控制的未来功能研究提供了重要资源。
数据方法
1.样本按数据
组织为珠心和种子。31个时间节点,授粉后小时。每个时间节点2个生物学重复,两个生物学重复之间平均相关系数为0.94,最后将两个生物学重复样本的基因表达均值作为每个时间节点的基因表达。HAP为授粉后小时,h After Pollination 。
2.测序数据
对nucellus 进行RNA-Seq测序,150bp,双端,Hiseq系列。数据编号:PRJNA505095
3.数据处理
参考基因组:http://ensembl.gramene.org/Zea_mays/Info/Index,The B73 reference genome
质控:SolexaQA
比对:Hisat2
定量:Cufflinks
生物学重复相关系数计算:Pearson ,log~2~ (FPKM value +1)
4.其他分析
1.层次聚类:MeV (V4.9) software https://sourceforge.net/projects/mev-tm4/files/ with the HCL method,log2 (FPKM +1)
2.PCA:the prcomp function in R,z-scores of the genes
3.共表达分析:The MeV (V4.9) software with the k-means method was used for coexpression analysis for 31 different time points samples.
4.最佳分类数确定:The figure of merit (Yeung et al., 2001) was used to determine the optimal cluster number.
5.功能注释:Functional category enrichment for each coexpression module was evaluated with the MapMan (v3.6.0) functional annotation (Thimm et al., 2004).
6.功能富集:Fisher’s exact test
7.鉴别种子特异表达基因:31个时间节点的种子测序数据,23个non-seed测序数据,计算z-score,31 vs 23,判断条件:The gene was determined to be seed specifically expressed if it had a z-score above 3 in at least one of the seed samples
8.种子特异的基因表达模式分析:MeV (V4.9) software
9.a subregion-specific gene:its compartment specificity score was larger than 0.5
10.TF-related gene regulatory network:the context likelihood of relatedness algorithm method (Faith et al., 2007)
主要结果
1.玉米种子发育早期高时间分辨率转录组数据的生成
31个样本,22790个基因,包括1415个TFs。检测数据的可靠性,使用以前发表文章中的8个基因进行验证表达模式。这个思路get到了。
2.根据不同的发育阶段,可以将高时间分辨率的转录组聚类为4组
层次聚类结果:
PCA结果:
跟以前报道的一致:
四个不同时期,各自具有代表性的基因的表达
接下来是对各种时期的基因各种表达模式和功能的探索
3.玉米种子不同发育阶段的基因表达
4.双受精前后基因表达(I期)
5.共核细胞形成阶段表达的基因(II期)
6.细胞化阶段表达的基因(第III阶段)
7.分化期表达的基因(IV期)
8.基因在四个阶段中的一个以上都有表达
以下为各个时期特异性表达的基因
9.种子特异性基因包括TFs及其靶基因参与玉米种子发育的四个早期阶段
10.双受精前后特异性基因表达(I期)
11.共核细胞形成阶段特异性基因的表达(II期)
12.在细胞化阶段表达的特定基因(第III阶段)
13.分化期特异性基因表达(IV期)
14.特定的基因在四个阶段中的一个以上都有表达
总结
算是多个时间节点测序数据分析的一篇典型应用文章,并且表达模式分析挖的挺深入,值得借鉴。