科研 | NC:单细胞转录组研究拟南芥早期胚胎发育过程细胞的“命运”(国人佳作)

编译:寒江雪,编辑:十九、江舜尧。

原创微文,欢迎转发转载。

导读

在拟南芥中,受精卵经历不对称的细胞分裂形成了原胚的两种不同的细胞类型,顶端细胞和基底细胞。调控顶端细胞(AC)和基底细胞(BC)发育分化的全基因组转录活动目前仍不清楚。本研究中,对顶端和基底细胞系进行了全面的转录组分析,揭示了细胞系在指定过程中不同的分子途径。选择性的转录本降解和特异性的转录本从头合成共同参与了细胞系特异调控途径来调控顶、基细胞命运。从细胞胚胎期开始,顶端细胞系特异性激活胚胎相关通路,而基底细胞系则激活转录组重塑胚柄特异性通路。此外,长链非编码RNA和可变剪接异构体也参与胚胎分化决定过程。本研究也为在全基因组水平上阐明顶端和基底细胞系分化的分子途径提供了有价值的细胞系特异性转录组资源。

论文ID

原名:Cell lineage-specific transcriptome analysis for interpreting cell fate specification of proembryos

译名:通过细胞系特异性转录组分析解释早期胚胎发育过程中细胞的命运

期刊:Nature Communications

IF:11.878

发表时间:2020.3

通讯作者:赵鹏

通讯作者单位:武汉大学生命科学学院

DOI号:10.1038/s41467-020-15189-w

实验设计

本研究将拟南芥早期胚胎发育过程中的原胚顶端和基质细胞系通过在倒置显微镜下收集分离后进行转录组测序并分析差异表达基因。同时还利用转录组数据进行lncRNA的鉴定及可变剪接,转录因子及GO功能注释分析,并利用GFP融合蛋白转基因植株进行基因表达模式分析验证转录组的结果。

研究内容

1 构建细胞系特异性转录本

为了研究拟南芥顶端细胞系(ACL)和基底细胞系(BCL)调控过程中基因的时空表达,在之前研究的基础上对2细胞原胚(合子分裂后细胞命运指定的特定分化的初始阶段)和32细胞胚胎(BCL的成熟期)进行了比较分析。将原胚手工显微解剖后分离顶端基质细胞进行RNA-seq(图1a),数据过滤质控后,获得适合于分析细胞“命运”的特定时期的特异性转录组图谱。

2 ACL和BCL转录水平的差异

为了研究转录本是否与细胞系和胚胎发育阶段相关,对授粉后24小时(Zy24)的同基因胚和先前研究的受精卵的RNA-seq数据进行了非监督层次聚类(UHC)和主成分分析(PCA)。UHC分析说明早期原胚ACL和BCL的细胞系相关性和发育阶段相关的聚集性,15个转录本聚类成5簇,分别为Zy24、AC、BC、32-细胞胚的胚胎(32E)和32细胞胚的胚柄(32S)(图1b)。同一细胞类型的转录图谱是一致的,而不同发育阶段或不同细胞系的转录图谱存在明显差异。对ACL和BCL在不同发育阶段的转录本进行PCA分析,PC1和PC2可以将样本分为五组(图1c),这与UHC的结果一致。32S与其他所有的细胞类型分开(图1d),表明在BCL形成过程中基因表达谱发生了较大的变化。BC与受精卵的亲缘关系比与AC的亲缘关系更近(图1b,d),说明BC与受精卵基因表达谱相似。ACL,32E和祖先AC显示出更密切的关系,这表明ACL在胚胎发生过程中具有发育一致性(图1b,d)。32S和BC间有较大的差异。

图1早期原胚受精卵、顶端和基底细胞系转录本分析。a 分离的活的早期原胚的顶端和基底细胞谱。b c 早期原胚受精卵、顶端和基底细胞系的转录本的层次聚类(b)和主成分分析(c)。d 早期原胚受精卵、顶端和基底细胞系转录本之间的相关性。

3 ACL和BCL分化过程中时期表达特异性

为了确定ACL和BCL发育过程中受时间调控的基因,本研究分析了相邻时间的基因的差异表达基因(DEG)。与受精卵相比,ACL中有3002个上调基因,3166个下调基因。与AC相比,32E中有2468个基因上调,32E中有2098个基因下调(图2a和c)。与受精卵相比,BC中2791个基因显著上调,3764个基因下调(图2b和d)。与BC相比,32S中有5124个基因表达上调,3943个基因表达下调。同一时期的ACL和BCL之间也有显著的差异。在ACL和BCL的两个发育阶段之间,只有一小部分共有上调基因(图2e,f),表明在ACL和BCL在分化过程中不同时间的特异性。GO分析发现ACL和BCL在不同时期表达上调的基因的功能也不一样。ACL在1-细胞胚胎期上调的基因主要与细胞分裂有关,如DNA复制和有丝分裂细胞周期等。32E中上调的基因在主要与胚胎发育,植物器官发育和分生组织发育相关(图2),表明正在逐步建立胚胎模式形成机制。BCL在1-细胞胚胎期上调的基因显著富集在多肽生物合成和防御反应相关,在32E的BCL中上调的基因功能主要是脂质代谢和程序性细胞死亡相关(图2h)。因此,在ACL和BCL中激活不同的分子通路,从而决定了细胞的不同“命运”。

为了进一步研究胚胎发育所需的转录本是否在受精卵分裂后的ACL中优先表达,研究人员分析了胚胎缺陷(EMB)基因在细胞系分化过程中的表达模式。拟南芥中已知的大多数EMB基因在受精卵和早期原胚中共表达。根据EMB基因在原胚发育过程中表达水平的动态变化,将其聚为三类。大部分EMB基因主要在32E中表达,说明胚胎形成相关基因在ACL发育后期受到限制。

图2顶端和基底细胞系发育过程中随时间动态变化的表达情况。顶端(a)和基底(b)细胞系指定过程中基因表达的时间动态变化。c. AC与Zy24或BC与Zy24之间差异表达基因数目。d. 32E与AC或32S与BC之间差异表达基因数目。AC/Zy24与32E/AC(e)或BC/Zy24与32S/BC(f)上调基因的比较。1-细胞和32-细胞胚胎顶端(g)和基底细胞系(h)上调基因的GO分析。

4 ACL和BCL分化中细胞系特异性基因

对ACL和BCL间的空间调控基因进行差异基因表达分析,在1-细胞胚胎期AC与BC相比有3454个基因显著上调,2 911个基因下调(图3a),说明两个子细胞中的基因表达谱已经开始分化。在32E期,ACL和BCL的DEG数目增加。为了确定在1和32细胞胚胎中的特异基因,结合两个不同阶段ACL和BCL的结果,确定了1041个ACL维持基因和932个BCL维持基因(图3b)。大部分特异性基因在受精卵中共表达(图3b和c)表明它们已经在母细胞中转录。随着发育时期的推进,两者之间的差异越来越明显(图4a)。根据受精卵发育过程中的转录水平和系特征,将ACL维持基因分为4类。I簇 (n=370)的基因在卵细胞和受精卵中低表达,在ACL中显著上调,但在BCL中低表达,说明该簇中ACL维持基因是由于ACL中特异的从头转录所致。大部分ACL基因(n=539,III簇和IV簇)继承了卵细胞和受精卵的高表达水平,并在BCL中特异性下调,导致ACL特异性表达(图3d)。根据BCL维持基因在受精卵发育过程中的表达水平和系特征,将其聚为三类。BCL维持基因的特异性表达模式是由于BCL中特异的从头转录或ACL中的特定基因下调所致(图3e)。

对20个细胞系维持基因进行了绿色荧光蛋白(GFP)分析来验证转录组结果。筛选出10个ACL特异性基因在受精卵中共表达,在1-细胞胚胎阶段ACL和BCL的表达水平有显著差异,在8-细胞胚胎阶段在ACL中表达受到抑制(图4)。选择的10个BCL特异基因也在受精卵中共表达,它们在顶端和BC中的表达水平不同,随着胚胎的发育,它们在BCL中的表达逐渐受到抑制(图5)。这20个细胞系维持基因的GFP表达模式与转录组数据相关性较强,证实了转录组数据的质量。

图3系特异性转录组分析早期胚胎发育过程中顶端和基底细胞系的渐进性分化。a 顶端和基底细胞系在1-细胞和32-细胞胚胎阶段的差异表达基因。AC/BC和32E/32S上调基因(b)和调基因(c)的比较。顶端细胞系(d)和基底细胞系(e)基因在卵细胞、受精卵、早期原胚的表达谱。顶端细胞系(f)和基底细胞系(g)维持基因的GO富集分析。
图4顶端细胞系维持基因的表达模式验证了转录组分析。ACL1(a)和ACL2(b)在早期胚胎发育中的时空表达。
图5 基底细胞系维持基因的表达模式验证了转录组分析。BCL1(a)和BCL2(b)在早期胚胎发育中的时空表达。

5 细胞系特异性的lncRNA和可变

lncRNA的表达及其在早期胚胎发育中的作用,特别是在细胞系中的表达目前还尚不清楚。在转录组数据中鉴定到990个lncRNA (其中717个是新发现的),平均长度为1183nt。这些基因主要是由蛋白质编码基因的正义和反义链以及基因间隔区产生的(图6a-c)。从32E的cDNA中成功扩增出所有选定的lncRNA的转录本,证实了从细胞系特异性转录组预测的lncRNA的高度可靠性。通过对lncRNA的聚类分析,将15个转录本分为5组(图6d),分析这些lncRNA在早期胚胎中的表达模式。与蛋白质编码的RNA一致,lncRNA表现出细胞系和发育阶段的特异性表达。不对称合子分裂导致顶端和BC中lncRNA的差异表达(图6e和f)。在ACL和BCL(图6g)中发现了一些细胞系特异性的lncRNA,这些lncRNA可能参与了ACL和BCL的分化过程。

可变剪接是调控基因表达的一种重要的保守机制,为了研究选择性转录本在早期胚胎中的表达,首先对不同细胞中的可变剪接事件进行了分析,基于细胞类型特异性转录组构建了一个包含23766个5种不同类型的可变剪接事件的数据集(图6h)。2500-3500个(18%-24%)基因的不同转录本在不同的细胞类型中表达(图6i和j)。可变剪接事件因发育阶段和细胞类型的不同而不同。在AC中发现了1964个特异的可变剪接转录本,在BC中发现了1277个(图6k)。还在这些细胞类型特异的转录本中鉴定出320个ACL特异的和231个BCL特异的异构体,表明可变剪接也与早期胚胎发育中的特定分化相关。

图6顶端和基底细胞分化过程中lncRNA和可变剪接异构体的表达。a .五种不同细胞类型的lncRNA的维恩图。b.在早期胚胎中识别的已知和新的lncRNA的长度。c.在早期胚胎中鉴定的不同类型的lncRNA的比例。d.基于lncRNA表达的早期原胚受精卵、顶端和基底细胞系的聚类分析。e 顶端和基底细胞,32E和32S间的差异表达的lncRNA。f. AC/BC与32E/32S上调或下调的共有lncRNA分析。g.顶端细胞系和基底细胞系的维持lncRNA在早期胚胎发育中的表达热图。不同细胞中可变剪接事件(h)和基因(i)的数量。j.每种细胞类型中有多个转录本的基因数量。k.在顶端和基底细胞系中共有的可变剪接转录本分析。

6 ACL和BCL中不同的转录程序

研究人员分析了转录因子(TF)基因的空间和时间表达模式。首先根据拟南芥TF数据库4.0中注释的TF基因对其进行筛选,分析了1717个TF基因中的954个(FPKM≥1)在ACL和BCL中的表达情况(图7a)。数百个TF基因在AC和BC中的表达存在差异,说明AC和BC中不同的转录程序是在合子分裂后立即形成的(图7b)。在这些DEG(图7c)中鉴定出73个ACL和39个BCL的维持TF基因,它们与每个簇中的其他细胞系的维持基因共表达(图7d)。在早期胚胎发育过程中,TF和其他特异性基因形成了细胞系特异的组合调控网络。

研究TF与其他系特异性基因之间的关系,研究人员筛选了AC与BC或32E与32S之间DEG的启动子区域的TF结合基序。362个转录因子的结合基序分布在这些DEG的启动子区域。与MYB、HD-ZIP和Nin-like TF结合位点相对应的DNA基序在AC的上调基因中显著富集,bZIP和AP2 TF结合基序在BC上调的基因中显著富集(图7f)。MYB和ERF结合基序在32E的上调基因中显著富集,而bZIP、WRKY和bHLH结合基序在32S中显著富集(图7g)。因此有必要进一步研究这些转录因子及其靶基因在ACL和BCL不同转录程序中的潜在作用,以确定细胞系的特异性(图7h和i)。

图7不同转录因子在早期原胚顶端和基底细胞系中的调控网络。a 在AC、BC、32E和32S中表达的TF基因的Venn图。b TF基因在AC和BC、32E和32S之间的差异表达。c AC/BC与32E/32S上调或下调TF共有基因分析。顶端细胞系(d)和基底细胞系(e)维持基因共表达的TF基因在早期胚胎发育。在AC/BC(f)和32E/32S(g)间上调和下调基因的启动子区域富集TFDNA结合基序。在顶端(h)和基底细胞(i)系中,富集的TF和它们潜在的靶基因之间预测的调控网络。

结论

本研究作者开发了一种新的可靠的方法来分离活体的顶端和基底细胞及其后代,这使得绘制细胞系特异的转录组图谱成为可能。应用这项技术生成1-细胞和32-细胞胚胎阶段早期原胚的ACL和BCL的转录图谱。证明ACL和BCL分化过程在受精卵不对称分裂后立即发生,并识别了以前未知的特异性转录本,包括相关的蛋白编码基因、lncRNA和可变剪接异构体。同时为早期胚胎发育过程中细胞的特定分化提供依据。

评论

本研究首次解决了分离活的早期原胚和解剖ACL和BCL的技术困难,成功的对顶端和基底细胞系进行了深入的转录组研究,针对对细胞系在特定过程中不同的分子途径进行系统分析。这一开拓性的研究为理解细胞类型形成的机制提供了有价值的数据,也为细胞系特异性转录组提供了有价值的资源。


更多推荐

科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响

重磅综述 | Cell:非编码RNAs在肿瘤学中的作用(IF=36.216)

(0)

相关推荐