科研 |Nature:人类RNA结合蛋白的大规模结合及功能图
编译:小北,编辑:景行、江舜尧。
原创微文,欢迎转发转载。
RNA结合蛋白(RBPs)是一组多样的参与基因表达的蛋白,能够与RNA相互作用形成核糖核蛋白复合体,调控RNA底物的成熟和命运,并且调节基因表达的多个方面,包括pre-mRNA剪切、裂解以及聚腺苷化、RNA稳定、RNA定位、RNA编辑还有翻译。一些RBPs参与多个过程,例如利用NOVA调节选择性剪接以及polyA位点,这些作用对于正常人的生理非常重要。RBP功能缺失与基因和机体的紊乱有关,例如神经退行性病变、自身免疫和癌症。RBPs的调节功能同样受RBPs亚细胞定位以及RNA底物的影响,因为转录后的步骤通常发生在膜分离和相分离的亚细胞腔中。
在本文中研究者介绍了人类基因组中通过RNA结合蛋白(RBPs)识别的一组新的RNA元件,构成了ENCODE课题III阶段的一部分。这组调控元件只有当转录进入RNA时才会发挥功能,因为它们的作用是为RBPs提供结合位点以控制转录后生物学过程,例如剪切、裂解、聚腺苷化以及mRNA的编辑、定位、稳定和翻译。研究者在K562和HepG2细胞中绘制和描述了人类RBPs所识别RNA元件的图谱特征。将体内RNA和染色质上确定的RBP结合位点、体外RBPs结合的倾向、RBP结合位点的功能、RBPs亚细胞定位以及356个RBPs生成的1223个复制数据集这五个实验进行整合分析。研究者对整体转录组RBP结合的范围以及这些相互作用与包括RNA稳定性、剪接调节以及RNA定位等多个RNA生物学方面之间的关系进行描述,这些结果通过添加在RNA水平与RBPs相互作用的元件,扩展了人类基因组中编码的功能元件的目录。
论文ID
原名:A large-scale binding and functional map of human RNA-binding proteins
译名:人类RNA结合蛋白的大规模结合及功能图
期刊:Nature
IF:42.778
发表时间:2020年7月
通讯作者:Brenton R. Graveley,Gene W. Yeo
通讯作者单位:加利福尼亚大学
DOI号:10.1038/s41586-020-2077-3
实验设计
结果
为了更好的理解人类RBP的结合和功能,研究者利用五种方法针对于356个RBPs,产生了1223个可复制的数据集。这些RBPs参与RNA生物学的多个方面并且包含不同的序列和结构特征。从功能上而言,这些RBPs大多参与调节RNA剪接(98 RBPs, 28%),并且162 RBPs (46%)已经报道含有多个功能,但是83 (23%)尚未证实RNA的功能机制(图1b)。尽管57%的RBPs包含已经确定的RNA结合结构域,剩余的包括研究较少的结构域或者尚不知晓的RNA结合结构域(图1b)。一些RBPs,包括核糖体蛋白RPL23A和剪接体因子HNRNPC在ENCODE细胞系和一系列人类组织中高表达,但是一些的表达具有组织特异性,表明这些RBPs的调节活性可能通过细胞类型特异的基因表达程序调节。五种方法中的每一种都聚焦于RBP活性的不同方面(图1a),如下所述。
图1. 对实验和数据类型回顾。(a)区分RBPs的五种实验;(b)至少通过一组ENCODE实验(黄色或者红色),结合免疫荧光(绿色)、CRISPR筛选的重要基因(栗色)、手动注释的RBP功能(蓝色或者紫色)以及蛋白结构域的注释绘制356个RBPs,每一类别的直方图如下所示;(c)PTBP3的组合表达以及剪接调节。
2 RBPs的全转录组RNA结合位点
研究者鉴定并证实数以百计IP级别的抗体能够识别人类RBPs,并且开发了eCLIP。研究者分别对K562细胞中120个RBPs以及HepG2细胞中103个RBPs进行了高质量的eCLIP图谱绘制。该项工作鉴定了844854个差异富集的峰图,涵盖了18.5%个注释的mRNA转录以及2.6%个mRNA前体的转录组。
3 RBP应答的基因和选择性剪接事件
为了探究eCLIP峰图的功能,研究者利用shRNA或者CRISPR对个体RBPs进行敲除,随后进行RNA-seq。研究者分别在K562细胞中敲除了235个RBPs,在HepG2细胞中敲除了237个RBPs,与配对的非靶向对照数据集相比,在20542个基因中鉴定出375,873个差异表达基因的事件在至少一个RBP敲除后受到影响,以及221,612个差异剪接体事件,包含38,555个选择性剪接事件在至少一个RBP敲除时受到影响。进一步分析证实在一些数据集中GC对read密度的影响可通过Salmon和CAN工具校正。除了每个实验的批次对照,批次校正能够对整个数据集整合分析。
4 体外RBP结合基序
研究者利用带有重组纯化RBPs的RBNS以及随机RNA寡核苷酸的工具对体外78个RBPs进行了RNA序列和结构结合的鉴定。研究者在接近半数的RBPs (37 of 78)中鉴定五个核苷酸(nt) (k = 5)高度富集的k-mers,并且聚类为单一的基序。剩余的RBPs具有更加复杂的结合图谱,由两个基序(32 of 78),或者三个或者更多的基序(9 RBPs)。这些结果提示一些RBPs对包含基序的序列和RNA结构是敏感的。
5 RBPs的亚细胞定位
为了阐释细胞空间内RBPs的功能特性,研究者利用已经证实的抗体分别对HepG2细胞中274个RBPs以及HeLa细胞中268个RBPs进行了系统的免疫荧光成像,发现它们与特异细胞器和亚细胞结构中12个标记物结合。这些数据包括217,412个图像并且采用词汇定位描述符,被收录在RBP图像数据库中(http://rnabiology.ircm.qc.ca/RBPImage/)。
6 RBPs与染色质结合
为了研究RBP与染色质结合在转录和共转录剪接中的作用,研究者进行了ChIP-seq实验发现了37个RBPs相关联的DNA元件资源,这些实验确定了792,007个ChIP-seq的峰图,占基因组的3.8%。
7 数据整合分析
为了进行整合分析,每个数据类型中的所有数据都通过相同的数据加工管道,并且所有试验中数据的标准都是一致的。研究者利用至少两种不同的方法研究了70%的RBPs,并且利用至少三种方法对129 (37%)个RBPs进行了分析,利用多个数据集实现了整合分析,例如PTBP1调节PTBP3(图1c)。PTBP3的mRNA包含外显子2改变了起始密码子的使用并且增加了PTBP3蛋白的细胞质定位,在对照细胞中PTBP3外显子2缺失,但是在PTBP1敲低的条件下增加,这与之前的报道一致。剪接事件可能受PTBP1的直接调节,正如研究者在PTBP3外显子2的3’端剪接位点的eCLIP的峰图一致,在RBNS中富含U的基序与PTB家族相连。研究者也发现了与PTBP3外显子10之间的强相互作用,没有表现出选择性剪接,但是是与PTBP1外显子10和PTBP2外显子11是直系同源的,以PTBP1和PTBP2介导的方式选择性剪接,从而引发无意义的mRNA衰减。因此通过PTBP1介导的PTBP3外显子10的剪接并不是由于PTBP1不结合导致的。在另一个案例中,研究者观察到GTPBP2隐显子HNRNPL下游的富集包含首个HNRNPL RBNS基序的重复,表明HNRNPL抑制外显子的剪接,并且对带有全长开放阅读框的GTPBP2 mRNA的产生发挥重要作用。
8 eCLIP数据组的分析
研究者进行了488例eCLIP实验,每一例都包含生物学重复的IPs以及一个配对的且大小匹配的input。基于IP验证、文库产量、重现峰的存在或重复家族信号、基序富集(已知结合的RBPs) 以及已经建立的生物学功能对质量进行评估,获取了223个高质量的eCLIP数据组,并且发布在了ENCODE数据协调中心(https://www.encodeproject.org)。另外50个数据组由于不符合严格的标准并不包含在进一步分析中,但是包含可重复的信号(GSE107768)。自动量化的标准也能准确的划分83% eCLIP数据组的质量。通过手动而非自动质量评估的数据组有特殊的注释。尽管研究者观察到严格的IP洗涤条件通常限制了非直接相互作用的回收,在本研究中eCLIP实验并不包括蛋白相关RNA的可视化,因此能够通过比对体外基序单独证实eCLIP图谱,并且敲低后效应的改变也能证实真实的结合作用。
标准的CLIP-seq分析通常能够鉴定成千上万个read密度富集的集簇。然而,研究者在之前的研究中发现IP vs input实验中所需要的富集通过移除转录本中非特异的信号特异的证实了生物学相关的峰图。因此,尽管所有集簇中的数据都只经过IP分析证实,在本研究中研究者所需要的峰图需要符合相对于input富集的严格标准(富集倍数 ≥8,P ≤ 0.001)。研究者进一步利用不可复制发现率(IDR)方法对生物学重复中特异的峰图进行了重复验证。最终,研究者将57个“黑名单”区域中重叠的峰图进行了移除,结果与人造信号一致。下游样本分析提示在低表达基因中标准测序深度下也能够检测到峰图。当研究者将峰图叠加到GENCODE转录本注释中时,大多数RBPs的峰图与特异的区域重叠,与之前鉴定的RBPs功能是一致的(图2a)。基于主要转录本区域结合的类型,研究者将这些RBPs聚类称6个RNA类型,为后续基于峰图的分析提供了参考比对(图2a)。根据观察一些eCLIP数据组中特异匹配的read代表总数的一小部分,研究者开发了一种家庭意识的映射策略,能够对多拷贝元件上的相对富集进行准确的定量,包括多个假基因的基因家族、逆转录转座子以及其他重复元件。结合这种方法,研究者观察到与已知功能一致的rRNA或者snRNA信号调控的RBPs集簇,以及与反义Alu以及L1/LINE信号介导的集簇(图2b、c),与近期的分析一致,与逆转座元件结合包含RBP结合图谱中被忽视的一部分。
图2. RBP-靶基因相互作用调控网络的整合分析。(a)堆积的条形图提示223个eCLIP实验中显著的eCLIP峰图,峰图的数量在对数范围,条形图的高度依据与pre-RNA、mRNA以及非编码RNAs重叠的线性部分标注,数据集依据相同区域图谱层次聚类为6个集簇;(b)针对223个eCLIP实验中特异的基因组以及多拷贝元件信号的t-SNE聚类,分为17个集簇和一个RBPs的离群值;(c)热图显示图B中RBPs集簇,提示每个RNA区域或者元件中平均相关信息;(d)每个点代表在K562细胞中RBFOX2 eCLIP对应HepG2细胞中可重复的RBFOX2 eCLIP峰图的富集倍数;(e)在K562和HepG2细胞中绘制的每个RBP。
9 RBP元件的发现饱和
尽管大多数表达的基因都表现为差异表达并且至少在一个数据集中有eCLIP峰图,只有5214个基因具有来自同一个RBP的eCLIP峰图并且对该RBP的敲除应答,提示大部分基因敲除的应答改变是间接效应的结果。选择性剪接反应了更大的可变性,由RNA解旋酶和剪接体蛋白AQR的敲除鉴定出13000个剪接改变。单独考虑eCLIP,在至少一个峰图上可以发现3.4%内含子序列以及33.5%外含子序列,尽管一些峰图反映了蛋白质包裹或者短暂的与RNAs结合,例如与RNA聚合酶II的成分POLR2G与pre-mRNAs 之间相互作用,而不是RNA加工过程调节位点。
接下来,研究者探究了RBP的调节是否在不同细胞类型中一致。研究者在HepG2细胞中观察到如果整体靶向RNA的表达在5的因子内,RBFOX2 eCLIP的峰图在K562细胞中富集(图2d)。将这一观察拓展到两种细胞系中全部73个RBPs的eCLIP数据汇总,在未改变的或者中度差异表达的基因内大多数峰图在第二种细胞系中四倍甚至更多倍的富集,并且在其他细胞类型中与重现且显著的峰图重叠(富集倍数≥8, P ≤ 0.001)(图2e)。相反,46.3%RBP峰图的平均值在第二种细胞系细胞类型特异表达的基因上没有富集,而只有21.6%的发生在未改变、微弱或者适中差异表达的基因上。因此,这些结果表明大多数RBP的eCLIP信号在细胞系相似基因的表达上是保守的,而峰图的差异往往反映了细胞类型特异的RNA表达而不是差异结合。
10 体外的特异性驱动了体内的结合
体内RBP的结合是由RNA内在的结合特异性以及其他因素,例如RNA结构和蛋白质的辅因子决定的。为了比较体外和体内的特异性,研究者计算了RBNS结合序列中每5mer的原始富集(R值),并且与eCLIP峰图(ReCLIP)中对应的富集进行比对,发现聚焦于5mers是因为它们是最丰富的,且大多数蛋白经过RBNS包含的RNA识别基序(RRM)或者hnRNP K同源(KH)结构域分析,它们与RNA的3-5个碱基相连。在体内和体外显著富集的5mers大都是一致的,有15/23个RBPs显著重叠(图3a)。一个RBP的首个RBNS 5mer几乎富集在eCLIP峰图上(图3a),并且相较于相同RNA类型中其他RBPs的eCLIP峰图,RBNS基序能够更多对应的eCLIP峰图。在大多数案例中,在编码区、内含子区域或者UTR区域的eCLIP峰图观察到了相似的结果(图3a)。显著的是,单一最富集的RBNS 5mer出现在30%的RBPs峰中,包括SRSF9, TRA2A, RBFOX2, PTBP3, TIA1,HNRNPC,并且近一半的eCLIP峰图包含前五个RBNS 5mers中的一个(图3a)。因此这些5mers的案例提供了候选的核苷酸分辨结合位点,能够预测改变RNA加工过程的遗传变异。当在RBNS和eCLIP中有两个或者更多不同的基序富集时,大部分体外富集的基序通常也在体内富集。这些结果与那些研究中称RBPs包含更多单链RNA结合结构域的观点是一致的。内在的结合特异性解释了很大一部分体内结合的倾向。
对于近一半的RBPs(10/23),前5个RBNS 5mers阐释了少于一半的eCLIP峰图。这些RBPs中的一些与RNA结构特征相关或者延伸RNA序列元件,而其他的可能通过相互作用的蛋白连接。在一些案例中,RBNS只和一小部分富集在eCLIP峰图上的基序有亲和性,例如C富集的6mers主要富集在PCBP2的RBNS数据以及PCBP2的eCLIP峰图上(图3b),但是也有一部分eCLIP富集的kmers并不通过RBNS富集(图3b)。这种“只有eCLIP”的基序通常G-, GC-,或者GU-富集,可能代表RNA与其他蛋白的结合或者代表在共纯化或交联位置或接近交联位点的序列偏差。
在PCBP2的案例中,C富集的(RBNS)基序而不是G富集的(只有eCLIP)基序在邻近PCBP2调节的外显子上富集,提示RBNS基序可能帮助证实某个eCLIP的峰图与因子特异的调节相对应。考虑到RBPs与eCLIP,RBNS以及KD-RNA-seq数据,靠近选择性的外显子上eCLIP富集与18/28个已知剪接调节RBPs敲低后剪接改变增多相关。为了探究序列特异结合和调节之间的关系,研究者将eCLIP峰图中包含(RBNS+)或者缺乏(RBNS–)最高亲和性的RBNS基序进行分类。在外显子区域,RBNS+ eCLIP峰图与外显子跳跃收到强抑制有关,包含RBNS–的峰图外显子约有25%的升高(图3c)。因此,能够反映体外结合序列特异性的eCLIP峰图赋予了更强的调节作用,可能是因为它们代表的相互作用更加持久。通过首个只有eCLIP的5mer存在或者缺失对eCLIP峰图分离,结果发现在剪接调节活性方面具有微小的差异。与RBP抑制的外显子不同,RBP激活的外显子在RBNS+和RBNS–的峰图之间只有在内含子区域的下游有一个微弱的显著差异(P < 0.02),而在其他地方没有显著差异。是否在RBP抑制的而不是RBP激活的外显子上有一个更强的效应尚不清楚,可能更加持久的结合对于剪接抑制而不是激活更加关键。
图3. 体内序列特异性的结合主要是由RBPs的内在RNA亲和力决定的。(a)RBNS-和eCLIP富集5mers的首个序列基序,依据RBNS与eCLIP富集的相关性降低排序。填充的圆圈提示RBNS与eCLIP基序显著富集。左边的热图表示所有5mers RBNS和eCLIP富集之间的斯皮尔曼相关性,中间的热图表示不同基因区域eCLIP峰图中首个RBNS 5mer富集,右边的热图表示eCLIP峰图的比例归因于10个最高亲和力RBNS 5mers中的每一个,以及RBNS 5mers 11–24的结合;(b)比较体内vs体外5mer富集的PCBP2,以及包含CCCC和GGGG的5mers;(c)在RBP敲除后比较剪接的改变。
11 RBP靶向的功能特征
对KD–RNA-seq数据进行分析使得研究者对eCLIP鉴定的RNA元件进行了功能推断。研究者首先鉴定了RBP KD–RNA-seq中对转录本丰度的显著变化,因为对RNA稳定性的调节可以改变稳定的mRNA水平。为了证实RNA稳定性的潜在调节因子,研究者将RBP敲除后在eCLIP富集的5′UTRs、CDSs以及3′UTRs的差异基因进行了比较。尽管与标准的DESeq分析比较,KD-RNA-seq具有更多与eCLIP富集的显著重叠,研究者发现从与RNA稳定性调节相关的序列偏差的文库制备中很难解决基因水平GC含量的偏差。因此研究者进行了一项保守的分析,利用Salmon以及CQN工具对KD-RNA-seq倍数改变的潜在GC含量的偏差进行了完全的清除。研究者鉴定出了4个RBPs在eCLIP富集和敲除后表达升高之间存在相关性,有7个RBPs的eCLIP峰图与表达降低相关(图4a)。当与同一结合类的RBPs比较时(图2a),靶向的RBP在5/11案例中具有最大的富集,并且用于大多数比较。
在RBP敲除后RBPs的eCLIP与靶基因的表达升高相关也包括之前鉴定的RNA衰减因子(如DDX6),在敲除后RBPs的eCLIP和表达降低相关包括IGF2BP3和FMR1,在之前的报道中称能够提高RNA靶基因的稳定性(图4c)。除了这11个RBPs,其他的例如UPF1在更高的eCLIP富集中止时显著相关(图5e),暗示更复杂的模型可能显示更多的重叠。
图4. 敲除后RBP结合和RNA表达之间的相关性。(a)热图说明RBP敲除的RNA-seq实验中,基因显著富集的区域与显著升高或者降低基因之间显著重合;(b-c)线条表示HepG2细胞中DDX6 eCLIP富集以及HepG2中IGF2BP3 eCLIP富集基因表达倍数变化的累积分布。
12 RBP与剪接调节相关
RBP与外显子结合能够调节包含或者排除外显子或者5′或者3′选择性剪接位点。为了探究RBP富集如何与剪接调节相关联,研究者通过比较细胞中RBPs敲除后的RNA-seq数据鉴定了所有显著的选择性剪接事件。接下来研究者在每个RBP中构建了一个RNA剪接图谱,利用自定义的方法对元-外显子上敲除响应的剪接事件的eCLIP富集取平均,对配对的input进行整合。在近内含子下游RBFOX2 eCLIP的富集与RBP敲除外显子外以及近内含子上游PTBP1富集相关(图5a),与之前的报道RBFOX2和PTBP1基序的富集以及CLIP的结合相一致。在同一细胞系中203对eCLIP和KD–RNA-seq,研究者发现外显子、3′选择性剪接以及5′选择性剪接事件中的各种RNA图谱。SR蛋白的结合与敲除后外显子的降低相关,而hnRNP蛋白与外显子的升高相关,与经典的模型中SR和hnRNP蛋白对剪接具有拮抗效应相关(图5b)。当研究者比较不同细胞系中同一RBP的数据时发现了更高的剪接图谱相关性。重要的是,一些剪接体的RBPs具有不同的剪接图谱,表明剪接体停留的时间与敲除后的敏感性之间的关联需要进一步被探索。对于非剪接体的RBPs,RBP的关联性在外显子边界的内含子区域更高,这与之前的报道选择性事件对单个RBPs的剪接调节更加敏感是一致的。值得注意的是,上游5’剪接位点的富集程度显著高于选择性外显子侧的内含子区域(图5c),表明外显子上游的内含子的5 '剪接位点表示一个剪接体的调节未被充分认识的区域。
作为一个额外的对照,研究者将同一RNA类型中所有eCLIP数据集每个敲除数据进行了比较,并且发现相似的剪接图谱。尽管一些RBPs仅在同一RBP中富集,其他的提示具有潜在的共调节作用。例如,QKI在RBFOX2敲除外的外显子中eCLIP富集(图5d、e),并且与敲除RBFOX2或者QKI后剪接体的改变显著相关,与之前在SKOV3ip1卵巢癌细胞中观察到的结果一致。这些结果反映了复杂的协调是由于RBFOX2和QKI很少在同一内含子具有富集的eCLIP信号。相反,TIA1和TIAL1在TIA1敲除诱导的外显子上具有重叠的富集图谱,尽管与其他因子没有co-IP,这与之前对TIA1和TIAL1的研究是一致的。然而,TIA1和TIAL1敲除后对应的外显子与剪接体的改变没有关联,暗示结合的调节效应在这些位点可能不是共有的。
图5. eCLIP 和RNA-seq整合鉴定剪接调控图谱。(a)敲除后RBFOX2和PTBP1标准化剪接图谱;(b)热图提示SBP敲除后所有HNRNP和SR蛋白图谱中nSE-标准化eCLIP密度之间的差异;(c)线条提示eCLIP峰图上RBPs的平均数量;(d)热图提示HepG2细胞中敲除RBFOX2外显子上标准化的eCLIP信号;(e)线条提示在下游近内含子区域RBFOX2和QKI标准化的eCLIP信号轨迹。
13 RBP与染色质相互作用
表观标记物通过剪接调节因子的共转录沉积影响RNA的加工过程,并且调节型RNAs与染色质相互作用,协调表观和转录的状态。为了探究特异的RBPs与DNA之间的关联,研究者对HepG2细胞中58个核RBPs以及K562细胞中45个RBPs进行了ChIP-seq实验。HepG2细胞中约52%的RBPs以及K562细胞中约64%的RBPs具有可重复的ChIP-seq峰图。这些RBPs具有广泛的功能分类,包括SR和hnRNP蛋白,剪接体成分以及视为转录因子的RBPs,例如POLR2G和GTF2F1。考虑到已经建立起的染色质特征,RBP的ChIP-seq峰图在常染色质上具有更多的重叠,特别是在单个RBPs差异的基因启动子区域。然而,当研究者将RBPs间ChIP-seq的峰图进行直接比较时研究者发现仅在一小部分特异的RBP对中有很少的重叠和很高的一致性(图6b)。总之,这些RBPs占据大约30%超敏的或者开放的染色质区域,并且在两种细胞类型中注释的基因启动子区域占据70%,提示RBPs和人类基因组中转录活化的区域存在广泛的相互联系。
接下来研究者探究了在什么程度ChIP-seq鉴定的DNA靶向与eCLIP中鉴定的RNA靶向在同一RBP上重合,并且观察到平均的重合中只有6%的eCLIP峰图以及2.4%的ChIP-seq峰图(图6c)。然而,在有限的RBPs中观察到了更高的重合,包括之前报道过的RBFOX2。在非启动子区域,很少有RBPs在ChIP以及eCLIP信号中有重合,表明ChIP信号反映了与DNA或者DNA结合蛋白之间的相互作用,而在大部分RBP中不依赖于RNA的直接结合(图6d)。然而,研究者观察到在HNRNPK和PCBP1/2之间存在关联。这些RBPs具有共同的进化历史和结构域组成,但是却具有不同的功能,在基因体内ChIP-seq和eCLIP的峰图之间重合(图6d)。PCBP1, PCBP2,以及HNRNPK的ChIP-seq信号以eCLIP的峰图为中心,尽管HNRNPK的eCLIP峰图上游具有一个轻微的上移,这可能反映了这些潜在的RBP复合体在染色质上依赖转录方向的方式的一种特异的拓扑结构(图6e)。因此尽管一些RBPs的ChIP-seq信号反映了在启动子区域前期或者共转录的关联,一个子集也反映出在基因体内DNA和RNA的靶向重合可能反映了不同的招募机制。在有限数目的RBPs中ChIP-seq的靶向也反映出了RBP敲除后差异基因表达或者选择性剪接的显著富集,提示RBPs与染色质的相互作用于RNA加工的下游相关。
14 亚细胞内RBP的调节特征
每个RBP的亚细胞定位对于解释其生物学功能是非常重要的,又因为RNA加工发生在多个时期和膜分离的位置。研究者系统的免疫荧光成像发现了不同的定位图谱(图7a),大部分RBPs与核以及胞浆中的多个结构相关。考虑到在特异类型RNA加工过程中细胞器已知的功能,定位在核内的RBPs与45S前体rRNAs以及小核RNAs上eCLIP的富集对应,定位在线粒体与线粒体RNAs的富集对应,定位在核斑点与近端内含子区域的富集对应,证实了定位和RNA靶向之间存在关联(图7b)。核仁的RBPs包括18个参与rRNA加工的因子,例如BOP1, UTP18,以及WDR3。重要的是,其他15个RBPs在人类RNA加工功能中并没有注释,表现出核仁定位(表1)。有三个RBPs在45S rRNA上的eCLIP信号富集:在大数据筛选出表现出rRNA加工缺陷的AATF以及PHF6,以及酵母rRNA加工因子SAS10的人类同源物UTP3。同样在核内,14/18个RBPs(78%)在一个或者多个小核RNAs上具有至少五倍的富集,表现出核斑点的定位,而只有51%的RBPs在HepG2细胞的eCLIP以及免疫荧光数据中显示与斑点共定位。研究者同样观察到相对于胞浆中RBPs的剪接转录本,核内RBPs未剪接的转录本eCLIP的信号升高,并且对RBP缺失相关剪接改变分析发现,定位在斑点的RBPs能够影响更多的剪接事件,这与核斑点在剪接机制中的组织和调节的关键作用一致。
聚焦于特异胞浆细胞器中的定位,42个RBPs定位在线粒体,该细胞器具有独特的转录和RNA加工调节。这些线粒体定位的RBPs与在线粒体RNAs重链、轻链或者两条链上显著富集的eCLIP高度重合,并且免疫荧光显示的线粒体定位也与线粒体RNAs上eCLIP的显著富集升高相关(图7b-d)。接下来研究者聚焦于DHX30,它对于合适的线粒体核糖体组装和氧化磷酸化非常重要。与一些线粒体转录本相关联,与之前RNA IP以及RIP-seq的数据一致,DHX30在所有注释的基因下游中未注释的H链区域富集且具有很大可能形成茎环结构(图7d)。由于线粒体H链转录的终止信号尚不明确,研究者试图推算这一位点标记这一信号。这些案例说明RBPs细胞内如何定位,结合连接和功能缺失的数据,能够帮助推断不同细胞间隔和细胞器中转录后调节。
结论
更多推荐
1 科研 | Oncogene:Lewis肺癌细胞胞外泌体中miR-21a通过靶向PDCD4加速肿瘤的生长(国人作品)
END