NAT STRUCT MOL BIOL| 中山大学张锐教授等对于哺乳动物mRNA 5-甲基胞嘧啶的全基因组鉴定
推荐:江舜尧
编译:晚香
编辑:马莉
中山大学生命科学学院张锐教授等人于2019年5月6日在《NATURE STRUCTURAL & MOLECULAR BIOLOGY》期刊发表题目为《Genome-wide identification of mRNA 5-methylcytosine in mammals》的文章,该文章报告了一个基于试验设计的计算框架,并且通过跨物种分析确定物种是决定甲基化水平的主要因素,该文章为识别RNA甲基化的调控作用和功能提供了宝贵的参考价值。
文章摘要
对5-甲基胞嘧啶进行精确和系统地全转录组检测是非常具有挑战性的,并且对于mRNA是否普遍存在这种修饰也是存在诸多争议。本文报告了一个基于试验设计的计算框架,该框架能够可靠地识别mRNA的m5C位点,并且会用一组高置信度位点确定与修饰相关的序列和结构特征。基于本研究中的框架,我们发掘了一个定量描述人类和小鼠组织中RNA m5C的位点图谱。在一个给定的组织中,研究者确定了几百个外显子的m5C位点。其中,约62-70%的位点甲基化水平较低(<20%甲基化),而8-10%的位点属于中度或高度甲基化(>40%甲基化)。跨物种分析结果显示,物种,而不是组织类型,才是决定甲基化水平的主要因素,这种结果说明RNA甲基化具有很强的顺式调控作用。综上所述,这些数据为识别RNA甲基化的调控作用和功能提供了宝贵的参考价值。
文中主要图片说明
图1 | 不同反应条件下BS-seq建库方案的评价。a,比较使用不同转化条件构建的文库之间ERCC混合或所有注释基因估计的转化率。b,在高严格条件下处理的样品中ERCC混合物的转化率箱线图。c,在体外条件下的转录本中,m5Cs或Cs以不同的频率混合。
图2 | 可识别高置信度m5C位点的计算框架的构建。a,HEK293T样本中基因特异性转化率的分布。b,不同样本间的基尼系数。c,spike-in转录的差异倍数变化。d,mRNA在HEK293T和HeLa细胞中的Winscore分布。e,在HEK293T细胞中具有非聚集或聚集m5C位点的winscore的累积分布。f,RNA亚硫酸氢盐测序分析流水线示意图。
图3 | 计算流程及其mRNA m5C的序列和结构。a,NSUN2敲除细胞和对照细胞单个位点m5C水平的比较。b,箱线图显示NSUN2敲除样品和对照样品之间m5C水平的变化。c,NSUN2敲除后,具有(上)或不具有(下) C位点的序列显著降低了m5C水平。d,m5C位点二级结构和侧链图谱。e,可视化的RNA二级结构的图谱。f,上图: tRNA上的三个NSUN2特异性底物。底:Aza-IP VarScan结果中得到甲基化C49的序列。g,预测的d中二级结构与tRNA上C49位置中心对齐,并显示了20-nt两翼区的配对比例。h,我们的方法与其他小组最近的成果进行比较分析。
图4 | 利用人类和小鼠NSUN2敲除模型验证mRNA m5C位点。a,野生型、NSUN2敲除和NSUN2回补HeLa细胞中检测的m5C位点甲基化水平。b,不同组m5C位点的序列。c,RNA二级结构的m5C位点。d,从野生型和Nsun2−/−小鼠的皮肤样本中,测定了56个位点的m5C甲基化水平。
图5 | mRNA m5C的整体表征及CDS m5C位点对翻译的影响。a,每个基因位点的m5C位点密度。b,人和小鼠组织细胞中m5C的分布。c,野生型与NSUN2小鼠m5C基因翻译效率的比较。d,m5C和非m5C基因在HeLa细胞中翻译效率的比较。e,高置信度m5C位点在人和小鼠中的下游序列的偏好性。
图6 | 人和小鼠mRNA m5C的表达谱。a,人类样本(左)和小鼠样本(右)中m5C水平的热图。b,箱线图显示基因内位点的基因甲基化水平。c,线粒体复合体I的亚单位。d,人、小鼠各种组织m5C水平的主成分分析。