顶刊日报|J Hepatol:通过长测序技术进行HBV RNA的可变剪切全景分析
HBV是目前已知的感染人的最小DNA病毒,其基因组大小约为3.2 kb,包含4个高度重叠的开放阅读框(ORFs)。除了这些经典的ORFs外,越来越多的证据表明,HBV还通过可变剪切形成了许多额外的ORFs,可以表达很多功能性蛋白质,展现出了对基因组极高的利用率。HBV的这种复杂转录组特征,给HBV转录组研究带来了巨大的挑战,因此二代测序技术对此显得力不从心。
北京大学医学部病原生物学系的鲁凤民、陈香梅教授团队,长期致力于HBV相关研究,在全球首次揭示了血清HBV RNA的来源和临床意义。
针对上述挑战,鲁凤民团队近日在Journal of Hepatology发表了题为“A global survey of alternative splicing of HBV transcriptome using long-read sequencing”的研究成果,揭示了HBV的转录全景,并验证了三代测序在HBV转录组研究中的强大能力。
通过长测序技术进行HBV RNA的可变剪切全景分析
致编辑:
我们最近阅读了贵刊发表的Yuan等作者的文章:“Translatomic profiling reveals novel self-restricting virus-host interactions during HBV infection”。该文作者通过RNA-seq和Ribo-seq发现了具有编码HPZ/P'和HBxZ两种HBV蛋白质的转录本和翻译机制,进而的体外实验显示了两者都具有抑制cccDNA转录的活性。文中提到,这两种蛋白质分别由HBV的RNA的可变剪切和可变翻译起始位点形成。我们知道,HBV病毒基因组有着高度重合的开放阅读框,对应的病毒转录本有着复杂的、3'端高度共享的序列。但是,受RNA-seq技术测序片段过短的技术限制,该文并未在mRNA水平上为上述两蛋白的产生提供全景的多剪切RNA(multispliced RNA)、可变转录起始位点(transcription start site,TSS)和可变转录终止位点(transcription end site,TES)测序结果的支持。基于体外HBV复制细胞模型,我们在近期开展的研究中曾采用Iso-seq这一长测序技术(Long-read sequencing, LRS)获取了覆盖HBV不同转录本的全长信息,通过对这些HBV转录组的全景分析,本文为HpZ/P'和HBxZ提供转录水平的分子生物学证据。
采用与Yuan等相同的实验体系和时间节点,我们在将prcccDNA/pCMV-Cre质粒共转染至Huh7细胞72小时后,提取RNA并进行Iso-seq测序,并得到了总计4.67 Gbp的测序数据,包含1,059,497条全长reads,测序片段的长度在531-26,451 bp之间(补充图1A-1B)。与HBV基因组(subtype ayw; GenBanksubtype ayw; GenBank)比对后,我们得到了12,535条HBV的全长转录片段,长度在1140-12,931 bp之间(补充图1B)。除了经典的3.5、2.4和2.1 kb HBV转录本外,我们还上述测序片段中检测到了一些HBV超长转录本(ultra-long HBV transcripts)。在这些超长HBV转录本中,3.9 kb和6.5 kb转录本占比最多(图1A,左泳道)。之后我们通过Northern blot技术验证了HBV超长转录本的存在(图1A,右泳道)。值得注意的是,我们并未检测到能够转录X蛋白的0.7 kb HBx转录本,而其中的3.9 kb HBV转录本包含两个HBx ORFs,其转录起始位点定位于HBV的1297-1571 nt之间(补充图1C)。既往文献报道,0.7 kb HBx转录本在HBV感染后会很快消失,同时3.9 kb HBV转录本具有翻译X蛋白的活性。因此,我们推测,除了X蛋白外,HBxZ蛋白也可能主要转录自3.9 kb HBV转录本。6.5 kb HBV转录本包含两个完整的HBV基因组拷贝(补充图1D),由于他们的转录起始位点集中在HBV 1785 nt(经典的PreC mRNA转录起始位点),因此我们将其命名为6.5 kb PreC mRNA。
图1 HBV转录组特征分析 (A) HBV转录本的长度分布
左图,基于 Iso-seq 数据模拟的HBV转录本的电泳图;右图,HBV RNA的 Northern Blot 分析 (B) TSS(黑色直方图)、TES(红色直方图)和 HBV转录本主要剪接位点(最内圈)在 HBV 基因组中的分布(C) HBV的主要剪接转录本亚型。转录本前面的数字代表每个转录本在所有HBV剪接变体中的百分比
之后我们分析了HBV的TSS和TES变异。我们一共检测到了HBV的4个转录起始位点峰,分别位与CP/BCP、SP1、SP2和XP等4个启动子区附近(图1B)。而对于TES,我们发现98.6%的HBV转录本都终止于经典的HBV加尾信号附近(1930-1950 nt)。此外我们也检测到有1.4%的HBV RNA终止于非经典HBV TES(图1B)。由于非经典的HBV TESs与HBV的可变剪切位点之间高度重合,我们推测这种非经典的转录终止是由于可变终止(alternate terminator)形成的,这是RNA可变剪接的一种特殊形式。我们一共检测到3591条带有可变剪切的HBV转录本,占HBV总RNA的28.6%(图1B),该数字十分接近先前报道的30%这一比例。我们发现2067 nt、2447 nt、2902 nt、2985 nt、3083 nt、3169 nt、203 nt、283 nt和489 nt是HBV的主要剪切位点。这些位点通过彼此的组合,形成了HBV RNA的主要剪切形式(图1C)。与Yuan等人的研究一致,我们同样发现由2447 nt和489 nt位点剪切构成转录本是HBV的主要剪切形式,占带有剪切的转录本的17.3%(图1C),作者报道该剪切形式翻译了HpZ/P'蛋白。对于含有2447/489可变剪切的转录本,它们中的97.8%的TSS位于HBV的1682-1814 nt之间,也就是位于PreC蛋白翻译起始位点之前。因此在HpZ/P'的翻译起始位点(2446A2447T489G)之前,转录本上还存在着多个ATG,其中包括PreC, Core和P蛋白的翻译起始位点。因此,HpZ/P'的翻译机制仍然有待进一步的阐明。
总之,本研究通过Iso-seq技术探究了HBV的多剪切RNA,可变转录起始位点和可变转录终止位点。该研究结果能为HpZ/P' and HBxZ的表达提供分子生物学证据。
补充图1 分析流程图及HBV转录组特征
(A) Iso-seq 数据的分析流程图。粉色条代表HBV序列,红点代表测序错误。(B) 读取长度的分布图。两种颜色分别代表总RNA和HBV RNA的长度分布。(C-D) 3.9 kb和6.5 kb HBV转录本示意图,外圈黑线代表HBV RNA。
摘译自:Guiwen Guan, Jun Zou, Ting Zhang, Fengmin Lu, Xiangmei Chen. A global survey of alternative splicing of HBV transcriptome using long-read sequencing. Journal of Hepatology, 2021, Jul.
作者:关贵文
(北京大学基础医学院病原生物学系博士研究生)
顶刊日报|Science:“人类高质量脂蛋白”被发现具有护肝作用
顶刊日报|J Hepatol:FOSL1通过可能具有治疗靶向性的转录效应因子促进胆管癌的发生
Hepatology:新型HBV标志物 vs 传统HBV标志物