综述科普 | COVID-19的表观遗传调控机制
摘要
2019年12月爆发的新冠疫情之后,中国在世界层面表现出该有的大国担当,为人类健康提供全球性治疗帮助。SARS-CoV-2具有很高的传染性,其致病性和致死率都随着年龄的增长而增加,并具有很强的个体差异,为此深入了解其生物学特性的尤为重要。结构分析已经阐明了病毒结合区、突变和宿主中的特异性蛋白,如受体血管紧张素转换酶2(ACE2)和跨膜蛋白酶丝氨酸2(TMPRSS2),它们与病毒进入细胞并形成感染性有关。此外,通过表观遗传的改变来调节染色质结构的现象对维持基因组稳定和维持细胞内稳态的十分重要,这种现象还与病毒感染的病理生理有关。表观遗传学研究表明,DNA甲基化以及ACE2基因甲基化和翻译后组蛋白修饰可能导致宿主组织、生物学年龄和性别对病毒感染模式的差异。此外,病毒侵染后对宿主细胞表观遗传的调节是病毒用来对抗细胞信号的分子工具,以及调节宿主先天免疫诱导和防疫机制的传感元件,进而提高病毒复制和感染的效率。
该文展示了表观遗传学和冠状病毒之间的主要研究成果的最新进展。特别强调了干扰病毒复制和感染的表观遗传因素,及其对新冠病毒易感性的影响,为研究宿主对病毒的应答反应提供了新的思路。
关键词:新冠肺炎;DNA甲基化;组蛋白PTMs;病毒感染;ACE2;X连锁基因
1.介绍
冠状病毒(CoV)是人类和动物的主要病原体家族,如严重急性呼吸综合征冠状病毒(SARS-CoV)和中东呼吸综合征冠状病毒(MERS-CoV)。2019年12月爆发的COVID-2019疫情,其根源是一种具有人类感染和传播能力的高度传染性冠状病毒,据WHO称,截至2020年7月8日,该病毒在全球造成543,902人死亡。SARS-CoV-2病毒的迅速传播和宿主多样性凸显了深入了解其结构和生物学功能的必要性。新发布的实验数据揭示了调节宿主反应的遗传和表观遗传改变之间的关系。调控染色质结构的表观遗传学改变对基因组稳定和维持细胞内环境平衡有很重要的影响,并与病毒感染的病理生理有关。
基因表达的表观遗传调控依赖于在染色质水平以及RNA和DNA水平上发生的翻译后化学变化,主要包括甲基化,也包括乙酰化、磷酸化、泛素化和类泛素化。这种类型的调控通过改变基因位点的功能而不改变潜在的DNA序列来建立基因型和表型的联系。
DNA甲基化是指DNA通过DNA甲基转移酶(DNMT)将甲基添加到DNA胞嘧啶环C-5位的可遗传的表观遗传过程。目前已确定了DNMT1、DNMT2、DNMT3A、DNMT3B和DNMT3L等5个家族成员,DNMT1优先作用于半甲基化的DNA,在DNA复制过程中发挥重要作用。相比之下,DNMT3A和DNMT3B在未甲基化的CpG二核苷酸上发挥作用,并在发育过程中介导从头甲基化。DNA甲基化高度参与细胞的发育和衰老过程,以及基因印记、X失活和沉默重复元件和转座子的表达,确保基因组稳定性方面起着关键作用。
此外,细胞核中的DNA以染色质纤维的形式包裹在核小体周围,核小体是染色质的功能单位,由组蛋白八聚体(两个二聚体H3-H4和两个二聚体H2A-H2B)组成。组蛋白(PTM)的翻译后修饰作为基因表达的结果可以干扰染色质的开放性。最常见的PTM发生在H3、H4的N端,主要由不同氨基酸残基上的甲基化、乙酰化和磷酸化组成。这些位于相同或不同核小体的PTM结合和协同作用定义了所谓的“组蛋白密码”,并决定了染色质的开放性和转录因子的结合。
最近在基因调控和RNA领域的研究揭示了发生在RNA水平上的化学修饰在基因转录、翻译效率和RNA稳定性方面的作用。核酸测序和质谱学方面的新技术使科学家能够以更高的分辨率和精确度研究这些修饰。目前,已在不同的生物体和组织中发现了160多种修饰,这些修饰涉及RNA干扰等基本分子机制。这些修饰在癌症领域的新兴作用,使它们成为靶向药物研发的理想候选者。
通过抗体pull-down或化学标记结合测序、纳米孔测序和新的靶向质谱技术,对不同物种和组织的转录组中的RNA修饰进行了系统的测序,揭示了一系列RNA修饰,这些RNA修饰不仅在持家、非编码RNA中含量丰富,包括转运RNA(tRNA)和核糖体RNA(rRNA),而且在功能性mRNAs中也普遍存在。令人惊讶的是,一些图谱修饰显示出动态模式和组织特异性分布,阐明了一个全新的RNA领域--表观遗传学或表观转录组学。
转录和表观转录分析在病毒研究中起着至关重要的作用,其通过确定病毒的结构和功能,从而提供了与宿主侵染有关的重要信息。来自RNA研究中心及其在韩国疾病控制和预防中心(KCDC)下属的韩国国家卫生研究所(KNHI)合作者的最新研究展示了SARS-CoV-2的高分辨率染色体图。基于纳米载体的RNA直接测序被用来鉴定病毒转录本上的至少41个RNA修饰位点,最常见的观察到的基序是存在于整个病毒基因组中的AAGAA。Poly(A)尾巴在RNA周转中起着重要作用,有人认为这种内部修饰可能有助于病毒RNA的稳定性和翻译效率,从而体现了一种躲避宿主免疫反应的机制。
我们利用SARSCoV-2侵染背后的遗传和表观遗传之间的联系,来解释与病毒感染相关的组织或细胞、年龄、性别偏好以及并发症的差异。
2.宿主遗传学与SARS-CoV-2感染
SARS-CoV-2是一种非典型肺炎(β)冠状病毒,其基因组为29kb的正链单链包膜RNA。它与中东呼吸综合征冠状病毒(MERS-CoV)有50%的同源性,与SARS-CoV有80%的同源性。虽然最初被认为是禽类和哺乳动物的地方性感染,但跨物种传播是可能导致在人类中暴发的主要原因。
病毒进入宿主细胞的位点是血管紧张素转换酶2(ACE2)I型膜受体,存在于动脉和静脉内皮细胞、肺泡Ⅱ型细胞、小肠的肠细胞以及包括大脑皮层和脑干在内的大多数器官的动脉平滑肌细胞。ACE2是一种含锌的金属酶,含有一个肾脏氨基酸转运体结构域和一个肽酶M2结构域,它通过将血管紧张素I激素分解成收缩血管的血管紧张素II来平衡血管紧张素转换酶。然后,ACE2从血管紧张素II的羧基末端裂解苯丙氨酸残基,生成血管扩张剂血管紧张素。
一旦病毒进入宿主细胞,它就会复制由9个实验验证的ORFs组成的基因组RNA。由基因组RNA转录而来的9个亚基因组RNA编码保守的结构蛋白,即合成病毒颗粒的刺突蛋白(S)、包膜蛋白(E)、膜蛋白(M)和核衣壳蛋白(N)。数据表明,SARS-CoV蛋白被跨膜丝氨酸蛋白酶2(TMPRSS2)、组织蛋白酶L(CTSL)和弗林蛋白酶(Furin)等蛋白酶切割,将碱性氨基酸裂解酶(Furin)分别切割成两个亚基,分别为S1和S2(图1A,B)。
SARS-CoV-2利用包含核心结构和受体结合基序(RBM)的S蛋白的受体结合域(RBD)与受体外表面结合并进入宿主。人类ACE2含有的两个病毒易结合位点以及在这些位点附近自然发生的RBM突变,可以确定病毒的宿主范围(图1B,C)。根据结构数据分析,SARS-CoV-2与人血管紧张素转换酶2(ACE2)可以高度结合。已检测到位于501位的单个N501T突变可显著增强SARS-CoV-2 RBD结合能力。这种突变在已感病患者中经常被发现,因此对ACE2的501残基密切监测观察是否有新的突变是很重要的。
以往对相关病毒SARS-CoV的研究表明,低水平表达ACE2的未分化上皮细胞感染能力较差,说明ACE2表达与冠状病毒感染率密切相关。
此外,在新冠肺炎感染死亡的患者中发现了一系列并发症,包括高血压、狼疮、糖尿病、癌症和慢性阻塞性肺疾病。虽然这些合并症患者病情加重的分子机制还不是很清楚,但有一些研究推测与ACE2有关。
最近的跨组织综合分析表明,ACE2阳性细胞在多种器官中共表达TMPRSS2或CTSL,这些细胞与严重的疾病有关(包括肝、肾、胰腺的上皮细胞和嗅觉上皮细胞、心脏的心肌细胞、周细胞和成纤维细胞,以及脑中的少突胶质细胞)。因此,ACE2是病毒的入口点,这些并发症很可能会影响ACE2的水平,进而直接影响病毒的传播。
此外,在吸烟者的气道基底层和多纤毛上皮细胞中也发现ACE2表达上调。有趣的是,单细胞RNA-Seq研究显示ACE2在儿童样本中的表达显著降低,反映了ACE2基因座缺乏染色质开放性。此外,ACE2基因高甲基化可能发生在儿童肺部,降低其表达。
值得注意的是,ACE2在子宫内膜癌和肾乳头状细胞癌组织中的表达显著升高,并与免疫细胞浸润和预后呈正相关,因此与SARS-CoV-2感染的易感性有待进一步研究。
然而,需要注意的是,ACE2在不同组织中的表达调节是复杂的,既可以受到感染的影响,也可以受到包括ACE抑制剂或血管紧张素受体阻滞剂在内的常见疗法的影响。
3.宿主表观遗传学与SARS-CoV-2感染
3a.X失活与COVID-19的关系
重要的是,作为SARS-CoV-2的受体,ACE2基因已经定位在X染色体上,并指向更接近于X失活(XCI)的表观遗传调控的发育过程。已证实哺乳动物雌性细胞中的两条X染色体中的一条在分化过程中经历X失活(XCI)过程,以实现雌雄之间的剂量补偿。女性特有的非编码RNA Xist从X失活中心转录而来,分布在整个X染色体上,通过组蛋白修饰蛋白、多梳抑制蛋白1(PRC1)和PRC2复合体的招募而形成一种不活跃现象。PRC1催化赖氨酸119(H2AK119Ub)上的组蛋白H2A单泛素化,而PRC2三甲基化赖氨酸27(H3K27me3)上的组蛋白H3,在XCI过程中主要维持基因沉默,提供了一个中间的表观遗传调节阶段,并传播了Xist RNA诱导的沉默状态。
然而,XCI在人类中是不完整的,在女性细胞中,三分之一的X染色体基因同时在活跃的(Xa)和非活跃的(Xi)X染色体上表达,而逃脱X失活的基因被称为“逃逸者”。
最近的一项研究说明了X染色体在几个人体组织中的失活情况。他们系统地分析了来自基因组织表达(GTEx)项目(v6p发布)的449个个体的29个组织的5500个转录本。通过研究X染色体蛋白编码基因和长非编码RNA(LncRNA)基因和单细胞转录本的性别差异,以及基因组学数据,发现虽然XCI在人类组织中大部分是一致的,但在细胞、组织和个体之间也可能存在一定的特异性。研究数据显示,不完全XCI至少控制了23%的X染色体基因和7个逃逸基因。重要的是,逃避XCI会导致基因表达上的性别偏好,从而导致表型多样性。在女性肺组织中发现了逃避X失活的基因中的ACE2,显示出了更多的特异性性别偏好。此外,ACE2在男性组织中的表达略高于女性组织,并发现开放染色质标记与其表达谱相关,这可能为男性患者的呼吸道感染严重程度高于女性患者的现象提供了证据。
ACE2基因位于染色体进化较久远的区域,Xq和该区域的基因表现出较低的表达和较高的组织特异性,这与较高的蛋白质进化速率有关。
在这方面,一项进化研究比较了人类、大鼠和小鼠的ACE2蛋白,发现了不同的SARS-CoV结合亲和力。人SARS-CoV S1-CTD通过Lys31和Lys353两个病毒结合点与人ACE2紧密结合。另一方面,大鼠蛋白含有两个不同的残基,一个是位于第353位的组氨酸(而不是赖氨酸),另一个是位于第82位的天冬氨酸,它引入了一个N-多糖,不利于SARS-CoV的结合。小鼠蛋白含有His353残基,但在第82位不具有N-多糖,存在较差的受体。因此,大鼠ACE2不是SARS-CoV的受体,而小鼠ACE2与人ACE2相比是受体功能较差。
3b.ACE2基因位点的DNA甲基化和组蛋白修饰--破坏宿主免疫反应的机制
最近的研究表明,DNA甲基化参与了ACE2基因的调控,表明宿主表观基因组可能是COVID-19感染的一个危险因素(表1)。通过分析来自四个不同的肺组织公共数据库的DNA甲基化图谱,他们能够筛选出ACE2基因的两个CpGs位点的DNA甲基化在性别之间的差异。此外,在呼吸道道上皮细胞ACE2基因转录起始点附近检测到与年龄相关的DNA甲基化。研究者使用了来自不同生物年龄样本的DNA甲基化数据,发现ACE2转录起始点附近的一个CpG(Cg085599149)在老化过程中甲基化水平降低(图1)。因此,对全基因组亚硫酸氢盐测序的要求很高,以精确定位更多差异甲基化的CpG岛,以与年龄有关的方式调节ACE2的表达。
之前的研究表明,全球DNA甲基化的水平在随着衰老逐渐降低,导致炎症、衰老和免疫反应相关的基因的甲基化模式不同。结合这些观察结果,揭示了DNA甲基化至少是MERS冠状病毒在体外对抗感染细胞过程中的抗原提呈基因,调节宿主获得性免疫反应的主要机制之一。这些数据可以在一定程度上解释老年人和有潜在疾病患者的病毒感染发病率较高的现象。此外,在子宫内膜癌和肾乳头状细胞癌组织中发现ACE2启动子低甲基化,ACE2表达增加,这表明其可能激活自身并诱导其表达水平。当这些患者感染SARS-CoV-2时,ACE2水平降低,免疫浸润受损,会影响其预后。
重症的新冠肺炎与合并症患者肺组织中ACE2的高表达有关。系统的实验和网络分析揭示了人类肺中ACE2的许多潜在调节因子,包括表达表观遗传酶的基因,如组蛋白乙酰基转移酶1(HAT1)、组蛋白脱乙酰基酶2(HDAC2)和赖氨酸脱甲基酶5B(KDM5B)。途径富集分析表明,与ACE2正相关的基因受KDM5B、组蛋白特异性甲基化(H3K4me1和H3K4me3)和组蛋白乙酰化(H3K27ac)标记的调控(图1)。事实上,KDM5B通过去除组蛋白H3(H3K4)赖氨酸4上参与基因转录和DNA修复调节的活性染色质标记(如二甲基化和三甲基化)来调节染色质的开放性。这些修饰在ACE2位点被进一步发现,这表明ACE2在肺中的表观遗传调节导致了ACE2的过量表达和疾病的加重。此外,在乳腺癌细胞中抑制KDM5B可以触发干扰素反应,触发对DNA和RNA病毒感染的抵抗,因此,KDM5B可能是COVID-19预防的一个潜在靶点。
另一种表观遗传酶--NAD依赖的组蛋白去乙酰化酶Sirtuin1(SIRT1)也可在细胞能量应激条件下调节ACE2,该酶在重症的新冠肺炎并发症患者肺组织中表达上调,这一发现值得进一步研究。
4. 关于SARS-CoV-2感染
除了ACE2,跨膜蛋白酶TMPRSS2也是SARS-CoV-2感染的关键调节因子。SARS-CoV-2感染后,会通过其表面的刺突蛋白(S)与血管紧张素转换酶2(ACE2)结合。S蛋白由细胞膜丝氨酸蛋白酶TMPRSS2启动,TMPRSS2允许其在S1/S2处切割,而S2位点可供病毒和细胞膜融合。
此外,除了针对病毒刺突蛋白(Spike Protein)产生的中和抗体外,正在测试一系列化合物阻断TMPRSS2和ACE2蛋白的活性和结合能力。临床批准的丝氨酸蛋白酶抑制剂甲磺酸卡莫司坦可以抑制TMPRSS2的活性,阻止SARS-2-S驱动的进入,这说明它有可能成为一种有效的治疗方法。
到目前为止,很少有研究阐明针对ACE2基因表达的药物的重要性。最近的一项研究筛选了两个全基因组转录表达数据数据库, Connectivity Map(CMAP)和JeaMoon Map(JMap),发现了一些候选药物(吡啶酸、富维斯特朗、星孢菌素、AG-013608和硫唑嘌呤)可以降低呼吸道上皮中血管紧张素转换酶2的表达,其中免疫抑制剂硫唑嘌呤是最有希望的。
此外,在新冠肺炎的研究中,表观遗传和表观转录机制在调节ACE2X连锁基因表达中起着重要作用。该基因启动子上的DNA甲基化和H3K4甲基化已被发现影响其表达。此外,对Roadmap Epigenomics项目数据库的分析表明,p300乙酰基转移酶和H3K27ac位于ACE2基因的启动子区域。
同源性很高的HATS、环磷酸腺苷(CAMP)反应元件结合蛋白(CREB)结合蛋白(CBP)和p300是活性增强子的成熟标记。研究表明,抑制p300 HAT活性会降低H3K27Ac的水平,主要是在增强子区域。目前已检测到了一系列小分子、天然产物与p300的催化活性位点结合,影响靶基因的基因表达。
在最近的一项研究中,通过质谱仪的分析确定了26个SARS-CoV-2蛋白在人类细胞(PPI)中新的互作。令人惊讶的是,他们观察到病毒的跨膜E蛋白与宿主细胞中含有2个溴结构域(BRD2)和BRD4的转录因子相互作用。溴结构域家族(BRD)、溴结构域和其他末端结构域家族(BET)是能够识别乙酰化染色质的表观遗传。它由4个成员(BRD2、BRD3、BRD4和BRDT)组成,BRD2和BRD4在N端与乙酰化组蛋白结合,调节靶基因的转录。在病毒感染后,它们与模仿H3组蛋白尾巴N端与蛋白E的C末端相互作用。通常建议使用BET抑制剂来干预这种相互作用,并影响宿主细胞的转录机制和病毒的转录机制。
一些可能导致ACE2基因表观遗传沉默的天然化合物包括DNA甲基转移酶抑制剂姜黄素、8-羟基喹诺酮和萝卜硫素,它们对SARS-CoV-2感染显示出潜在的预防作用。
5. 结论
综上所述,表观遗传酶及其修饰在新冠肺炎治疗中展现了极大的潜力。未来的研究应该集中于阐明这些化学修饰对病毒生命活动中的功能作用、感染效率和疾病的严重性以及避免宿主细胞攻击的能力的影响。针对染色质开放性的候选药物,RNA和DNA修饰,在未来可能对阻断病毒的感染活性有很大的帮助,迫切需要新的研究来阐明它们的特异性和作用机制。
表1.人血管紧张素转换酶2(ACE2)基因在不同细胞类型/组织中的表观遗传调控
图1
A)冠状病毒结构示意图,嵌入脂质双层膜的病毒表面蛋白(棘突、膜、包膜)、RNA和核衣壳核糖核蛋白。
B)SARS-CoV-2刺突蛋白的基因组结构,指示受体结合域(RBD)、受体结合基序(RBM)和七肽重复序列1,2(HR1,2)。还显示了蛋白酶位点(位于687)可以被切割以产生S1和S2亚基。TM:跨膜
C)ACE2蛋白示意图,表示多肽酶和结构域。
D)上图:ACE2基因的线性示意图(未按比例显示),绿色框中是外显子,内含子显示为水平蓝色线。CpG(cg085599149)位于ACE2转录起始点附近,该位点在衰老过程中发生了低甲基化,并显示了组蛋白甲基化和乙酰化的标志。
下图:ACE2蛋白,表明锌肽酶(HEXXH基序)和结构域以及关键的多糖(第90位糖基化天冬酰胺)与SARS-CoV-2刺突结合有关。