综述 | CLIN TRANSL MED: 非编码RNA(ncRNA)调控轴在动脉粥样硬化进展中的作用

编译:KT!,编辑:景行、江舜尧。

原创微文,欢迎转发转载。

导读

人类基因组测序项目发现了细胞RNA世界的丰富多彩,并打开了具有调控或结构潜能的短或长非编码RNA(潜藏的转录组学)的大门,同时也转变了对病理性基因从编码RNA到非编码RNA的认知。因此,目前疾病风险评估增加了对新RNA表达的评估,如小microRNA(miRNA),长非编码RNA(lncRNA),环状RNA(circRNA),竞争性内源RNA(ceRNA),逆向因子,mRNA的3¢非编码区等。本综述中,作者将阐述非编码RNA在慢性肾脏病的患者动脉粥样硬化(ATH)中的作用进展。重点介绍miRNA和它的mRNA靶标以及作为miRNA海绵或miRNA活性竞争性抑制剂的lncRNA所共同形成的调控轴或调控网络,即lncRNA-miRNA-mRNA。此外,还将介绍逆向基因组元件,例如经过加工的假基因和Alu重复元件,这些元件最近也因为具有miRNA海绵或者miRNA的衍生物的功能而在抗动脉粥样化硬化治疗中发挥基因沉默作用。顺便将讨论与lncRNA研究相关的技术发展,从测序技术到数据库,miRNA靶标的预测,以及miRNA功能富集,如整合或富集分析等,揭示其潜在的调控网络

论文ID

原名:Unveiling ncRNA regulatory axes in atherosclerosis progression

译名:非编码RNA(ncRNA)调控轴在动脉粥样硬化进展中的作用

期刊:Clinical and Translational Medicine

IF:7.919

发表时间:2020年2月

通讯作者:Estanislao Navarro

通讯作者单位:西班牙Bellvitge生物医学研究所,肾病医院

DOI号:10.1186/s40169-020-0256-3

研究进展

1    动脉粥样硬化进展和非编码RNA

动脉粥样硬化(ATH)是一种复杂的血管壁炎性疾病,基因组学,表观遗传修饰和环境条件等多种因素参与其中,给老龄人口带来了沉重负担。其病因和机制相当复杂,主要依赖生活方式的改善。因此,迫切需要开发一种更加个性化的药物,通过有效的干预措施来提高患者的诊疗水平。基于这个层面,ATH基因组学的研究为生物医学界提供了与基因相关的ATH危险因素,如SNP,基因和基因变异,DNA甲基化改变,基因表达变化等。近几年,一个新的因素:高度异质的非编码RNA组,正逐渐成为动脉粥样硬化(和其他疾病)研究的重要因素,无论是疾病进展的生物标志物还是病理生理学中间产物,它们的相互作用都突出了人类基因组结构和功能的复杂性。

   

从无到有,非编码RNA是转录组的功能性组成部分人类基因组测序分析发现超过80%的基因组具有生化活性,大多数是以DNA聚合酶I可及位点或候选调控序列的形式出现。而最近估计人类基因组中蛋白质编码基因的数量为20–25000,但活跃基因组位点的总数接近10^5,其中就存在大量非蛋白质非均质RNA,这种RNA最初被认为是“the dark转录组”或“基因组dark物质”的一部分,即功能不确定或未知的基因组序列。非编码RNA最初按其长度分为短(<200个核苷酸长)和长(lncRNA> 200个核苷酸长)RNA。短ncRNA包括已知的snRNA,snoRNA和tRNA,与PIWI相关的RNA(它们抑制种系中转座子和重复元件的表达以维持基因组稳定性)以及调控翻译的microRNA(miRNA)家族。另一方面,lncRNAs在大小和功能上是属于高度异质的群体,其在发育、分化和疾病进展中具有调节作用,并且其表达经常发生变化。

非编码RNA表达的数据是人类基因组功能的新模型,除了核转录外甚至在内含子和基因间位点都普遍实现了转录,从而产生了复杂的具有假定调节功能的长或短非编码RNA群体。在哺乳动物基因组中,有一个数量级以上的基因组序列转录为非编码RNA而不是编码RNA。这使得遗传信息流由原始的线性“ DNA产生RNA产生蛋白质”转变为由许多结构性或调节性RNA建立起来的不同层次的相互作用网络(图1)。这种改变也使得与疾病相关的非编码RNA的数量呈指数增长、使得表观遗传控制更加具有可塑性。本综述中,作者将对ATH进程中ncRNA、microRNA、mRNA的相互作用网络进行一一阐述。此外,还将包括其他少见报道的转录本,如假基因和Alu元素与miRNA之间的相互作用的揭示

图1.遗传信息流的变化。方框内是线性遗传信息流红色:RNA之间的功能关系。黑色箭头:转录或翻译;双头红色箭头:相互交互;红色单向箭头:功能交互;虚线:组蛋白编码和染色质

修饰

2    DNA测序以及转录组学与个体化药物的整合

随着DNA测序技术的飞速成熟,医学研究从人类基因组测序发展至个体化基因组测序。如今,在整个医学领域中,整个基因组或外显子组的DNA测序已然成为一种疾病的诊疗工具。此外,单细胞RNA测序(scRNA-seq)方法可实现对单个细胞进行全基因组分析,以鉴定基因突变并表征和量化细胞异质性及其在疾病中的变异。

  

序列存储,是测序革命成功的关键因素之一。三个镜像序列存储库(NCBI的GenBank,日本DNA数据库和欧洲核苷酸档案库表1)与国际核苷酸序列数据库合作,注释并提供了对所有DNA和RNA序列公开且不受限制的访问权限。这些存储库不仅赋予DNA/RNA序列唯一的序列标识符,还创建了“参考基因组”数据库,包含参考基因组,转录组和蛋白质序列的集合,旨在用作基因组研究中的主要序列参考。此外,数据库还为序列提供了各种注释,从功能域到基因组位点。最后,所有这些信息都已集成到“基因组浏览器”中(Ensembl和NCBI的基因组查看器),允许用户查看从染色体区域到任何转录单位及其可变体的序列。

表1. 序列数据库和存储库

测序技术的革命DNA测序技术经历了超薄PAGE凝胶、荧光标记、热稳定Taq DNA聚合酶的引入等革命性进展,但这些方法都无法实现临床高通量测序。此后,人类基因组测序向着更快,更便宜的测序仪的竞赛,俗称“1000美元基因组“。除了孔测序(Oxford Nanopore)方法通过使用蛋白质纳米孔直接测序而无需DNA合成或扩增,大多数测序平台使用高通量方法,即原始样本(用于基因组测序的DNA或用于外显子组测序的RNA复制为cDNA)被片段化并固定在扩增的单个细胞中,然后循环复制标记的核苷酸,每个反应都被单独检测荧光或H+(离子激流平台),最后,将每个序列与参考基因组或外显子组进行比较以进行鉴定。

   

测序ncRNA的技术挑战ncRNA长度异质性和外显子组成给测序带来巨大挑战,其大小范围跨越22-22.7kb。短序列读取如表达序列标签(EST),即单个cDNA克隆仅在其3'端进行测序,由此产生数百个核苷酸的读取,这些核苷酸作为完整序列的“标签”转录本。这种方法适用于构建表达序列的遗传图谱和物理图谱,但它不能检测出CDS突变的所有丰度(用于癌症研究)或显示lncRNA的复杂剪接模式,如相对“短”的3.8 kb ANRIL却被表示为50多个线性或圆形的剪接同工型。采用经典的分子生物学方法,即使用随机引物进行RT反应,然后通过5'/ 3'RACE(cDNA末端的快速扩增)技术进行序列的扩增可以避免上面这些问题,但是在这个情况下要想覆盖绝大多数lncRNA基因组信息,不仅需要开发能够提供更长和更准确读数的新型测序硬件,而且还需要提高逆转录酶(RT)尽可能复制全长序列的能力。另一方面,对于小miRNA,可以通过凝胶纯化小RNA的一部分,用T4 RNA连接酶将它们添加到5'和3'衔接子,然后进行逆转录和PCR来对整个组织群体进行测序。这样,即使对于低表达的miRNA,也可以获得代表性的结果。此外,因为读取次数与初始miRNA拷贝数成正比,在处理miRNA时,新的高通量测序技术可以提供miRNA物种的单核苷酸分辨率,有助于二次miRNA的识别并提供miRNA定量的动态范围。

3    MicroRNAS(miRNA),多效翻译调控家族

MiRNA是长度不超过22个核苷酸的小RNA,在转录后基因调控中起重要作用。MiRNA基因在转录控制之下,由RNA聚合酶II转录并经历由pri-miRNA初级转录本到功能齐全的成熟miRNA过程,包括RNase III内切核糖核酸酶DROSHA和DICER。近年来,Alles等人估计全人类miRNA组由2300个miRNA组成,miRbase数据库第22版本中则注释了1115个成熟miRNA。MiRNA通过与mRNA的3'UTR处进行碱基配对来靶向mRNA,从而通过RISC复合物(RNA诱导的沉默复合物)降解mRNA或实现翻译阻遏。据报道,超过60%的mRNA在其3'UTR处带有miRNA结合位点,说明这种相互作用对于精细调节翻译十分重要。由于miRNA /mRNA互补只需要6个碱基配对形成双链体,因此单个miRNA可以靶向数十种不同的mRNA,而这些mRNA又可以被许多不同的miRNA调节,因此使得miRNA的功能相当复杂。

   

3¢UTR的动力学:miRNA功能不止一个。mRNA的3¢UTR区在长度和序列上具有高度多态性,奠定了miRNA靶点变化和相关mRNA稳定性的基础。3¢UTR的长度多态性是由于两种不同的机制引起的:非翻译区外显子的选择性剪接(与大多数RNA一样)和替代性聚腺苷酸化(主要限于mRNA,lincRNA和NAT)的存在。Liaw等人研究发现癌细胞表达的3¢UTR比正常细胞要短,这表明3¢UTR延长可能导致miRNA位点失调,因此不仅应将3¢UTR区作为miRNA结合位点进行研究,而且应将其作为动态结构研究,因为3¢UTR变化可能导致新的危险因素或新的疾病候选基因的发现。Navarro等人研究发现3¢UTR调节miRNA活性。研究表明,AAMDC的3¢UTR起源于两个长度不同的同工型,只有长的同工型对miR-2428/664a沉默敏感;Bruhn等人在ABCB1基因中发现了5个不同的3¢UTR长度变异体,其中只有3个较长片段带有miRNA结合位点;Pereira等人的研究发现来自核受体超家族的转录因子Nurr1(NR4A2)mRNA中存在许多3¢UTR长度变异,而miR-93,miR-204和miR-302d也对Nurr1(NR4A2)mRNA具有选择性相互作用。作者的研究也发现,在鼠Cd34基因的内部隐蔽剪接位点发生的剪接事件将调节miRNA-125/351对Cd34mRNA的3¢UTR或CDS的差异性结合(图2)。

图2. 3'UTR的结构变化影响特定miRNA的结合。1.替代性聚腺苷酸化信号的存在导致不同长度的3'UTR和miRNA结合潜力不同。2. 3'UTR的不同剪接方式使得与miRNA结合的潜力不同。3.外显子开关。就Cd34基因而言,内部隐蔽剪接位点(CSS)激活了两个不同的终止密码子,并产生了两个不同的外显子,在一个Cd34同工型中,多数miRNA的结合位点位于3'UTR中,而在另一个同工型中,其位于CDS内部。

  

 ATH进展中的MicroRNA。关于ATH进化的遗传学和表观遗传学研究已相当多,已证实miRNA参与了ATH发生的许多病理过程,许多miRNA是脂质处理,炎症和细胞行为(如增殖,迁移和表型转换)的关键调节剂。不仅在原组织中,而且在血清,尿液和外泌体中都检测到miRNA表达的改变。关于人类患者或ATH小鼠模型中miRNA表达调节的研究也有众多,而且有部分研究已经涉及到机制研究。表2列出了动物模型或人类患者样品中ATH相关的miRNA,以及通过荧光素酶报告基因分析(并非生物信息学预测)验证的其mRNA靶标及其表达改变对ATH进程的影响,强调了miRNA /mRNA系统的复杂性,如同一mRNA的不同miRNA(例如miR-103和miR-647与PTEN)和单个miRNA靶向不同mRNA(miR-370与FOXO1和TLR4)。

表2. ATH相关miRNA、mRNA靶标以及它们的表达对ATH进展的影响

基因沉默疗法中的小RNA基因沉默中是基于小RNA的疗法,通过靶向药物无法到达的靶标或多基因病理学中的mRNA达到疾病治疗目的。针对miRNA的基因沉默方法包括激动剂或单链miRNA(ss-miRNA)和激活剂(含有互补序列的靶向miRNA序列的寡核苷酸),双链小干扰RNA(ds-siRNA)或miRNA海绵。针对ATH的RNA治疗目前已经进入临床试验中。Patisiran作为第一款RNAi药物,可以使运甲状腺素蛋白(TTR)mRNA沉默,治疗罕见的运甲状腺素蛋白介导的淀粉样变性多发性神经病。其他基于miRNA用于医学干预的药物目前正在临床开发中或处于1期或2期临床试验中,例如MRG-110是针对miR-92的锁定核酸(LNA)修饰的反义寡核苷酸,用于伤口愈合和心力衰竭的治疗中;Remlarsen是一种miR-29b模拟物,可防止形成纤维化疤痕或皮肤纤维化;拮抗miR-21的寡核苷酸,可以缓解Alport肾病小鼠模型中的肾脏疾病。此外,这些miRNA模拟物或拮抗剂也应用于实验室中调节ATH研究中miRNA的表达,还有针对miR-449a、miR-23a-5p或miRNA-98等在动物模型中的治疗研究,也取得了理想的结果。最后,治疗性miRNA不仅限于靶向特定的mRNA或miRNA,而且还被用作辅助因子,通过沉默促进药物低生物利用度的关键蛋白质达到降低耐药性的目的。

miRNA在基因沉默或基因模拟疗法中的应用仍然面临诸多挑战,比如合适的递送方式,以减少不必要的靶标副作用,或阻止免疫激活。miRNA/siRNA递送载体的主要缺点如由于ds-siRNA的刚性导致负载的siRNA量的限制,以及由于siRNA表面电荷低而导致封装困难。此外,与脂质纳米颗粒,阳离子复合物,无机纳米颗粒,RNA纳米颗粒和树状聚合物的常规络合或包封由于引入了大量的媒介物,导致潜在的免疫原性反应或毒性。而miRNA药物直接注射的方式由于提高了靶标的特异性和沉默功效,并最大程度减少了副作用而受到青睐。因此,许多化学修饰物的开发例如硫代磷酸酯,2'-O-methyl、LNA(锁核酸)等可以增加DNA / RNA部分的稳定性。此外,针对具体运送方式的研究也越来越多,例如加入针对靶细胞蛋白质的特异性抗体并连接到递送载体上可以增强治疗功效,或“ TargomiRs”,通过靶向细菌的小型细胞来模拟miRNA。

此外,miRNA/siRNA由于与非靶标的3¢UTR端互补结合而导致脱靶效应,由此带来了药物副作用。据报道,在一项ApoE-/-小鼠致ATH的模型中抗CD40-siRNA的全身治疗增加了肾NF-kB中的激活;一项使用miRNA-34的模拟物(MRX34)来抗肿瘤的1期试验,因为有5名患者出现严重的免疫反应而于2016年叫停;在一项TargomiR-16靶向EGFR治疗恶性胸膜间皮瘤的1期试验中,出现了输注相关的炎症综合征和心脏事件。这说明,miRNA/siRNA还需要进一步研究RNA运输载体、免疫反应以及寡核酸引起的炎症反应等副作用。

4   长非编码RNA(lncRNA)及其与miRNA的功能关系

LncRNA和miRNA海绵长非编码RNA(lncRNA)是转录本> 200个核苷酸的ncRNA,可以通过表观遗传、转录等多种不同机制调节基因表达或转录后水平。LncRNA协调并整合多种信号通路,并在发育,分化和疾病中起重要作用。人类中lncRNA基因的数量是蛋白质编码基因数量的两倍以上,目前估计超过56,000,但由于它们的表达水平低,仍然有许多LncRNA未被发现和注释。根据其假定功能,lncRNA已分类为许多功能组:竞争性内源lncRNA(ceRNA)和具有潜在miRNA抑制作用的环状lncRNA(circRNA),参与转录调控的与增强子相关的RNA(eRNA),超保守RNA(T-UCR),高度异质的天然反义转录本(NAT),内含子lncRNAs和长基因间RNA(lincRNA)等。

 LncRNA在ATH进展和治疗中的作用。ANRIL。高通量测序已发现了一些与ATH发病相关的lncRNA(表3),其中CDKN2B-AS1,也称为ANRIL(INK4基因座中的反义非编码RNA),已明确了在ATH中的致病机制,它是从9p21染色体转录而来,作为lncRNA向导将PRC通过直接与其亚基CBX7或SUZ12相互作用的方式定位于启动子上。ANRIL是由NF-kB途径的激活诱导的,上调的ANRIL与转录因子Yin Yang 1(YY1)形成功能复合物发挥对内皮细胞中的炎症因子IL6和IL8的转录调控,而敲低ANRIL可以抑制TNFα诱导的IL6和IL8表达,说明ANRIL参与了TNFα/NF-kB信号中炎症的表达。ANRIL也与增殖型的血管平滑肌细胞(VSMC)有关,并通过Alu重复元件调控促动脉粥样硬化的其他基因的表达。已有报道ANRIL以miRNA海绵的作用在不同的肿瘤中发挥作用,例如三阴性的乳腺癌中的miR-199a,宫颈癌中的miR-186或小儿髓母细胞瘤中的miR-323等。

表3. ATH进展中的lncRNA:miRNA:mRNA轴

竞争性内源性lncRNA(ceRNA)和环状lncRNA(circRNA)。ceRNA和circRNA是miRNA“抑制剂/海绵”,通过与种子区域相互作用,成为负向调控miRNA的lncRNA家族,阻断相关miRNA的整个家族。同时这种相互作用会使miRNA-靶标的相互作用也被抑制,如在癌症以及神经退行性疾病等病理状态中。CircRNA产生于哺乳动物细胞中外显子或内含子区域,通过共价连接转录本3¢和5¢末端的反向剪接完成,这使得CircRNA不具有5¢帽和3'尾,它们的表达也受到组织/发育阶段的调控。近年来,许多研究报道了lncRNA海绵对ATH和相关心血管疾病的影响,其机制包括整合的miRNA和mRNA靶标,这已成为心血管研究的热门话题(表3)。


转录的超保守RNA(T‑UCR)。Evf-2是第一个被发现的T-UCR RNA,由基因Dlx-5和Dlx-6的主域之间的超保守区域转录而来。在功能水平上,Efv-2充当Dlx-2的共激活因子,增加了Dlx-5/6簇的转录增强子的活性。T-URCs的表达受到严格调节,在转化细胞的特定CpG岛上,许多T-UCR RNA如Uc.160+,Uc283+ A,Uc.346+,通过DNA甲基化而被沉默。在肿瘤中发现了大量T-UCR,如肾细胞癌中的Uc.416+A,大肠癌中的Uc.383、Uc.338或乳腺癌中的Uc.63。T-UCR和miRNA之间具有相互调控作用,如Uc.283+A与pri-miR-195直接相互作用阻止了Drosha的切割并阻碍了它的成熟;miRNA-195或miR-29b的Uc.173可以促进肠道上皮的功能,Uc.416+A与miR-153在肾细胞癌中相互作用。


天然反义转录本(NAT)NATs是高度异质的lncRNA,从反义方向由靶基因的互补链转录而来,通过RNA的方式与mRNA或miRNA相互作用来调节转录后基因的表达。据报道,基因FOXD1的反义转录物lncRNA FOXD1-AS1(FOXD1-反义1)与miR339-5p和miR342-3p相互作用,抑癌剂TP73-AS1与miR-941相互作用,而TSPAN31,细胞周期蛋白依赖性激酶4(CDK4)的天然反义转录物在肝细胞癌中与miR-135b相互作用,导致TSPAN31沉默以及随后的CDK4的上调。


基因组元件的逆向作用:假基因和Alu重复元素逆向基因组元件是一组异质表达的mRNA,如逆向转录(从mRNA到cDNA)的循环,以及由LINE逆转座子中的逆转录酶和核酸内切酶活性催化的插入(cDNA进入基因组DNA)。其中最有特色的是经过加工的假基因,其源于功能性mRNA的逆向作用,以及Alu家族的重复序列,Alu家族是短SINEs组成员,源自Alu元素。

加工过的假基因3'-末端多聚腺苷酸化,由于来自完全剪接的转录本,所以不包含内含子,由长度为5至20 bp的重复整合位点排列,在基因组整合后其序列发生变性。假基因曾经被认为是“垃圾DNA”,因为它们失去了具有编码功能的基因(mRNA),但最近研究发现它们在基因表达和调控中发挥作用。假基因失调通常与各种包括癌症在内的人类疾病相关。据估计,人类基因组中已加工的假基因的数量与“真实”编码基因的数量相似,且部分假基因已证实具有miRNA海绵作用。虽然某些假基因被认为是miRNA海绵,但有些因素可能会影响假基因在miRNA功能中的作用。如,假基因在基因组中整合后的序列变性可能会使miRNA结合位点失活,而整合位点后的基因组可能会产生与亲本基因不同的表达模式。而且,亲本基因及其假基因后代之间的基因数量存在差异,并非所有基因都具有其相应表达的假基因,但假基因数目却非常多,在79个编码人核糖体蛋白的基因中发现了2090个假基因,其中145个假基因与RPL21相对应。目前有研究小组将假基因视为miRNA海绵创建了一个手动管理的数据库(miRsponge)。如,错配修复系统组件假基因2(PMS2L2)被视为miR-203在骨关节炎中的分子海绵,其中MCL-1 mRNA是miR-203的直接靶标;铁蛋白重链1假基因3(FTH1P3)抑制miR206活性促进了ABCB1(ATP结合盒亚家族B成员1成员)蛋白表达,并抑制了miR-224-5p的表达。此外,OCT4-假基因4可以保护OCT4 mRNA免受miR-145的破坏,PTENp1(PTEN假基因1)被认为可以屏蔽PTEN mRNA防止口腔鳞状细胞癌(OSCC)中的miR-21以及胃肿瘤中的miR-106b和miR-93的破坏。

短穿插核元件(SINEs)也属于逆向基因组并起miRNA海绵功能的RNA暗转录本。SINE包括Alu重复序列,其中超过10%(即一百万个拷贝)由Alu衍生的序列组成,以致于成功定居于人类基因组中。Alu重复序列通过使用LINEs中编码的逆转录酶整合到人类基因组中,随后发生序列变性,转位能力失活,仅少数保留活性。基因组Alu元件在左臂的5'端包含一个RNA聚合酶III内部启动子,在右臂的3'端包含一个短的poly-A尾。虽然Alu家族的大多数成员在人类基因组中沉默了,但其中一些仍被RNA聚合酶III转录成游离Alu RNA(作为单个Alu-RNA的连接体,其机制尚不清楚),或被RNA pol-II转录为mRNA嵌入了Alus,这是自aprox以来表达的Alu元素的重要来源。30%的人类基因通常在其5'或3'UTR处带有Alu重复序列(图3)。由于Alu重复序列具有自由转录本或插入了mRNA的序列,因此Alu元件与miRNA之间的功能关系十分复杂,但在不同的mRNA中存在高度同源的Alu重复序列,这些序列可以为miRNA的协同靶向作用或miRNA海绵作用提供共同的结合位点。据报道3'UTR亚单元包括Alu元件具有50多种不同的miRNA的潜在靶点,有30种miRNA的短的种子序列与人类mRNAs 3'UTRs上高度保守的Alu序列具有同源性。此外,最近显示miR-15a-3p和miR-302d-3p仅在Alu元素内靶向RAD1,GTSE1,NR2C1,FKBP9和UBE2I,而miR661通过与Alu元素相互作用而导致Mdm2和Mdm4的下调,有学者也发现了一种可充当miR-566海绵的Alu RNA。

图3. Alu元素在miRNA活性调节中的作用。Alu元素在独立转录单元下可以转录自自身的RNA pol III启动子(左),也可以在整合到另一个基因中时由RNA pol II启动子转录而来。这两种情况它们都可以充当miRNA海绵来与miRNA相互作用。一些单独的Alu元素可以反插入基因间区域或其他转录单位内部。

5   动脉粥样硬化进展中的RNA调控网络

构建mRNA和miRNA(以及lncRNA)在内的RNA调控网络对于ATH研究是很有必要的miRNAom调控mRNA稳态水平,而lncRNA海绵维持miRNA的调节水平。首先,需要识别特定miRNA的mRNA靶标,方法是提取杂交双链体。miRNA/靶标交联和免疫沉淀(CLIP)分析方法-测序是比较常用的方法,例如HITS-CLIP,miR-CLIP,AGO-RIP-Seq,LIGR-Seq,Biotin-Pulldown和RNA-seq等,鉴定出miRNA/mRNA对后,通过萤光素酶测定方法证实相互作用,即将测试的mRNA的3¢UTR克隆到萤光素酶基因的下游,通过构建体发出的光的变化来表示miRNA的表达。但是,这些方法均存在一定缺点,比如复杂、耗时等等,因此目前大多数miRNA通过获得序列、结构或热力学特征后,使用生物信息学方法预测miRNA/mRNA相互作用并预测miRNA靶标。近年来,预测miRNA靶标的算法和网络服务器激增(表4),但这些预测也常常出现不一致,不准确等不足,因此辅助算法诞生,即通过结合许多主要目标预测的输出来执行更全面的分析(例如,miRSystem结合了七个主要算法,而miRWalk2.0则将其中的12个结合在一起),并可以通过设置匹配数来控制搜索的严格度,但这些分析的输出也是一长串的预测目标。集成/富集分析则适用于处理这些较长的基因列表。在综合分析中,通过附加条件获得预测目标列表,接下来将单个miRNA或miRNA预测靶标的列表与来自相同实验背景的差异表达基因(DEG)的列表进行比较或与表达存储库如GEO数据库比较,那些与miRNA表达水平成反比的靶标将整合到限定列表中。采用上述方法,张等人构建了一个miRNA:mRNA调控网络,即用蓖麻油处理的高脂喂养的ApoE缺陷小鼠中的ATH,miRNA表达的变化主要影响病变中的PI3K/Akt,Ras,ErbB和VEGF信号通路。

表4. miRNA靶标的预测方法和miRNA/mRNA相互作用的整合分析。

GO富集分析将差异表达基因(DEG)中的单个基因进行分类归纳,可以发现那些具有共同功能的类别,把互作网络进一步细化到结构通路或分子功能。对ATH-DEG的GO分析发现了与核酸功能相关的蛋白质富集,例如表观遗传调节剂,[肝X]核受体或核糖体蛋白,作者在ATH中的综合分析也发现了与核酸功能相关的基因富集。

最后,lncRNA的识别增加了这种互作网络分析的难度,因为lncRNA功能异质性大,可以充当miRNA海绵发挥不同作用,还可以与miRNA竞争共同的mRNA靶标,或者与染色质结构相互作用,影响其功能表征。此外,由于大多数lncRNA功能尚未注释,因此单个lncRNA功能的信息很少且不完整,作用机制不明。但是,目前已有研究报道了在ATH中miRNA:mRNA:lncRNA互作网络(表3)。

6    临床中的暗转录组:未来的挑战

人类基因组的完成使人类认识到暗转录组(由“垃圾” DNA编码)属于调节性RNA,其中许多与人类疾病的发生发展有关。在临床背景下推动ncRNA革命,探索其作为特定生物标志物或致病性中间体的作用是人类面临的巨大挑战,这需要在测序信息的产生,管理和解析方式上进行新的技术开发。测序技术的理念是“更快,更长,更便宜”,下一代测序仪则应增加对准确性的重视。按照临床分析标准对ncRNA进行测序并不是一件容易的事,需要极高的准确性和灵活性。准确性是因为ncRNA中的点突变(对癌症研究至关重要)不能被用于扩增和产生序列的试剂或用于检测序列的机器的噪声所损害,并且多重测序会大大增加成本。灵活性是因为ncRNA的大小和结构变异性大,且存在许多可变剪接事件导致的多个同源形式,因此从短序列重建长序列是一个挑战,对于富含簇状重复序列(例如Alu重复序列)的基因组区域测序同样需要做到上面两点。但未来测序技术已表现出创新性和动态性。

在临床环境中引入ncRNA表达谱的第二大挑战是测序信息管理和使用的方式。首先,需要以易于检索的方式存储,而且需要开发新的软件,创建新的医学或者生物学相关的窗口易于提取数据,此外,要做到数据兼容性和标准化。市场上以及未来不同的测序平台应努力实现数据共享。另一方面,整个基因组/转录组水平的数据解析和挖掘则需要使用人工智能和深度学习算法。基因组数据集庞大且复杂,需要新的有效分析工具,数据科学的深入学习将对基因组探索和挖掘起到重要作用。深度神经网络Splice AI已被用来预测mRNA前体的转录物,以及具有引起隐蔽剪接事件能力的非编码变异体,未来可能还会开发出许多类似的智能工具来辅助解析整个转录组/基因组。

结论

人类正在以一种新的方式看待疾病、正常,未患病的状态。疾病与基因组DNA的突变或编码mRNA表达的改变有关,但是,现在这个“编码世界”只是基因表达的冰山一角,因为非编码RNA的数量多于编码RNA的数量,而且所有这些RNA在编码基因之间(以及与染色质)相互作用,形成了复杂的调节性miRNA / lncRNA / mRNA网络,这种失衡将是复杂疾病的基础。因此,建立准确的疾病模型、开发新的个性化治疗方法需要测序技术的创新以获得准确的测序数据,而且需要该测序数据易于管理以及公开透明,以深度挖掘潜在的miRNA/lncRNA/mRNA互作网络,为人类疾病做出突破性贡献。


更多推荐

1  科研 | CELL: MicroRNA与人类进化正选择和异常代谢相关

2  科研 | CELL:人类细胞表面IgSF相互作用组揭示蛋白质-蛋白质相互作用的复杂网络

END

(0)

相关推荐