基于片段的药物设计研究进展

    [摘要]基于片段的药物设计(FBDD)方法是一种通过筛选碎片库得到苗头片段,然后采用基于结构的设计策略对苗头片段进行优化和改造获得先导化合物的研究。其研究过程分为3个部分:1)设计并构建片段库;2)片段库的筛选;3)利用基于结构的药物设计策略对苗头片段进行优化设计,最终得到类药性的先导化合物或候选化合物。通过结合已经上市的3个抗肿瘤药物(vemurafenib、venetoclax和erdafitinib)和目前处于Ⅱ期临床的KRASG12C抑制剂AMG510的研究为实例对FBDD的最新研究进展进行综述与展望。

基于片段的药物设计(fragment-baseddrugdesign,FBDD)是一种通过筛选碎片库得到苗头片段,随后基于结构的设计策略对片段进行优化和改造获得先导化合物的研究方法。FBDD方法是为了克服传统高通量筛选的缺陷而逐步发展起来的新技术。高通量筛选由于盲目性大,命中率低,成本高,对于部分药物靶点很难筛选得到理想的化合物。FBDD方法基于药物靶标的活性位点是由多个子口袋组成,首先筛选得到各个子口袋的特异性结合片段,再将与靶蛋白各个子口袋特异结合的片段以合适的连接子连接起来,组装成为高活性的化合物。FBDD方法与传统的高通量筛选获得苗头化合物方法相比,具有特异性高、类药性高、效率高等优势。

FBDD作为发现苗头化合物的一种关键技术,逐渐成为药物研发的主流方法。其研究过程可以分成3个步骤:1)片段库的设计构建(片段通常符合“3规则”,即:相对分子质量≤300;氢键供体数目≤3;氢键受体数目≤3;计算脂水分配系数cLogP≤3;旋转键数目≤3;极性表面积≤60Å2);2)片段筛选(使用多种生物物理技术方法筛选获得与靶标具有结合能力的苗头片段);3)片段优化(基于靶标结构特征,通过迭代优化策略将苗头片段优化成为先导化合物)(见图1)。至今已有数十个采用基于片段药物设计方法的药物进入临床试验研究,其中已有3个药物(vemurafenib、venetoclax和erdafitinib)被美国FDA批准上市。

1FBDD的研究方法

1.1片段库的构建

FBDD的第一个关键步骤是片段库的设计构建。大多数片段库中的片段分子符合“3规则”。此外,片段库的设计还包括评价化合物的纯度、稳定性和溶解性等方面。在片段初步筛选时,片段的浓度一般都大于500μmol·L-1,甚至更高。因此,化合物在水溶液中必须有很好的溶解性。

在构建化合物库时,还应避免包含“不良”化合物。“不良”化合物包括非特异性的结合片段、活性共价片段、泛测定干扰化合物(pan-assayinterferencecompounds,PAINS)、螯合剂及易聚集化合物等。具有这些特征的片段在筛选实验中,即使对靶标没有特异性的亲和力,依旧被作为是命中片段。通常有如下几种方法去除“不良”化合物:1)计算筛选可排除一些明显的“不良”化合物;2)通过表面等离子共振(surfaceplasmonresonance,SPR)实验中的中性传感器表面过滤掉一些“不良”化合物,保证化合物的洁净度;3)在无靶蛋白结构信息时,可通过观察配体的核磁共振(nuclearmagneticresonance,NMR)波谱去除自聚集化合物;4)ALARMNMR(aLaassaytodetectreactivemoleculesbynuclearmagneticresonance)方法鉴定泛测定干扰化合物等。

此外,增加片段的复杂度和“3D特征”有助于识别诸如蛋白-蛋白相互作用等难成药性靶标的特异性抑制剂。在片段库构建时,还需平衡片段库最大程度的多样化和包含一些复杂度相对较高的衍生物以提供初始的构效关系信息。一方面,大量的片段蕴含着尽可能多的结合可能性,可充分探索靶蛋白的结合位点;另一方面,获得命中片段初始的构效关系信息,可为后续研究提供关键的指导信息。此外还有一些专门的片段库,如天然产物片段库、氟原子片段库等直接用于筛选。

1.2片段筛选

通常情况下,命中片段与靶蛋白仅形成少量的高质量相互作用,其结合亲和力一般在100~10000μmol·L-1的范围内。为了检测到筛选片段与蛋白之间较弱的结合作用,必须使用高灵敏的筛选方法。与典型的高通量生物活性测试相比,片段筛选时虽然片段浓度更高,但是由于片段库中的片段往往具有良好的水溶性,避免了因聚集而产生的假阳性分子。在众多生物物理筛选方法中,NMR波谱法、表面等离子共振SPR、X射线晶体学和热迁移实验(thermalshiftassay,TSA)属于片段筛选的常用方法。

1.2.1NMR光谱法NMR光谱法是片段筛选最常用的一种方法,主要分为蛋白质观察法和配体观察法。在蛋白质观察法中,片段结合信息是根据直接观察同位素标记的靶标蛋白化学位移的变化获得。配体滴定可提供二者相互作用的解离常数(Kd),并且共振归属可以揭示配体的结合位点。蛋白质观察NMR方法具有很高的灵敏度,被视为片段筛选的金标准。然而,此方法需要大量同位素标记[15N和/(或)13C]蛋白,且仅适用于相对分子质量低于50000的蛋白质。与此对应的配体观察法,仅需少量且无需同位素标记的蛋白质,对蛋白质的相对分子质量大小亦无上限要求,如饱和转移差(saturationtransferdifference,STD)、waterLOGSY(waterligandobservedviagradientspectroscopy)和19FT2实验法。

1.2.2表面等离子共振SPR是另一种广泛使用的片段筛选技术。SPR通过赖氨酸残基直接固定或使用生物素标记蛋白通过链霉亲和素-生物素相互作用将目标蛋白固定在传感器芯片上。片段流过芯片表面,与蛋白质结合的片段增加传感器表面附近的质量,改变界面的折射率,SPR仪器检测该变化。在SPR实验之前,需要开发固定靶标的方法并测试固定化靶标蛋白的功能性是否正常。SPR方法仅需要微量的蛋白质,就可以用于数十个甚至数百个配体的筛选。SPR是一种定量方法,当配体的溶解度高于Kd时,可以从剂量反应曲线得出Kd。SPR的定量性质使其成为研究苗头片段类似物并确定其构效关系和结合动力学的理想方法。此外,SPR生物传感器和仪器的最新进展使该技术能够检测相对分子质量低于100的蛋白与小分子的结合,并大大减少了由于非特异性结合导致的假阳性分子数目。

1.2.3X射线晶体学X射线晶体学通常被视为确定结构的方法,但它也可用于片段筛选。在FBDD中使用X射线晶体学有时可识别出多个结合位点。晶体筛选的优势是可以直接获得苗头片段与靶蛋白的晶体结构,这有助于片段的后续修饰。该方法可能会产生结合力很弱的化合物,以至于用结晶学以外的任何方法都无法检测到它们的亲和力,命中的苗头片段只有经过修饰后,才可被其他技术方法检测,这强调了晶体学作为筛选方法的灵敏性。晶体学筛选需要强大的结晶系统,并且要求片段和蛋白具有较好的溶解性,对于一些溶解性差的膜蛋白则不适用。此外,X射线晶体学筛选尽管可以有效避免假阳性,但是有时会导致假阴性。

1.2.4热迁移实验TSA中小分子化合物结合靶蛋白,形成热力学稳定性增加的复合物。每种靶标蛋白都有自身的热熔曲线,随着温度的升高,蛋白会发生降解。当靶标蛋白结合小分子以后,稳定性增加,未降解蛋白的量会提高。在实验过程中根据蛋白熔解温度(Tm)的变化判断片段对蛋白的作用强弱。差示扫描荧光法(differentialscanningfluorimetry,DSF)是TSA方法中的一种,每天可以筛选数百甚至上千个化合物。在DSF实验中,蛋白质的热解折叠可通过添加荧光染料来监控,该荧光染料与蛋白质变性时暴露出的疏水斑块结合。片段的结合亲和力和蛋白质解链的热力学性质共同决定了配体存在下蛋白质的解链温度,因此该方法筛选中,假阳性和假阴性很常见。DSF一般作为NMR筛选之前的一次富集筛选。

1.2.5其他方法片段筛选的方法还包括微量热泳动、弱亲和色谱、质谱技术及虚拟筛选等。微量热泳动技术是一种简单、快速、精确定量生物分子相互作用的方法。它可以测量分子在微观温度梯度场中的运动,检测蛋白水化层、电荷的改变。对于弱亲和色谱,蛋白质以类似于SPR的方式固定,待测试化合物流过阵列。该方法不是记录折射率的变化,而是测量与固定蛋白相互作用引起的化合物保留时间的差异。天然质谱法是片段筛选方法的重要补充。最简单的形式是片段/靶蛋白混合物通过软电喷雾电离进行离子化,根据靶蛋白分子离子质量的增加判断结合的片段,可以在多组分复杂体系中分析片段,片段/靶蛋白对的气相丰度可用作相对结合亲和力的粗略度量。分子对接可用于预测片段的结合模式及与蛋白的相互作用。分子对接应用于片段库的虚拟筛选,不仅需产生片段正确的结合模式,还必须评估在溶剂环境中片段与蛋白结合时自由能的变化。分子对接的构象搜索算法和打分函数需要考虑片段的构象熵损失、去溶剂化效应、水相互作用及蛋白的构象变化等多种因素。因此大部分情况下,分子对接并不是片段库筛选的首选。当然随着对接方法和打分函数的改进和发展,分子对接在片段库筛选中的应用也将越来越多。

鉴于存在多种被广泛验证和应用的片段筛选方法,合理选择筛选方法是面临的首要难题。每种独立的方法都有假阳性和假阴性的风险,明智的策略是确定最佳组合和筛选顺序。一种策略是结合2种或多种筛选技术,并仅跟进公共的命中片段。这种严格的方法降低了公共命中片段假阳性的风险,但是增加了假阴性的风险。实际上,一些文献表明,用不同方法确定的苗头片段重叠度非常低。这可能是由于不同方法“筛选模式”和“验证模式”之间的差异导致的。另一种策略是选择一种已被证明对特定靶蛋白有效的筛选方法作为主要方法,依赖此筛选方法,直到化合物的亲和力达到其他方法可检测到为止。

1.3片段优化

经过验证的命中片段活性一般在毫摩尔级别,往往与蛋白结合位点处氨基酸残基形成氢键、疏水相互作用等,且即使片段发展成为较大的分子,片段与蛋白的结合模式依然保守。这为片段的后续优化提供了一个高质量的起始结构。通常,X射线晶体结构数据为后续的结构改造提供了良好的基础。如果没有可用的晶体结构数据,则需综合利用分子对接和生化实验验证等方法确定片段的结合位点和作用模式。在获得活性片段与靶蛋白的结合信息后,利用基于结构的药物设计策略,兼顾化合物的合成可行性和类药性等对片段进行结构优化。片段优化主要有片段连接、片段生长及片段融合3种策略。

1.3.1片段连接在不同位点(最好是相邻位点)结合的非重叠片段通常可以连接在一起生成新的化学结构,这种称为片段连接的策略是片段修饰最常用的方法。通过连接片段衍生的化合物应具有比单个片段结合能之和更低的结合自由能。片段与靶蛋白以特定构象结合,理想的连接链将使连接后的化合物中各片段保持与之前相同的作用模式,且连接链与蛋白质可以形成额外、有利的相互作用,并增加很少的熵损失。刚性连接链可降低结合过程中自由度和熵的损失。柔性连接链则赋予衍生物更多的可旋转键,导致键合和溶液相中总体构象空间增加,从而降低了对特定靶标的选择性。例如,将作用于凝血酶S1口袋的对氯苯基四唑(片段a)与作用于邻近口袋中的氨基醇(片段b)连接得到先导化合物1,IC50为1.4nmol·L-1(见图2)。

1.3.2片段生长片段生长指原子被添加到片段中,增加与蛋白形成的相互作用。片段与蛋白复合物的晶体结构是片段成功生长的关键影响因素。蛋白与现有抑制剂的相互作用对于片段的生长同样具有重要的指导意义。从片段生长到先导化合物的过程中,配体效率监控是一种方便且客观的评估片段增加的相对分子质量是否有效的方法。一般认为最终化合物的配体效率小于0.3,分子体积过大会损害药代动力学性质。尽管通常优选添加疏水性官能团以增加活性,但是化合物脂水分配系数过高也会导致如溶解度差,易聚集及生物利用度低等结果。因此,应首选考虑在片段的特定位置生长极性官能团,如氢键供体或受体,使其与蛋白质形成氢键相互作用,然后在后续的生长步骤中增加疏水性片段。例如,在多肽脯氨酰基顺反异构酶(peptidyl-prolylcis/transisomerase1,Pin1)抑制剂发现过程中,在片段c的基础上增加疏水片段甲基、苄基和氢键供受体酰胺片段等得到先导化合物2,活性提高了约90倍(见图3)。

1.3.3片段融合片段融合是指利用与蛋白质有结晶结构的其他片段和已知配体的结构信息,将重叠分子的结构部分并入片段中,形成大的杂合分子。不同系列化合物活性变化的趋势可用于确定与蛋白结合的重要的片段和相互作用,这些信息有助于将不同系列中的重要片段杂化形成新的衍生物。例如,发现乙酰胆碱结合蛋白抑制剂时,基于片段d(IC50=0.032μmol·L-1)与片段e(IC50=20μmol·L-1)分别与靶蛋白形成共结晶结构,将二者叠合后片段进行融合得到先导化合物3(IC50=0.32μmol·L-1)(见图4)。

2FBDD技术的药物实例介绍

2.1处于临床研究阶段和已上市药物

自1996年雅培公司报道了识别结合在靶蛋白活性口袋的低相对分子质量的片段技术——核磁共振构效关系研究法(structure-activityrelationshipsbynuclearmagneticresonance,SARbyNMR)以来,FBDD得到了广泛的应用。同时基于结构生物学、核磁共振技术和计算机技术的发展,FBDD方法大大加快了苗头化合物的发现效率,在苗头化合物优化成为先导化合物/候选化合物方面产生了不少成功的应用。据文献报道,目前基于片段的药物发现方法获得的候选药物中有3个药物(vemurafenib、venetoclax和erdafitinib)已经被美国FDA获批上市,另有约21个药物处于临床研究阶段(见表1)。

2.2药物研究案例分析

2.2.1VemurafenibBRAF是人类重要的原癌基因之一。BRAFV600E突变主要发生于黑色素瘤、结肠癌和甲状腺癌中。该突变导致下游MEK(mitogen-activatedextracellularsignal-regulatedkinase)-ERK信号通路持续激活,从而促进细胞的增殖和肿瘤的侵袭转移。Plexxikon公司研究人员建立了数量约20000个、相对分子质量在150~350的片段库用于选择性的BRAFV600E抑制剂的研究。在200μmol·L-1浓度下,基于该片段库针对多种具有典型性结构的激酶家族成员进行筛选。其中238个化合物在200μmol·L-1浓度下对Pim-1(proviralintegrationsofmoloneyvirus1)、p38和CSK(Cterminalsrc-familykinase)3种激酶的抑制率大于30%。随后对这238个化合物和上述3种激酶进行共结晶结构解析。如图5a所示,片段f(3-苯胺基-7-氮杂吲哚)与Pim-1共结晶结构显示,7-氮杂吲哚片段可与Pim-1铰链区形成氢键相互作用。但该片段对Pim-1的结合力较弱(IC50≈200μmol·L-1)。进一步对不同激酶的结构分析,在保持与铰链区具有双氢键结合的基础上,针对片段f的2、3、4、5、6位进行取代优化,从而提高该类骨架抑制剂的活性与选择性。其中片段g[3-(3-甲氧基苄基)-7-氮杂吲哚]对FGFR1的抑制IC50为1.9μmol·L-1。片段g与FGFR1的共晶结构显示,7-氮杂吲哚片段可与FGFR1的铰链区形成双氢键作用,甲氧基与关键氨基酸形成氢键作用,从而限制化合物的结合构象(见图5b)。基于以上共结晶分析,进一步在片段g的氮杂吲哚片段3、4和5位进行优化,得到代表化合物PLX4720(4)。PLX4720优先结合在BRAFV600E和BRAFWT的活性构象中,对BRAFV600E和BRAFWT的IC50分别为0.013和0.16μmol·L-1。然后将PLX4720的5位氯原子用4-氯苯基取代,最终得到PLX4032(vemurafenib,5)。Vemurafenib的结合模式与PLX4720相似,结合在BRAFV600E活性构象口袋(见图5d)。利用生物活性技术筛选活性片段,随后采用基于片段生长的FBDD技术成功研发获得vemurafenib结合模式见图5d,从最初的片段筛选到vemurafenib被美国FDA批准上市仅仅用了6年时间。2011年,美国FDA批准vemurafenib用于治疗BRAFV600E突变的恶性黑色素瘤。Vemurafenib也是首个成功的经FBDD技术开发并被批准上市的药物。

2.2.2Venetoclax内源性细胞凋亡主要通过Bcl-2蛋白家族调控。Bcl-2蛋白家族又可分为2类:抗凋亡蛋白,比如Bcl-2、Mcl-1和Bcl-XL;促凋亡蛋白,比如Bax(Bcl-2associatedXprotein)、Bak(Bcl-2homologousantagonist/killer)和Bim(Bcl-2interactingmediatorofcelldeath)。在肿瘤细胞中,Bcl-2等抗凋亡蛋白会过量表达,与促凋亡蛋白Bak或者Bax结合形成二聚体,使Bax或者Bak无法发挥促凋亡的功能,从而避免细胞凋亡的发生。研究发现,与Bcl-2等抗凋亡家族蛋白结合的结构域是BH3。因此,设计BH3模拟物是目前靶向Bcl-2家族蛋白的主要策略。

2005年,雅培公司运用“SARbyNMR”方法筛选小分子片段库,识别与Bcl-XL上BH3结合的疏水性凹槽有相互作用的小分子片段。初步的筛选结果表明,片段h[4'-氟-4-羧酸二苯基,Kd=(300±30)μmol·L-1]和片段i[5,6,7,8-四氢萘-1-醇,Kd=(4300±1600)μmol·L-1]分别结合到疏水性凹槽的相邻位点(见图6a)。片段h的羧基与Arg139相互作用,而4'-氟苯基占据由Tyr101、Leu108、Val126和Phe146形成的疏水口袋。片段i则占据了原本BH3多肽链上Ile85结合的空腔。设想将2个片段连接将会得到活性更高的分子,在考察不同的连接方式和片段后,采用磺酰胺连接链得到先导化合物6,其对Bcl-XL亲和性大幅提高[Ki=(0.036±0.0016)μmol·L-1](见图6b)。随后采用基于结构的药物设计策略,增加分子与靶标结合的疏水作用,获得活性更强的化合物ABT-737(7),图6c显示化合物ABT-737与Bcl-XL的结合模式。然而由于ABT-737的口服生物利用度较差,进一步通过增加分子的柔性和亲水基团的优化策略,获得候选分子ABT-263(navitoclax,8),该分子目前处于Ⅱ期临床研究。随后在ABT-263的基础上,雅培公司进一步优化旨在提高分子的选择性,最终获得候选分子ABT-199(venetoclax,9),其与Bcl-XL的结合模式见图6d。2016年,美国FDA批准ABT-199用于治疗慢性淋巴细胞白血病。

2.2.3ErdafitinibFGFRs是一类典型的受体酪氨酸激酶,其家族包括FGFR1、FGFR2、FGFR3和FGFR4共4种受体。FGFRs基因的融合、重排、易位和扩增与多种肿瘤的发生和发展密切相关。杨森制药公司研究人员对Astex专有数据库开展基于片段的筛选,得到铰链区结合片段j和k,进一步利用片段j和k与FGFR3的共晶结构展开虚拟筛选,得到苗头化合物10(见图7c)。化合物10是在片段k的7位引入2,4-二甲氧基苄胺片段。随后,又用3,5-二甲氧基苯胺片段替换苄胺片段,伸向守门残基后面的疏水性口袋,得到化合物11,该化合物对FGFR3的抑制活性达0.012μmol·L-1。进一步优化该类化合物对FGFR家族成员的抑制活性和药代动力学性质,用含有碱性氨基的烷基链取代化合物11中苯胺上的氢原子,从而使侧链末端的碱性氮原子与DFG基序上的Asp641产生作用,最终得到JNJ-42756493(erdafitinib,12),结合模式见图7d。Erdafitinib对FGFR1、FGFR2、FGFR3和FGFR4各亚型的IC50分别为0.0012、0.0025、0.003和0.0057μmol·L-1。2019年美国FDA批准erdafitinib用于接受化疗后病情发展并且肿瘤中存在特定FGFR基因突变的局部晚期或转移性尿路上皮癌患者的治疗。

2.2.4AMG510RAS基因家族目前已知的成员包括KRAS、NRAS和HRAS,其中KRAS突变最为常见,大约占85%。KRASG12C突变在非小细胞肺癌中约占13%,在结直肠癌中约占3%~5%,在其他实体瘤中约占1%~2%。近年来,针对KRASG12C抑制剂的开发是该领域的研究热点之一,尤其是基于变构的switchⅡ的抑制剂研究。为了获得高质量的苗头化合物,安进公司研究人员基于Carmot公司开发的“Tethering”方法针对KRASG12C进行基于FBDD的药物设计。“Tethering”方法适合于含有反应性氨基酸残基Cys的靶标蛋白,化合物库中小分子结构中都包含二硫键。片段与靶标蛋白共孵育后,利用电喷雾质谱判断可以“修饰”靶标蛋白的片段(见图8a)。经过“Tethering”方法筛选,成功获得丙烯酰胺类不可逆结合的“bait”片段i。随后基于3300个片段分子库建立新化合物库筛选,结合质谱技术确定了结合较好的苗头化合物13。化合物13与KRASG12C的晶体结构显示其结合在P2口袋,且丙烯酰胺与Cys12形成共价结合,酰胺基团的羰基与Lys16形成氢键。处于中间部位的酰胺连接基团与氨基酸Ala59和Tyr96形成一对氢键,异唑部分指向处于关闭构象的switchⅡ口袋(见图8c)。

为提高化合物的活性,进一步采用ChemotypeEvolution的组合筛选方法(多轮分子库构建和筛选)获得活性更优的第2代苗头化合物14。与化合物13的结合构象比较,化合物14的四氢异喹啉部分可占据由His95/Tyr96/Gln99组成的隐藏口袋,且switchⅡ处于开放式构象(见图8d)。化合物14在人胰腺癌细胞上表现较好的抑制活性(IC50=0.067μmol·L-1)。然而,药代动力学性质研究显示由于清除率相对较高,导致化合物14的生物利用度较低。随后,安进公司将已报道GDP-KRASG12C抑制剂ARS-1620(15)与先导化合物14进行结合构象叠合(见图8e),推测在ARS-1620喹唑啉母核的1位引入取代苯环等取代基可占据由His95/Tyr96/Gln99构成的隐藏的口袋,合成得到化合物16。进一步基于结构和药代动力学性质的优化,最终得到AMG510(17)。AMG510于2019年进入临床研究,也是首个进入临床实验的KRASG12C抑制剂。AMG510的成功研发也打破了“KRAS是不可成药靶点”的说法。

3结语与展望

FBDD的研究过程包括高质量片段库的设计构建,蛋白-片段相互作用的验证和基于结构药物设计指导下的苗头片段的优化等。通过FBDD方法发现的片段通常具有较高的配体效率,在获得片段与靶蛋白的结构信息基础上,利用配体结合效率为指导方向,快速优化片段。近年来,随着筛选技术的不断进步,检测片段与靶蛋白之间弱结合作用的表征变得越来越容易,使得FBDD技术成为近年来发展最快的药物研究新方法之一。

尽管FBDD技术目前取得了巨大的成功,但是仍存在以下几个方面需要改进:首先是片段库的质量,过去几十年,FBDD技术强调了片段质量的重要性,即要确保进行实验筛选的片段具有合适的物理化学特性,例如溶解度和避免干扰读数(如聚集等)。现在需要同时保持片段具有良好的理化性质且分子量足够小以满足大面积化学空间的需求。其次,提高用于检测片段结合筛选技术的灵敏度。FBDD方法需要高灵敏地识别片段分子与靶蛋白的结合,需要发展使用微量蛋白,实现1000μmol·L-1亲和力下可靠地检测片段与蛋白的结合。最后,如何高效地优化苗头片段到先导化合物也是一个很大的挑战。在结构生物学和分子对接等技术指导下,充分利用片段连接、生长和融合等方法提高先导化合物优化设计的成功率。总之,基于片段的药物发现是一项融合药物化学、结构生物学、计算机辅助药物设计等多学科的药物研究新兴技术,在未来新药研发方面将发挥重要的作用。

参与文献

(0)

相关推荐