头秃元凶「真面目」首次被揭穿,鹅厂程序员立功了
Nature 子刊
好消息,好消息。
打工人的噩梦,脱发的元凶,它的高清大头照现在科学家扒!出!来!了!
就是它,脱发之源SRD5A2(II 型 5a 还原酶)↑↑↑
这是 SRD5A2 的高分辨率三维蛋白质结构首次被破解,并且分辨率达到了 2.8 埃(1 埃 =10-7 毫米)。
也就是说,疗效更好的防脱新药,现在有了研发的关键靶点。
同时,知名治脱药物「非那雄胺」的防脱机制也在这项研究中被揭示。
这一来自南科大、匹兹堡大学、新加坡 A*STAR 研究所和腾讯 AI Lab 的成果已经登上了 Nature Communications。
其中,AI 还立下了一桩大功。
具体如何,快来一起围观:
「秃如其来」的真凶
熬夜秃,不熬夜的,也秃了。
引起脱发的原因很多。
但对于二三十岁就秃了头的年轻人群来说,攻击范围最广、最顽固的「元凶」,是雄性激素脱发。
引起雄脱的原因,就是毛囊杀手—— DHT(二氢睾酮)。
人体内的睾酮(男女体内都有)在 SRD5A2 的作用下,可进一步代谢为与毛囊雄激素受体结合能力更强的 DHT。
DHT 进入细胞后,会对代谢系统产生作用,使作为能量源的 ATP 无法产生,从而无法进行毛发的蛋白合成。毛母细胞因此失去活力,角质化形成休止期毛发,大概三个月后就会脱落。
在对抗脱发的斗争中,人们早就了解到SRD5A2 还原酶是导致雄脱的幕后「真凶」,也偶然间发现了治疗前列腺增生的非那雄胺有抑制 SRD5A2 的作用,并将它作为治疗雄脱的主要药物。
但直到最近,SRD5A2 的高分辨率蛋白质结构才首次被破解:
与细菌甾醇还原酶 MaSR1 不同的是,SRD5A2 具有独特的七次跨膜结构,由 6 个环连接:
团队根据羟基侧富含的正电荷残基,将羧基末端的环 ( C-loop ) 面对细胞质,将氨基末端环 ( N-loop ) 面对内质网腔。
此外,氨基末端残基 C5N 与环 4(L4)中的 C133L4 形成二硫键,这表明氨基端侧面对的正是内置网腔位置,这是因为细胞质部分拥有还原性环境。
至于为什么非那雄胺(Finasteride)能够抑制 SRD5A2,首先要从 SRD5A2 的作用讲起。
图 a 表示的是 SRD5A2 通过还原睾酮的双键,将睾酮转化为二氢睾酮。
而非那雄胺的作用,则是通过本身结构中的侧链(图 b 中的 R 基),连接到 SRD5A2 的酰胺基链,形成二氢非那雄胺(DHF),提前「预支」掉 SRD5A2 的还原作用。
在蛋白质结构 3D 示意图中,粉红色标出的部分就是二氢非那雄胺,而与之链接的青色部分,是 SRD5A2 的酰胺基链,也就是通常还原性辅酶 II 中的主要功能性结构 NADP。
你可能会问,既然已经发现了针对雄性激素脱发的有效治疗药物,再做如此深入的基础研究,有什么重要性?
其实,了解蛋白质的微观结构,能够更好地摸清它的性质,当然就能根据这些性质针对性地利用。
比如,目前的非那雄胺并不是治疗雄性激素脱发的完美方案。
首先,非那雄胺具有一定的副作用风险,比如有概率引起男性阳痿,按照美国 FDA 记录的数据,这个概率在 2% 左右。
而且,停药之后,没了「预支」SRD5A2 还原作用的非那雄胺,脱发很可能复发。
除了引起阳痿、疗效反弹,非那雄胺还有一个很大的局限性,即女性不能使用,一是因为确实没什么效果,二是会对生理周期产生影响。
而了解了 SRD5A2 的结构和非那雄胺作用机制,可以让科研人员模仿类似机制研制出副作用更轻的替代药品,或者从基因侧入手,抑制 SRD5A2 的表达。
不仅如此,对于 SRD5A2 活性失调引发的各种疾病,这一成果也有着重要的参考价值。
如何破解 SRD5A2「真面目」
所以,研究人员们具体是如何得到 SRD5A2 的高分辨率结构信息的呢?
「从头折叠」
想要破解 SRD5A2 的真面目,主要的技术难点在于,它具有独特的 7 次跨膜结构,与人类全部已知结构的蛋白质差异较大,难以通过常用的「模板建模」方法获得初始构型,来解析晶体数据。
于是,研究人员基于腾讯 AI Lab 开发的tFold工具,采用了「从头折叠(de novo folding)」的方法。该方法可以不依赖于模板来预测蛋白质结构。
具体而言,参照蛋白质结构预测算法trRosetta,首先,根据序列比对文件来预测氨基酸之间的距离和朝向分布,并将其转化为势能。
然后,用这一结果作为约束条件,与粗粒度的能量优化一起输入蛋白质建模工具 Rosetta。
最后,根据 Rosetta 能量,选择满足约束条件的最佳结构。
在这个实现过程中,tFold 工具提供了三项技术辅助,进一步提高了从头折叠方法蛋白结构预测的精度:
腾讯 AI Lab 研发的多数据来源融合(multi-source fusion)技术,用来挖掘多组多序列联配(multiplesequence alignment, MSA)中的共进化信息。
主要是借助多个不同的 MSA(多重序列对比)搜索工具,在不同的参数、不同来源的蛋白序列数据库下,得到的具有多样性的 MSA,然后再采用一种深度学习技术将其包含的共进化信息给融合起来。
深度交叉注意力残差网络(deep cross-attention residual network,DCARN),能大幅提高残基对距离、取向矩阵等重要蛋白 2D 结构信息的预测精度。
其核心在于利用互相交叉的 2D 注意力机制,来更有效的捕捉远程的残基对相互作用。这种 2D 注意力机制的表现能力,比通常的深度卷积神经网络更强。
模板辅助自由建模(Template-basedFree Modeling, TBFM)方法,将自由建模(Free Modeling, FM)和模板建模(Template-based Modeling, TBM)生成的 3D 模型中的结构信息加以有效融合,从而提高最终 3D 建模的准确性。
其核心是,将 TBM 得到的 3D 模型中的残基对 2D 结构信息,以一种输入特征的方式,添加到预测 2D 结构特征的深度交叉注意力残差网络当中去,更好的帮助该网络进行 2D 结构特征的预测。
这样,即便在某些情况下 TBM 得到的 3D 模型精度不高,但其中的部分残基对结构信息(例如某些很保守的距离,或者取向)依然可以被有效的利用,从而更好的帮助 FM 进行精确的折叠。
值得一提的是,预测 SRD5A2 这个蛋白,tFold 只花费了 2 小时左右的时间。
X 射线数据收集和结构测定
研究人员还在美国阿贡国家实验室收集到了 SRD5A2 蛋白质晶体的 X 射线衍射数据。并使用 HKL2000 软件对来自 5 个晶体的数据集进行了处理和合并。
为了确定晶体结构的相位,研究人员采用从头折叠结构模型作为分子置换的搜索模型,使得 SRD5A2 的结构精度达到了 2.8 埃。
One More Thing
现在,tFold 公测版本已通过腾讯「云深智药」平台官网对外开放,蛋白质结构预测、虚拟筛选、分子生成、ADMET 预测等功能都可以免费使用。
量子位已经体验了一把,效果大致是酱婶的,预测速度也挺快:
赞 (0)