醋醋百科网

Good Luck To You!

基于深度学习的DRAGONFLY模型在分子设计中的应用与优势

01 引言

在现代药物开发中,分子设计是一个关键环节。传统的分子设计方法依赖于湿实验的经验,耗时长且成本高昂。随着人工智能和机器学习的快速发展,基于深度学习的分子设计方法应运而生,为药物开发提供了新的思路和工具。其中,DRAGONFLY模型作为一种新型生成式深度学习方法,能够在分子设计中显示出其独特的优势

02 DRAGONFLY模型的设计与工作原理

DRAGONFLY模型采用了图到序列(graph-to-sequence)神经网络架构,通过学习药物靶点与其配体之间的相互作用网络(interactome),在分子生成过程中同时考虑了结构配体两种设计方法。这种双重方法使得DRAGONFLY模型能够在模型训练过程中,不仅可以关注分子结构,还可以将物理和化学性质等目标特性整合到生成的分子中。

该模型通过使用两种化学表征法:SMILES字符串SELFIES来训练,从而对比了不同分子表征方式在生成新分子时的表现差异。实验表明,使用SELFIES训练的DRAGONFLY模型能够生成更多的创新性分子,且具有更高的骨架多样性

a 左图:为了构建药物-靶点互作网络(interactome)图,靶点与其相应的配体根据ChEMBL数据库中的报道生物活性进行连接。具体来说,如果某个配体(蓝色圆圈)被报告的生物活性小于或等于200 nM,则它与其相应的靶点(橙色圆圈)之间会建立连接。右图:通过将变构(allosteric)和正构(orthosteric)结合位点表示为不同的节点(分别用绿色和橙色表示),药物-靶点互作网络图捕获了与每种结合位点类型相关的特定相互作用和关系。

b 左图:在基于配体设计的训练阶段,一个配体分子(表示为蓝色圆圈)被作为模型的输入。期望的输出分子(表示为棕色圆圈)根据它们通过一个共同节点与输入分子连接,表明它们共享一个结合位点。右图:对于基于结构的设计,模型的输入是结合位点本身,表示为一个蓝色圆圈。期望的输出分子,表示为棕色圆圈,是那些已观察到与相应结合位点结合的配体。

c 蛋白质结合位点(此处为Janus激酶2,PDB-ID 6VNK113)被表示为一个三维(3D)图。所有距离结合配体的任何原子超过5A的蛋白质原子都被移除,从而得到了一个以结合口袋为中心的表示。

d 配体被表示为二维(2D)图。

e 在所提出的方法中,图中的节点特征通过消息传递过程进行更新。这可以使用2D或3D消息传递来完成,具体取决于分子表示的性质。作为随后的汇聚过程的结果,获得一个潜在空间向量(latent space vector),它捕获了分子的基本特征和表示。这种压缩的表示提供了分子特征的紧凑编码,能够进行下游分析、预测或结构生成任务。潜在空间向量可以选择性地与输出分子的物理化学特性的愿望列表进行拼接。这允许在去新分子设计过程中加入项目特定的属性约束或目标。MLP表示多层感知器(Multilayer Perceptron),RNN表示循环神经网络(Recurrent Neural Network),LSTM是具有长短期记忆单元架构的RNN类型。

f 本研究的工作流程包括DRAGONFLY验证、DRAGONFLY在过氧化物酶增殖物激活受体(PPAR)上的应用、化学合成和生物学表征。ADME表示吸收、分布、代谢和排泄(Absorption, Distribution, Metabolism, and Excretion),FEP表示自由能扰动(Free Energy Perturbation)计算。

03 DRAGONFLY模型的应用场景与优势

在分子设计的应用中,DRAGONFLY模型展现了其在以下几个方面的显著优势:

  • 高效的分子生成能力:通过交互网络学习,DRAGONFLY模型可以在已知化学空间之外生成新的分子,并展示出较高的结构和骨架新颖性。
  • 多目标优化能力:模型能够根据预设的物理化学属性生成符合要求的分子。这种能力使得DRAGONFLY模型在药物发现中具有很大的应用潜力,尤其是在需要精确调整分子属性以达到特定生物活性的情况下。
  • 结构与配体结合的设计方法:与传统的仅基于结构的设计方法相比,DRAGONFLY模型能够同时处理结构和配体信息,从而在多种应用场景中实现更好的性能。

04 DRAGONFLY模型在药物发现中的应用实例

以PPARγ为例,DRAGONFLY模型通过生成与PPARγ结合的新分子,成功设计了具有低微摩尔至高纳摩尔活性的PPAR调节剂。实验结果显示,这些分子不仅具备预期的生物活性,还具有较好的选择性和ADME(吸收、分布、代谢和排泄)性质。这种多目标的分子优化能力,使得DRAGONFLY模型在药物开发中的潜力得以进一步验证。

05 DRAGONFLY模型的局限性与未来发展方向

尽管DRAGONFLY模型在分子设计中展示了许多优势,但其在实际应用中仍然面临一些挑战。例如,当前的评分函数在易合成性方面的表现有限,导致了某些生成分子在实际合成时步骤复杂且产率较低。此外,尽管模型能够生成具有多样性和新颖性的分子,但如何在大规模生成中确保生成分子的可合成性和药效仍需进一步研究。

未来的发展方向包括改进评分函数以增强生成分子的易合成性,探索更多的神经网络架构以提高模型的泛化能力,以及扩展药物靶标交互网络以涵盖更多的目标和应用场景。

a 散点图展示了利用人类过氧化物酶增殖物激活受体(PPAR)γ结合口袋作为模板(PDB-ID 3G9E41)进行的去新分子设计的分子。图中显示了定量构效关系(QSAR)得分,代表了预测的PPARγ结合亲和力与新颖性得分之间的关系。满足新颖性和预测的生物活性要求的生成分子的目标区域在图的右上角用蓝色框标出。

b 图中展示了五种排名靠前的去新分子设计的分子结构。排名标准为PPARγ+PPARδ双靶点亲和力和结构新颖性(左侧,1和6–9),或PPARγ单靶点亲和力和结构新颖性(右侧,2,6和10–12)。

c 显示了排名靠前的100个针对PPARγ的分子中的一些非羧基头基和二级酰胺的例子,其中灰色阴影的R基团表示与连接子相连的芳香基团。

06 结论

DRAGONFLY模型作为一种基于深度学习的分子设计工具,通过其高效的分子生成能力、多目标优化能力以及结构与配体结合的设计方法,在药物发现中展现了巨大的潜力。随着模型和算法的不断优化,DRAGONFLY有望在未来的药物开发中发挥更大的作用,推动药物设计进入一个更加智能化和高效化的新时代。

参考资料:Atz K, Cotos L, Isert C, et al. Prospective de novo drug design with deep interactome learning[J]. Nature Communications, 2024, 15(1): 3408.

版权信息

本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。

本文为原创内容,未经授权禁止转载,授权后转载亦需注明出处。有问题可发邮件至sixiali@stonewise.cn

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言