CN
EN CN

首页 技术平台 自主技术 GPDL
GPDL
蛋白质从头设计的第一步,是搭建骨架。传统方法依赖 RoseTTAFold 等结构预测网络,计算重、速度慢,且对功能位点的保留精度有限。工业界需要一种更轻量、更精准、更高多样性的骨架生成工具。

GPDL(Generative Protein Design by Language model)给出了答案。它基于 ESM2 蛋白质语言模型与 ESMFold 结构预测网络,完全摆脱对多序列比对(MSA)和天然模板的依赖。与 RFdiffusion 采用扩散模型的路线不同,GPDL 采用"结构播种 + MCMC 优化"的两步策略:先以 ESM-IF1 编码功能 Motif 的序列与距离矩阵生成初始结构,再通过迭代优化在保留功能位点精度的前提下,生成全新支架。

img.png


Scaffold-Lab 基准测试覆盖了 24 个标准功能 Motif 设计任务。GPDL 成功解决 22 例,成功率业界最高。独特可设计结构簇数量比 RFdiffusion 高出 33.5%。由于底层使用 ESMFold 而非 RoseTTAFold,生成速度提升 10–20 倍。模型提供 Inpainting 与 Hallucination 两种模式,可覆盖 α-螺旋、β-折叠及 α/β 混合拓扑,设计骨架经自洽验证后 Motif RMSD < 1 Å。

对工业界而言,这意味着什么?功能蛋白从头设计的周期被大幅压缩。酶活性中心支架、金属结合蛋白、药物递送微型蛋白的开发,不再需要漫长的结构筛选。GPDL 让"从功能位点到全新骨架"的精准构建成为常规操作。

该成果发表于 International Journal of Biological Macromolecules(2025),代码已开源。

论文:https://doi.org/10.1016/j.ijbiomac.2025.148441
GitHub:https://github.com/sirius777coder/GPDL
专利:CN117497040A

在线留言

  • 留言内容