机器学习增强采样解析AR-NTD配体识别与新型拮抗剂
先说几个核心判断:靶向固有无序蛋白(IDP)的药物开发长期面临一个棘手困境——这类蛋白如同“液态”般缺乏稳定三维结构,传统依赖单一晶体结构的筛选策略几乎失效。但最近浙江大学侯廷军教授、李丹教授团队在 Nature Communications 上发表的研究,为这一难题提供了新解法。该工作的共同第一作者为博士研究生祝凯、王华婷以及博士后张锦途。
他们将目光锁定在前列腺癌治疗中的棘手靶点——雄激素受体(AR)的N端结构域(AR-NTD)。与传统的配体结合结构域(AR-LBD)不同,AR-NTD是典型的无序区域,却恰好是耐药癌细胞持续依赖的关键“命门”。研究的核心在于构建了一套融合机器学习与增强采样的计算流程,成功绘制出AR-NTD的构象图谱,并鉴定出新型拮抗剂K53。
研究背景:为何执著于“无序”靶点?
固有无序蛋白在癌症、神经退行性疾病中的重要性日益凸显,但其高度动态、构象多变的特性,使得传统的“锁钥模型”药物设计几乎无计可施。在前列腺癌领域,现有药物如比卡鲁胺、恩扎卢胺均靶向AR-LBD。然而狡猾的癌细胞一旦通过LBD突变、扩增甚至剪接体缺失逃逸,这些药物便会失效。而AR-NTD在多种耐药机制中始终“屹立不倒”,维持着关键的转录激活功能。
难点在于AR-NTD本身缺乏稳定结构,其结合口袋是瞬态、转瞬即逝的。尽管此前已有EPI-001、EPI-002等分子被报道可作用于AR-NTD,但非共价识别如何导向最终共价稳定的机制始终未被阐明。正是这一核心痛点,驱动研究团队搭建了全新的计算范式。
方法概述:一套“三步走”的机器学习增强采样工作流
面对IDP这种“流动靶标”,常规集合变量难以描述,传统采样方法极易陷入局部。研究团队的策略可拆解为三个递进的技术环节。
REST3耦合AE CV,锁定Tau-5的九种“构象脸谱”
研究团队首先聚焦于与EPI-002结合密切相关的Tau-5片段。他们采用REST3增强采样法,让这段高度柔性区域充分“运动”。但仅采样还不够,关键在于解读。他们利用自编码器这一机器学习方法,从海量动态轨迹中降维,构建了低维自由能面。结果令人瞩目:Tau-5呈现出九种结构差异显著的亚稳态构象。这相当于为一位动态演员抓拍了九张具有代表性的“定妆照”,为后续分析奠定了坚实基础。
SWISH诱导“隐藏”口袋暴露,解析EPI-002结合模式
获取构象后,下一步是定位结合口袋。研究团队通过SWISH模拟,向这九种构象中“投放”疏水探针,迫使原本隐藏在蛋白表面的疏水瞬态口袋暴露出来。这如同在水中加入肥皂,将油污(隐藏口袋)“挤”出。随后他们将EPI-002对接至这些口袋,发现其氯原子总是靠近第404位半胱氨酸的硫原子,暗示了共价键形成的潜力;同时配体周围环绕大量芳香残基,表明π-π堆积和疏水作用共同参与了最初的分子识别。
OPES、MLCV与Deep-TICA,演奏配体识别的“交响乐”
静态结合模式已清晰,但完整的结合/解离过程是怎样的?尤其是水分子在其中扮演何种角色?为此,团队引入OPES增强采样,并创新性地构建了包含水分子信息的机器学习集合变量。通过多任务学习,模型能够同时描述结合态、非结合态及水介导的中间态。最后,利用Deep-TICA从增强采样轨迹中提取慢动力学模式,成功解析了EPI-002结合、解离以及关键水介导中间态的完整变化过程。
图1. 解析IDP可成药构象与小分子作用机制的机器学习增强采样工作流。
结果与讨论
这套工作流是否可靠?研究团队从构象采样、结合机制,一直验证到虚拟筛选和湿实验,构建了完整的证据链。
验证:模拟的“九张构象”与实验数据高度吻合
首先用NMR化学位移实验数据校准。结果显示,REST3模拟得到的二级结构和Cα化学位移与实验结果高度一致,表明REST3并未“跑偏”,能真实反映Tau-5的动态行为。以此为基础识别出的九个亚稳态构象,也因此获得了坚实的采样依据。
图 2. REST3增强采样刻画Tau-5的动态构象分布并验证模拟可靠性。
图 3. AE CV自由能面揭示Tau-5的九个亚稳态构象。
口袋识别:SWISH让“隐藏”变为“可见”
仅凭静态结构很难找到Tau-5上的药理学“抓手”。SWISH模拟的价值就在于成功在多个亚稳态构象中诱导出了结合口袋,并指导了EPI-002的对接。对接结果反复验证Cys404是共价结合的“准星”,而周围芳香残基提供了非共价识别的基础。
图 4. SWISH模拟诱导Tau-5隐蔽结合口袋打开并支持EPI-002结合。
机制解析:水分子不是“旁观者”,而是“参与者”
Deep-TICA的分析尤为精彩。它揭示了EPI-002的结合和解离并非简单的“开”与“关”。结合口袋内的结构水分子形成了桥联氢键网络,在配体解离过程中还能稳定中间态。换言之,水分子主动参与并调控了整个识别过程,这是一个至关重要的动态细节。
图 5. Deep-TICA揭示EPI-002结合/解离过程中的结构水介导氢键网络。
新药发现:从计算到实验,K53脱颖而出
基于可靠的构象和口袋,研究团队顺理成章地开展了基于结构的虚拟筛选,最终发现名为K53的分子。实验数据十分亮眼:K53在前列腺癌细胞系中,尤其是对恩扎卢胺耐药的22Rv1和LNCaP-EnzR细胞,展现出显著抗增殖活性,且对非肿瘤细胞毒性低。SPR、NMR、WaterLOGSY、CETSA等一系列实验证实K53确实靶向AR-NTD-AF1区域。功能实验表明,它能有效抑制AR转录活性,下调KLK3、FKBP5等经典靶基因。结构建模显示,K53在关键药效团上与EPI-002具有相似的空间分布,但通过优化获得了更优活性。
图 6. 虚拟筛选与多维实验验证发现新型AR-NTD拮抗剂K53。
可迁移性验证:c-Myc体系同样适用
这套方法是否仅对AR-NTD有效?为证明其通用性,研究团队将其应用于另一著名无序蛋白c-Myc。结果同样令人满意:流程成功识别了c-Myc的亚稳态构象和结合口袋,且计算得到的抑制剂10058-F4结合自由能与实验测得的微摩尔级亲和力高度一致。
图 7. c-Myc固有无序体系验证工作流通用性。
总结
纵观这项研究,其最大贡献在于构建了一个从构象采样、口袋识别、机制解析到先导发现的计算-实验闭环。它系统性地回答了AR-NTD这个“无序”靶点到底有多少种“面孔”、药物如何识别它、以及我们如何据此发现新药。最终获得的K53不仅为难治性前列腺癌提供了一个有潜力的候选分子,更为重要的是,这套机器学习增强采样工作流为整个IDP药物开发领域点亮了一盏新的导航灯。
参考资料
Zhu, K., Wang, H., Zhang, J. et al. Targeting the intrinsically disordered AR-NTD through a machine learning-based enhanced sampling workflow. Nat Commun (2026).
https://doi.org/10.1038/s41467-026-73863-x






