AI驱动从头设计多样化小分子结合蛋白，韩国团队发现能选择性识别压力激素的蛋白质

2026-04-28阅读 397热度 397

AI驱动

从通用骨架到定制传感器：AI如何从头设计小分子结合蛋白

在合成生物学与生命科学领域，创造能够高亲和力、高特异性结合小分子的蛋白质，是实现精准生物传感与可控分子开关的核心技术瓶颈。传统路径主要依赖对天然蛋白的筛选改造，或基于有限已知骨架进行物理建模，其通用性与规模化设计能力始终受限。

这一局面正迎来变革。韩国科学技术院（KAIST）生物科学系的研究团队取得关键突破。他们运用深度学习驱动的蛋白质结构生成与序列设计技术，选定NTF2样折叠作为“通用骨架”，从头设计出多样化的、可特异性结合小分子的蛋白质。更重要的是，团队成功将这些设计蛋白转化为类似化学诱导二聚化（CID）的功能性生物传感器。其中，一款能选择性识别压力激素皮质醇的传感器，展示了从设计到应用的完整闭环。这项研究不仅推进了蛋白质从头设计的方法论，更提供了解决小分子识别难题的可测量技术方案。

相关研究以《Small-molecule binding and sensing with a designed protein family》为题，发表于《自然·通讯》。

研究亮点：

* 利用人工智能从头设计识别特定化合物的蛋白质，并将其应用于功能性生物传感器。

* 传统方法主要涉及寻找天然蛋白质或修改其功能，而本研究则通过AI设计“定制”了具有所需功能的蛋白质。

* 研究成果在疾病诊断、新药研发和环境监测等领域展现出广泛的应用潜力。

论文地址：https://www.nature.com/articles/s41467-026-70953-8

数据集：构建NTF2通用骨架库

实现定制化设计的首要前提，是建立一个多样化的蛋白质骨架资源库。研究团队以NTF2样折叠为核心，通过多阶段流程构建了这一基础库。

首先，采用家族级“幻觉”方法，生成了首批1,615个NTF2骨架结构。随后，利用ProteinMPNN工具为这些骨架重新设计氨基酸序列，并通过AlphaFold进行结构预测与筛选，确保其能稳定折叠成预设构象，从而获得包含3,230个骨架的第二集合。为进一步扩增多样性，团队使用Rosetta软件参数化生成更多骨架，同样经过序列设计与AlphaFold验证，最终得到包含6,838个骨架的第三集合。完整构建流程如下图所示：

NTF2骨架生成流程示意图

经过层层筛选，团队获得了大量可用于实验验证的蛋白质编码序列。这些序列涵盖了对皮质醇（HCY）、华法林（WRF）、罗库溴铵（ROC）、阿哌沙班（APX）、伊立替康活性代谢物SN-38（IRI）以及17-α-羟基孕酮（OHP）等多种小分子具有潜在结合能力的候选蛋白。

设计具有多样化口袋几何结构的NTF2蛋白家族

为何选择NTF2折叠？该折叠由3条α螺旋和一张弯曲的6股β折叠片构成，其天然形成的内部结合口袋大且构象灵活，为容纳不同形状与化学性质的小分子提供了理想的结构框架，其结构如下图所示：

NTF2折叠的可设计结构框架

自然界中NTF2家族的多样性主要源于其不规则的环区与独特的四级结构，这些因素共同塑造了口袋形状与功能。本研究旨在设计一个口袋几何结构高度多样化、同时尽量减少复杂环区的NTF2蛋白家族，以保持其模块化与易于设计的特性。整体设计流程见下图：

基于NTF2折叠的小分子结合蛋白设计流程示意图

在获得超过一万个具有不同口袋形状的NTF2设计蛋白后，研究进入关键环节：赋予其小分子识别能力。团队使用RIFdock分子对接方法，将六种在化学性质与结构上各异的小分子——包括皮质醇、华法林、罗库溴铵、阿哌沙班、SN-38和17-α-羟基孕酮——分别对接到这些骨架的中心口袋中。

核心挑战在于精准构建蛋白质与小分子间的极性相互作用（如氢键）。这需要在口袋内部引入正确的极性氨基酸残基，同时维持蛋白质整体的结构稳定性。为此，团队采用了两种互补策略：

方法一（RIFdock to HBNets）：将前五种小分子对接到第一批骨架库中，强制要求至少存在一个由预计算氢键网络（HBNet）介导的相互作用，随后使用基于天然序列信息的Rosetta设计进行优化。

方法二（无限制RIFdock）：将后三种小分子对接到第二、三批骨架库中，不预设氢键约束，随后使用专门在蛋白质-小分子复合物数据上训练的LigandMPNN进行序列设计，该工具能在设计时显式考虑配体存在。

筛选环节同样严谨。研究人员计算了蛋白质-配体间的氢键数量、结合自由能变化和接触表面积。对于第二种方法的设计，还结合了单序列AlphaFold的预测结果，筛选出既能准确折叠又能形成预期结合位点的设计（评估指标见下图）。

设计蛋白的评估指标

成果展示：基于NTF2的小分子结合蛋白可应用于生物传感器

理论设计能否经得起实验检验？研究团队通过一系列严谨的实验，验证了该设计策略的有效性，并展示了其向功能性生物传感器转化的潜力。

设计结合蛋白的结构表征

结构解析提供了最直接的证据。团队解析了两个蛋白质-配体复合物的晶体结构：结合皮质醇的hcy129和结合阿哌沙班的apx1049。

其中，hcy129与皮质醇复合物的分辨率高达1.5 Å。结构比对显示，其整体折叠与计算机设计模型高度一致，关键氢键残基和配体构象也完美匹配（下图A，B）。这证实了预构建氢键网络策略的成功，实现了极性相互作用的精准“雕刻”。

设计的皮质醇与阿哌沙班结合蛋白的结构分析

另一方面，apx1049与阿哌沙班复合物的结构（分辨率2.1 Å）与设计模型吻合度更高，关键相互作用，包括氢键和芳香环之间的π-π堆积作用，几乎被完全复现（下图C，D）。这些结果在原子尺度上证实了该设计策略能够高精度地构建蛋白质-配体结合界面。

设计的皮质醇与阿哌沙班结合蛋白的结构分析

设计结合蛋白的特异性评估

结合能力之外，特异性至关重要。研究人员系统测试了六种设计蛋白对六种不同配体的结合情况，并以常见的非特异性结合蛋白——白蛋白作为对照。

结果显示，hcy129.1、iri807.1和apx1049等高亲和力蛋白对各自的靶标分子表现出良好的特异性。而白蛋白对大多数测试配体几乎没有结合。这初步验证了设计策略在实现特异性识别方面的有效性。

当然，挑战依然存在。例如，对于疏水性很强的华法林，设计蛋白wrf1071的结合亲和力与白蛋白相近，这表明在区分此类分子时，非特异性结合仍是一个需要攻克的难题。总体而言，该方法已能实现较高水平的特异性识别，但在区分结构相似分子和优化对强疏水配体的选择性方面，仍有提升空间。

生物传感器构建：皮质醇诱导异源二聚体的设计与表征

设计的终极目标是实现应用。以皮质醇为例，其在生理样本中浓度很低，但当血浆浓度超过38 nM时，可能提示库欣综合征等疾病。为了将高特异性的hcy129用于生物传感，需要进一步提升其结合亲和力。

研究团队通过单点饱和突变筛选出有益突变，并构建组合突变体文库进行酵母展示筛选，成功获得了亲和力显著提升的变体（见下图）。

皮质醇结合蛋白hcy129的亲和力优化过程

最佳变体hcy129.1的解离常数（KD）达到68 nM，比原始设计提高了31倍（下图C）。结构分析表明，亲和力的增强主要源于与皮质醇之间更强的疏水相互作用（下图D）。

用于皮质醇感知的化学诱导异源二聚体设计与表征

接下来，便是构建传感器的关键一步。团队对hcy129.1进行改造，并设计了一个与之匹配的小型蛋白miniH11。二者只有在皮质醇存在时，才会像“分子胶水”一样稳定地结合在一起，形成三元复合物。

最后，将该体系与NanoBiT荧光素酶报告系统融合。实验表明，该传感器仅在皮质醇存在时才会产生强烈的发光信号，其半最大效应浓度（EC50）约为72 nM（下图H），与测得的结合亲和力一致，且在没有皮质醇时背景信号很低。这成功验证了将设计蛋白转化为功能性生物传感器的可行性。

皮质醇依赖的发光响应曲线

至此，这项研究完整演示了从AI设计通用骨架，到定制小分子结合蛋白，再到构建实际可用的生物传感器的全流程。

结语

这项研究为小分子结合蛋白的从头设计开辟了一条新路径。它跳出了依赖发现或改造天然蛋白的传统范式，转向“按需定制”。通过人工智能模型在原子层面精确规划蛋白质-配体相互作用，并经过严格的实验验证，标志着蛋白质理性设计能力的一次重要跃迁。

其意义不仅在于技术本身，更在于显著拓展了应用边界。从疾病早期诊断中对痕量生物标志物的精准检测，到新药研发中针对特定靶点的分子识别，再到环境监测中对污染物的实时感知，具备高度特异性和可编程性的定制化生物传感器，正成为连接前沿生命科学与现实世界需求的坚实桥梁。随着技术体系的不断成熟，这座桥梁将承载更多前所未有的应用驶向未来。

参考文献：https://www.nature.com/articles/s41467-026-70953-8https://phys.org/news/2026-04-ai-proteins-built-specific-compounds.html