AI生成式药物设计:Latent Labs创始人解读生物学可编程时代

2026-06-10阅读 0热度 0
创始人

在2026年的CVPR大会上,Simon Kohl发表了一场关于药物设计的演讲,信息密度极高。作为前DeepMind蛋白质设计团队核心成员与AlphaFold项目研究员,现为Latent Labs创始人的他,抛出一个极具冲击力的论断:生物学正迈入“可编程”时代。

这绝非空谈。整场演讲直击制药行业公认的痛点:一款新药从研发到上市平均消耗超过20亿美元,耗时逾10年——更残酷的是,近九成候选药物倒在终点线前。

症结究竟在哪?Simon Kohl的判断极为直接:一切始于一个错误的分子。 换言之,最初的起点已偏离正确方向。围绕这一核心,他勾勒出一条从“结构预测”到“条件生成”,再到“自主智能体”的技术跃迁路径。这条演进脉络,清晰揭示出计算药物设计正以指数级速度重塑产业格局。

药物发现困局:10年、20亿美元、90%失败率

在深入技术细节之前,先建立基本共识:药物究竟如何发挥作用?

简言之,即“结合并阻断”。无论是治疗糖尿病的司美格鲁肽、用于凝血障碍的纳米抗体Caplacizumab,还是抗癌药物曲妥珠单抗,核心机制都是高度特异性地结合靶点,进而中断其功能。

当前业界获取“起点分子”的路径极为漫长,通常超过10年,主要依赖三种方式:

  • 体内免疫法:听似原始,但大型药企确实运营着羊驼甚至鲨鱼农场,从免疫反应中筛选抗体。问题在于,羊驼并非人类,这些分子充其量只是粗糙胚体,既不精准也难以调控。
  • 超大规模库筛选:无异于“大海捞针”。将成百上千亿个化合物投向靶点,观察哪些能粘附。成本高、周期长,且捞出的分子亲和力往往较弱。
  • B细胞挖掘:直接从疾病幸存者血液中提取天然抗体。这最接近“完美答案”,但高度依赖供体,无法规模化,且伴随复杂伦理问题。

获取起点后,还需经历动物模型测试(约3年)及多期临床试验。最终能闯关成功并获得FDA批准的,寥寥无几。这就是当今药物发现漏斗:超慢、超贵、失败率极高。

根源正如前述:我们从一个错误的分子出发。Latent Labs的目标正是改变这一点——从源头用计算设计出更有可能在临床试验中成功的药物。

想象这样一个未来:面对任何疾病靶点,只需输入生成式模型,即可即时获得一个成熟、可用的药物分子。它具备高特异性结合力、可制造性强、无脱靶效应。这就是终极愿景。

计算药物设计五年加速:从AlphaFold 2到智能体

回顾过去五年,计算药物设计领域的发展速度堪比大语言模型的跃迁。

  • 2020年,AlphaFold 2横空出世,解决了困扰学界半个世纪的蛋白质结构预测难题,成为整个领域的“种子突破”。
  • 随后几年,RFdiffusion、ProteinMPNN等生成模型诞生,目标是设计自然界不存在但实验室可工作的蛋白质。
  • 2024年,AlphaFold 3发布,新增蛋白质相互作用建模能力——这正是药物设计的核心。其后,DeepMind的AlphaProteo与Latent Labs的Latent-X1等模型相继登场。
  • 过去12个月内,被誉为“圣杯”的抗体设计领域取得一系列突破。Latent Labs的Latent-X2、Chai Discovery的Chai-2等模型接连问世。近期,Latent Labs更发布了全球首个由实验室验证的抗体设计智能体——Latent-Y。

短短五六年,我们从“一切依赖湿实验”的阶段,跃迁至“智能体自主设计抗体”的阶段。这种加速,是指数级的。

蛋白质:比图像更脆弱的分子机器

深入模型之前,有必要了解蛋白质。这些生命的分子机器,由氨基酸链折叠成复杂的三维结构。从计算视角看,一条蛋白质是由20个字母组成的字符串,每个字母对应特定化学基团。

关键点在于:结构决定功能。 蛋白质具有一个极其特殊的性质——容错率极低。哪怕仅一个氨基酸突变,整个蛋白质都可能彻底丧失功能,甚至“解体”。类比图像:改变一个像素,人眼尚能识别;但对蛋白质而言,一个氨基酸偏差可能引发灾难。这也是许多癌症的诱因。

这引出蛋白质折叠问题。1972年,Anfinsen在诺贝尔奖演说中提出,序列完全决定结构。自此,人类开启长达半个世纪的求解之旅。AlphaFold 2正是这一难题的终极解答。在CASP14盲测中,其预测精度已能与实验方法媲美,直接推动2024年诺贝尔化学奖的授予。

AlphaFold 2架构精髓:从进化信号到三维结构

AlphaFold 2的成功并非偶然,其架构蕴含着深刻洞察。核心输入有三个:最关键的是多序列比对(MSA),它利用进化中共同突变的残基在三维空间往往相邻的原理,从进化信号推断空间关系;其次是配对表征,相当于提供一块“草稿板”,让模型显式建模每对残基之间的交互;而结构模板的作用相对次要。

基于这些输入,模型构建了两条信息轨道:MSA表征栈和配对表征栈。通过名为EvoFormer的创新架构,两者得以交互。该架构基于注意力机制,但巧妙融入大量领域知识,例如嵌入尊重三角不等式的几何先验。最终,通过另一个网络将这些表征映射到三维坐标空间。

AlphaFold 2的成功还得益于其他创新,例如迭代循环机制(Recycling),将模型输出重新反馈回起点,以及对下游应用至关重要的置信度预测。整个系统集成了约10到15个核心创意,每一个都足以单独发表一篇优秀论文。

这一突破带来的深远影响在于,它构建了一个“数据集→评估→预测器(Oracle)→生成器”的产业飞轮。正如ImageNet催生了AlexNet,AlphaFold 2成为结构生物学领域的“预测器”,使我们不仅能在算法上快速迭代,还能从海量设计中高效筛选出最值得进入湿实验验证的候选分子。

从预测到创造:Latent-X1与条件生成范式

AlphaFold 2是“看”结构,而我们要“造”分子。药物设计本质上是一个条件生成任务:给定靶点的序列与结构,生成一个与之高特异性结合的分子,且结合必须精确到原子层面。

在Latent Labs,我们将靶点表示为原子坐标点云,并以此为条件,利用去噪扩散模型从高斯噪声中逐步“雕刻”出结合物。这就是Latent-X1的工作原理。可以清晰观察模型如何从混沌中逐步形成精确结构。

我们完整的“设计-验证”流程是:给定靶点→指定结合位点→用生成模型产生结合物→再用AlphaFold等结构预测模型进行交叉验证。

关键验证环节在湿实验室。位于旧金山的实验室里,我们在人类细胞上表达设计的分子,并用荧光标记。一旦靶点信号被成功“捕获”,即意味着设计成功。鉴于单个氨基酸偏差就可能让努力付诸东流,湿实验验证是把好最后一关的铁律。

作为一款基础模型,Latent-X1表现相当惊艳。在纳米抗体设计中,它成功命中所有靶标,亲和力达到纳摩尔甚至皮摩尔级别;在迷你结合蛋白设计上同样如此。其效果显著超越同期其他模型。

Latent-X2:零样本设计药物级抗体

2024年12月,我们发布了Latent-X2。核心突破在于实现“零样本”的药物级抗体设计。这意味着,它可以从头针对从未见过的靶点直接生成抗体,且效果极佳。

更令人兴奋的是其在“药物相似性”方面的表现。一个好的药物分子,需要热稳定性高、单体性好、产量高、多反应性低、疏水性低。传统上,优化这些属性如同“打地鼠”,按下葫芦浮起瓢。

然而,Latent-X2设计的分子中,有47%的候选物无需任何迭代优化,就能同时跨过所有关键指标阈值,整体水准已非常接近市售治疗性抗体。

另一个震撼案例是环肽设计。在PHD2和KRAS两个靶点上,我们仅用Latent-X2生成的10个设计,就与万亿级传统随机筛选库进行了对比。结果如何?在PHD2上,10个设计的结合力比万亿级筛选的最优结果强两个数量级。而在历史上被称为“不可成药”的KRAS靶标上,这10个设计也达到旗鼓相当的水平。效率方面,AI计算仅耗时1天,传统筛选需要3到6个月。

我们还在与外部合作伙伴进行离子通道抑制项目。Latent-X2设计的环肽已成功阻断人类NA V1.7钠离子通道,这成为“用AI精度替代蛮力筛选”的经典范例。

Latent-Y:全球首个实验室验证的抗体设计智能体

在Latent X系列模型基础上,我们更进一步,推出智能体系统Latent-Y。这是全球首个由实验室验证的抗体设计智能体,堪称药物设计团队的“力量倍增器”。

具体工作流是怎样的?只需在提示框中输入一句简单指令,例如:“生成阻断人IL-6的纳米抗体。”接下来,智能体自主接管后续所有流程:检索靶点、分析结构、调用Latent-X2模型、进行交叉验证、设计实验方案。整个过程可并行执行多个步骤,极大放大研发效能。

实验室验证结果令人信服。仅凭类似“用纳米抗体阻断PRLR受体相互作用”的提示,无需任何迭代,就在实验室中获得非常紧密的结合。

更具挑战性的压力测试是:直接将一篇发表在《Science》或《Nature》上的论文PDF喂给智能体,让其自主识别该论文中描述的生物学功能并设计对应纳米抗体。在针对20篇论文的测试中,面对人Transferrin受体1(一种血脑屏障靶标)的设计任务,智能体产出的40个候选物中有11个在实验室中成功实现了结合。

开放问题与未来展望

当然,这个领域目前仍面临诸多挑战有待攻克。

  • 首当其冲是蛋白质动力学。目前模型本质上是静态的,但蛋白质在自然状态下是动态的。传统分子动力学力场泛化性差,而机器学习力场正展现出巨大潜力。
  • 其次是无法可靠预测人体药物响应。这需要收集更全面、更高质量的数据。
  • 第三是系统性毒性预测。人体交互网络极其庞大,目前远未被充分理解,纯理论推导不可能,必须先收集足够的机器学习就绪数据。

展望未来5到10年,一些趋势将自然发生:

最终,当所有这些技术进步汇聚在一起时,人类将拥有攻克所有疾病的武器。这听来或许乐观,但可以确定:这只是时间问题,而非“能否实现”的问题。

我们正站在历史的拐点上:生物学终将成为一门可编程的工程学科。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策