2024 AI药物发现排行榜:打破15年20亿美元成本魔咒
人工智能与药物发现的深度融合正在重塑新药研发的底层逻辑。传统流程耗时且昂贵,一款新药从立项到上市平均需要15年时间,投入10亿至20亿美元。AI与先进计算工具的介入,已经将新药筛选周期大幅压缩,显著降低时间与资金成本。
传统药物发现的瓶颈
传统药物发现的核心逻辑是什么?本质上,是先识别出一个生物靶标(例如某个蛋白质),再寻找能够与之结合并调节其功能的小分子。难点在于生物系统极度复杂,而潜在化学结构的理论数量高达10的60次方。面对如此浩瀚的化学空间,传统计算机辅助药物发现(CADD)方法只能依赖简化模型,结果就是临床试验阶段的高失败率几乎成为常态。
基于AI的虚拟筛选方法
Innoplexus,一家NVIDIA Inception初创企业,正利用其专有深度学习方法与NVIDIA NIM微服务优化药物发现流程。底层算力由NVIDIA H100 GPU集群提供,具体硬件配置如下:
- 加速器: NVIDIA H100 Tensor Core GPU
- 内存: 80-GB HBM3
- 互连: NVIDIA NVLink 4.0
- 集群配置: 高带宽互连的可扩展多节点集群
该方案基于NVIDIA NIM Agent Blueprint,专为生成式虚拟筛选设计——可快速生成全新分子结构,加速模拟与对接过程。Innoplexus的专业能力与NVIDIA的AI技术结合,正在推动药物发现更快、更高效、更精准。具体而言,他们开发了一条AI驱动的完整管线,用于寻找针对TDP-43蛋白聚集相关神经退行性疾病的新疗法。
Innoplexus 的深度学习方法
Innoplexus采用专门设计的人工神经网络(ANN)进行蛋白质靶标预测,这些网络在包含蛋白质序列、结构信息及分子相互作用的大规模数据集上完成训练。
图1. 基于NVIDIA NIM微服务的结构与配体药物发现工作流程
Innoplexus利用以下几项关键的NVIDIA NIM微服务构建该流程:
- AlphaFold2: 蛋白质结构预测
- MolMIM: 先导化合物优化与生成
- DiffDock: 分子对接模拟
这些AI工具显著简化了药物发现流程,并成功识别出以TDP-43为靶标、有望延缓疾病进展的候选分子。
AlphaFold2 用于蛋白质结构预测
AlphaFold2能够根据氨基酸序列直接预测靶蛋白的三维结构——过去这曾是结构生物学中最棘手的难题之一。
图2. AlphaFold2从氨基酸序列预测蛋白质三维结构
MolMIM 用于先导化合物优化
MolMIM的核心能力在于“生成”。它专门生成针对药物相似性(QED)、溶解度(惩罚性logP)和分子相似性等特性进行过优化的新分子结构。生成的分子会被反复用于迭代优化。
DiffDock 用于分子对接
DiffDock负责预测分子与蛋白质的结合模式,定位最佳结合位点。研究人员可在过程中定义对接约束,实现更全面的药物-靶标相互作用分析。
图3. DiffDock预测分子与蛋白质相互作用的三维结构
后处理 ADMET 流程
仅仅找到能结合的分子还不够,还需评估其成药性。Innoplexus使用专有ADMET(吸收、分布、代谢、排泄、毒性)流程,对DiffDock筛选出的前1000个小分子进行系统的药代动力学与药效学评估。该流程主要包括:
- ADMET 预测: 预测溶解度、渗透性、代谢和毒性等关键ADMET属性。
- 筛选与排序: 基于上述预测结果,对分子进行筛选并确定优先级。
Innoplexus ADMET 模型
该ADMET模型是一个定制化神经网络,在包含大量分子结构及其ADMET属性的大规模数据集上完成训练。采用两项关键技术:
- 多任务学习: 同时对多个ADMET相关任务进行联合训练。
- 迁移学习: 通过在大型数据集上微调,提升模型在不同场景下的泛化能力。
工作流程优化
为确保实际部署中的性能,整个流程进行了大量优化,主要手段包括:
- 数据并行: 支持分布式训练与推理。
- 模型并行: 将超大模型拆分到多个GPU上协同计算。
- 流水线并行: 使流水线中不同阶段的任务重叠执行,最大化算力利用率。
图4. GPU加速计算:实现大规模密集型运算的高效执行
正是GPU及其带来的加速计算方法,才使得方案中这些计算密集型任务能在可接受的时间内迅速完成。
基于NVIDIA H100集群的Innoplexus AI驱动管线,在化合物识别速度上实现了质的飞跃。除了将分子对接速度提升高达10倍外,还加速了生成分子的虚拟筛选,使研究人员能够执行以下任务:
- 在5到8小时内完成580万个小分子的虚拟筛选。
- 通过对百万个化合物进行ADMET特性分析,在几小时内精准锁定前1%的高治疗价值化合物。
- 以90%的预测准确率优化先导化合物结构。
一句话总结:依托AI与高性能计算,研究团队能快速探索浩瀚化学空间,精准定位具有潜力的候选药物,从而大幅加速整个药物研发进程。
立即行动
AI与高性能计算的组合正在彻底革新药物发现的游戏规则——带来的不仅是速度,更是前所未有的准确率。
Innoplexus虚拟筛选流程融合了尖端的神经网络算法、生成模型及先进的分子对接技术,为新药发现提供了强有力的工具。最终目标很明确:改善患者预后,同时大幅度降低新疗法上市的成本与时间。
