扎克伯格Biohub里程碑式发布蛋白质世界模型:AI深度解析蛋白质三维结构
扎克伯格夫妇旗下Biohub发布蛋白质“世界模型”
几个核心判断:蛋白质生物学正迎来AI驱动的“转折点”。非营利研究机构Biohub发布了一套被其称为蛋白质生物学“世界模型”的AI系统,核心承诺极具冲击力——将新疗法设计周期从“年”压缩到“天”,甚至“小时”。
这家由Meta首席执行官马克·扎克伯格及其妻子普莉希拉·陈创立的慈善组织表示,该模型能够以更快的速度绘制蛋白质模式图谱、预测其三维结构,并设计出能够与其结合并影响其功能的新分子。换言之,它不只是一个预测工具,更是一个“设计引擎”。
那么这个“世界模型”的具体架构是什么?它本质上是一个开放的发现引擎,面向全球所有研究人员免费开放,覆盖蛋白质结构预测、设计及生物学发现三大任务。底层由三个核心组件支撑:包含68亿个蛋白质和11亿个结构的ESM图谱、用于虚拟表示蛋白质的ESMC语言模型,以及能够预测蛋白质三维结构及其与结合物相互作用的ESMFold2设计引擎。
Biohub在声明中直言:“蛋白质是医学中最重要的靶点之一,但设计出功能性强、稳定且能在体内按预期工作的蛋白质,是一项巨大的科学和技术挑战。”这句话点出了行业长期存在的痛点。
ESMfold2直接对标谷歌DeepMind的AlphaFold和Recursion的Boltz系列等AI驱动系统。但与竞争对手相比,其核心差异在于“通用性”。陈-扎克伯格倡议组织主席洛里·戈勒解释道:“关键是我们构建了一个通用模型,能够在蛋白质生物学领域实现极其广泛的应用。”她进一步补充:“我们并未训练一个专门用于设计蛋白质结合物的特定模型。我们训练了一个理解蛋白质的模型,然后从中自然涌现出设计蛋白质结合物的能力,以及许多其他功能。通过学习蛋白质折叠、结合和功能的底层规则,该模型能对从未见过的蛋白质进行推理,并生成有效的新蛋白质。”这段话点明了关键:模型的“涌现能力”才是真正的突破。
从实际成果来看,Biohub研究人员已使用该模型针对癌症和免疫学领域的五个重要靶点——EGFR、PDGFRβ、PD-L1、CTLA-4和CD45——设计了蛋白质结合物。实验数据显示,“迷你结合物”蛋白的命中率达到36-88%,抗体模式的命中率则为15-29%。这一数据放在传统技术背景下,相当亮眼。
Biohub联合创始人普莉希拉·陈表示:“Biohub建立在开放科学加速发现的信念之上。免费提供这些工具意味着世界各地的研究人员可以更快地推进个性化治疗,针对驱动患者疾病的特定生物学机制进行治疗,从而为个体患者提供有效的治疗方案。”免费开放这一策略,堪称近年生物信息领域最重要的一次开源行动。
Q&A
Q1:Biohub发布的蛋白质世界模型是什么?
这是一个由AI驱动的蛋白质生物学“世界模型”,能够以极短的时间绘制蛋白质模式图谱、预测其结构,并设计出能与之结合并影响其功能的新分子。该模型基于包含68亿个蛋白质和11亿个结构的ESM图谱,向全球所有研究人员免费开放。
Q2:ESMfold2与AlphaFold相比有什么优势?
ESMfold2是AlphaFold等AI系统的直接替代方案,其核心优势在于速度——将新蛋白质结合物的发现时间从传统技术所需的数月甚至数年缩短至数天,某些情况下仅需几小时。更重要的是,它是一个通用模型,通过深度学习蛋白质折叠、结合和功能的底层规则,能够对从未见过的蛋白质进行推理并生成全新的蛋白质。
Q3:Biohub的蛋白质世界模型已经取得了哪些研究成果?
Biohub研究人员已使用该模型针对癌症和免疫学领域的五个重要靶点(EGFR、PDGFRβ、PD-L1、CTLA-4和CD45)设计了蛋白质结合物。实验结果显示,“迷你结合物”蛋白的命中率达到36-88%,抗体模式的命中率达到15-29%。
