英伟达携手谷歌 DeepMind 与学术界发布全球最大蛋白质复合物数据集
英伟达携手谷歌DeepMind与学术界发布全球最大蛋白质复合物数据集
今年的GTC开发者大会,英伟达放出了一个与生命科学领域相关的大招。他们联合了谷歌DeepMind、欧洲分子生物学实验室下属的欧洲生物信息学研究所,以及韩国首尔国立大学的Steinegger实验室,共同宣布了一项重磅进展:对AlphaFold蛋白质结构数据库进行了一次大幅度的扩展。
这次合作的成果相当直观——四方联合发布了迄今为止全球规模最大的蛋白质复合物数据集。具体来说,他们在现有的可搜索数据库里,一口气新增了高达170万个高置信度的预测蛋白质复合物。这还只是“精选”部分,如果研究人员需要更庞大的原始数据做深度挖掘,他们还同步提供了约3000万个额外的预测结构供批量下载。这个量级,无疑为全球的生物学和药物研发团队送上了一座数据金矿。
那么,如此海量的预测结构是如何高效产生的?背后的技术组合是关键。谷歌DeepMind的AlphaFold-Multimer模型依然是核心的“预测引擎”,负责生成蛋白质相互作用的复杂结构。而真正的效率飞跃,则来自英伟达的计算加速。他们将自家的计算库深度集成到了OpenFold推理流程之中,就是这个动作,让整个蛋白质结构预测的推理速度提升了百倍以上。换句话说,过去需要耗费大量计算资源和时间的工作,现在能以近乎实时的方式快速完成。
这次发布,可以说是从高效算法到庞大产出的完整链条展示。对于关注AI在科学计算领域应用进展的人来说,这无疑是一个值得标记的节点。
英伟达 GTC 2026 大会专题
