Nature双发!谷歌Gemini科学突破深度解析:超越AlphaFold的AI革命

2026-05-25阅读 0热度 0
Gemini

5月19日,正值Google I/O开发者大会期间,《自然》杂志同日上线了两篇重磅论文。这并非巧合,而是Google精心策划的一次“信用背书”。

一篇论文介绍了ERA(经验性研究助手),这是一个由大语言模型驱动、结合树搜索的系统,其核心目标是自动编写出专家级别的科学计算实验软件。另一篇则聚焦于Co-Scientist(AI合作科学家),一套通过多智能体“点子锦标赛”机制,持续生成、辩论并优化科研假设的架构。

两篇论文的发布方都是Google,发布时间点更是与官方宣布“Gemini for Science”工具集上线完全同步。这一系列动作释放的信号再明确不过:Google正试图用顶级学术期刊的同行评审,为其全新的AI科研工具链奠定可信基石。这无疑是自AlphaFold之后,Google在“AI for Science”领域投下的又一枚深水冲击波。

一日两篇Nature:Gemini接管两段科研流水线

支撑这两篇论文的,是一份超过100家合作机构的名单。Google宣称,斯坦福大学、帝国理工学院、克里克研究所、ICML、STOC、NeurIPS以及美国国家实验室等机构均已参与新系统的验证。此外,一个由博士生、产业研究员乃至诺奖得主组成的“可信测试者”社区也已建立,并与多个顶级学术会议试点同行评审辅助工具。

显然,Google的目的不仅是发布工具,更是构建生态。两篇《自然》论文,正是为这套生态工具链提供的“学术信用证”。

先看ERA。它的任务直指科研中耗时费力的环节——编写高质量的计算实验代码。在《自然》论文展示的测试中,ERA的表现堪称惊艳:在生物信息学领域,它独立发现了40种新的单细胞数据分析方法,在公开基准测试中超越了所有人类提交的方案;在流行病学领域,它针对传染病住院预测任务生成的14个模型,全部超越了美国疾控中心(CDC)的集成模型。其能力还覆盖了地理空间分析、神经活动预测等多个可复现的实验场景。论文指出,ERA的强大之处在于能够吸收外部研究思路,并组合出专家级的解决方案。

再看Co-Scientist。它基于Gemini构建,核心是一个多智能体协作的“点子锦标赛”循环。智能体们不断生成假设、相互批判辩论、并持续细化,通过增加测试时的计算资源来不断提升假设质量。论文重点验证了其在药物再利用、新靶点发现和抗微生物耐药性机制解释三个生物医学场景的应用。其中,针对急性髓系白血病(AML)提出的药物再利用候选方案及协同疗法,已在斯坦福医学院研究者的体外实验中得到了初步验证。

这两套系统瞄准的,正是从“产生想法”到“验证想法”的科研核心闭环中最消耗人类智力的部分。

三个Labs原型:把科学方法拆成三段

除了论文,Google此次还同步开放了三个Labs实验原型,分别对应科学方法的关键环节。

第一个是“假设生成”(Hypothesis Generation),底层即Co-Scientist。它呈现的每一条假设都附带可追溯的引用来源,将生成过程变得透明、可审计。

第二个是“计算发现”(Computational Discovery),由AlphaEvolve和ERA驱动。这套引擎能够并行生成并自动评估数千个代码变体,将原本需要人工数月摸索的复杂建模路径,压缩到机器搜索的范畴。太阳能预测和流行病学建模是其典型应用场景。

第三个是“文献洞察”(Literature Insights),底层是NotebookLM,目前处于早期预览阶段。它能将海量文献结构化,提取成可搜索的属性表格,并直接生成报告、幻灯片等信息聚合产物。

此外,Google还发布了一套“Science Skills”,集成了UniProt、AlphaFold Database等30多个生命科学核心数据库和工具。这套技能运行在类似Antigra vity的智能体平台上,能将过去需要在十几个数据库间手动跳转的分析流程,整合成一个连贯的自然语言工作流。在早期测试中,针对AK2基因相关罕见病的复杂分析,时间从数小时缩短至分钟级。

百年化工巨头多次失败的问题,这样解决了

除了学术背书,Google还展示了其工具在解决极端复杂产业问题上的潜力,以巴斯夫(BASF)的农业解决方案为例。

巴斯夫面临的供应链复杂度堪称恐怖:180个生产基地、5000多条价值链,单一产品的物料清单可能深达30层,横跨全球。人类规划员每日做出数千个本地决策,却无人能实时看清这些决策如何影响全局网络。巴斯夫高级供应链副总裁Goetz Krabbe坦言,此前多次尝试用传统确定性模型构建数字孪生均告失败。

Google的解决方案并非取代人类,而是提供决策支持。他们向AlphaEvolve输入了一段基础规划逻辑作为“种子程序”,并喂入了三年的历史运营数据。随后,系统开始自动生成代码变体,从中发现了三条关键规则:生产整合规则、动态安全库存规则和网络级协调规则。这些原本需要领域专家手工编码的洞察,被机器自动提炼出来。最终,模型的预测准确率相比初始种子模型提升了超过80%。

目前,巴斯夫计划将这套数字孪生扩展至其全球生产网络。而根据Google官方信息,第一三共、拜耳作物科学、美国能源部国家实验室(Genesis Mission项目)也已接入Co-Scientist;瑞典金融科技公司Klarna则利用AlphaEvolve,将一个大语言模型的训练速度提升了一倍,同时改善了模型质量。

争夺「可信验证」的入场券

《自然》论文只是Google构建“AI for Science”可信生态的关键一步。其深层目的是在科研工作者心中植入一个“经过同行评审”的心理锚点,为工具链增加学术公信力。

目前,Google公开的合作网络已超百家,可信测试者从博士生覆盖到诺奖得主,都在真实场景中为系统“挑刺”。更值得关注的是其与ICML、STOC、NeurIPS等顶会的合作,旨在开发如PAT(论文助手工具)和ScholarPeer这样的智能体同行评审工具。

这意味着,科学可信度基础设施本身正在成为新的竞争战场。谁的AI建议能被严肃引用,谁的假设生成过程经得起审计,谁的系统能无缝接入顶级学术工作流,谁就能在未来科研生态中占据核心位置。

纵观全局,OpenAI在4月推出了专注于生物医学推理的GPT-Rosalind;Anthropic则将Claude for Life Sciences接入AWS,对接大数据平台。如今,Google押上了《自然》论文、百所机构以及ERA和Co-Scientist两套系统。

三大巨头不约而同地将“科学”作为独立产品线拆分出来。接下来的竞争,将聚焦于哪一个平台的工具链能真正赢得全球科学家的信赖,并成为他们日常研究中不可或缺的首选伙伴。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策