Nature双发！谷歌Gemini科学突破深度解析：超越AlphaFold的AI革命

2026-05-25阅读 0热度 0

Gemini

5月19日，正值Google I/O开发者大会期间，《自然》杂志同日上线了两篇重磅论文。这并非巧合，而是Google精心策划的一次“信用背书”。

一篇论文介绍了ERA（经验性研究助手），这是一个由大语言模型驱动、结合树搜索的系统，其核心目标是自动编写出专家级别的科学计算实验软件。另一篇则聚焦于Co-Scientist（AI合作科学家），一套通过多智能体“点子锦标赛”机制，持续生成、辩论并优化科研假设的架构。

两篇论文的发布方都是Google，发布时间点更是与官方宣布“Gemini for Science”工具集上线完全同步。这一系列动作释放的信号再明确不过：Google正试图用顶级学术期刊的同行评审，为其全新的AI科研工具链奠定可信基石。这无疑是自AlphaFold之后，Google在“AI for Science”领域投下的又一枚深水冲击波。

一日两篇Nature：Gemini接管两段科研流水线

支撑这两篇论文的，是一份超过100家合作机构的名单。Google宣称，斯坦福大学、帝国理工学院、克里克研究所、ICML、STOC、NeurIPS以及美国国家实验室等机构均已参与新系统的验证。此外，一个由博士生、产业研究员乃至诺奖得主组成的“可信测试者”社区也已建立，并与多个顶级学术会议试点同行评审辅助工具。

显然，Google的目的不仅是发布工具，更是构建生态。两篇《自然》论文，正是为这套生态工具链提供的“学术信用证”。

先看ERA。它的任务直指科研中耗时费力的环节——编写高质量的计算实验代码。在《自然》论文展示的测试中，ERA的表现堪称惊艳：在生物信息学领域，它独立发现了40种新的单细胞数据分析方法，在公开基准测试中超越了所有人类提交的方案；在流行病学领域，它针对传染病住院预测任务生成的14个模型，全部超越了美国疾控中心（CDC）的集成模型。其能力还覆盖了地理空间分析、神经活动预测等多个可复现的实验场景。论文指出，ERA的强大之处在于能够吸收外部研究思路，并组合出专家级的解决方案。

再看Co-Scientist。它基于Gemini构建，核心是一个多智能体协作的“点子锦标赛”循环。智能体们不断生成假设、相互批判辩论、并持续细化，通过增加测试时的计算资源来不断提升假设质量。论文重点验证了其在药物再利用、新靶点发现和抗微生物耐药性机制解释三个生物医学场景的应用。其中，针对急性髓系白血病（AML）提出的药物再利用候选方案及协同疗法，已在斯坦福医学院研究者的体外实验中得到了初步验证。

这两套系统瞄准的，正是从“产生想法”到“验证想法”的科研核心闭环中最消耗人类智力的部分。

三个Labs原型：把科学方法拆成三段

除了论文，Google此次还同步开放了三个Labs实验原型，分别对应科学方法的关键环节。

第一个是“假设生成”（Hypothesis Generation），底层即Co-Scientist。它呈现的每一条假设都附带可追溯的引用来源，将生成过程变得透明、可审计。

第二个是“计算发现”（Computational Discovery），由AlphaEvolve和ERA驱动。这套引擎能够并行生成并自动评估数千个代码变体，将原本需要人工数月摸索的复杂建模路径，压缩到机器搜索的范畴。太阳能预测和流行病学建模是其典型应用场景。

第三个是“文献洞察”（Literature Insights），底层是NotebookLM，目前处于早期预览阶段。它能将海量文献结构化，提取成可搜索的属性表格，并直接生成报告、幻灯片等信息聚合产物。

此外，Google还发布了一套“Science Skills”，集成了UniProt、AlphaFold Database等30多个生命科学核心数据库和工具。这套技能运行在类似Antigra vity的智能体平台上，能将过去需要在十几个数据库间手动跳转的分析流程，整合成一个连贯的自然语言工作流。在早期测试中，针对AK2基因相关罕见病的复杂分析，时间从数小时缩短至分钟级。

百年化工巨头多次失败的问题，这样解决了

除了学术背书，Google还展示了其工具在解决极端复杂产业问题上的潜力，以巴斯夫（BASF）的农业解决方案为例。

巴斯夫面临的供应链复杂度堪称恐怖：180个生产基地、5000多条价值链，单一产品的物料清单可能深达30层，横跨全球。人类规划员每日做出数千个本地决策，却无人能实时看清这些决策如何影响全局网络。巴斯夫高级供应链副总裁Goetz Krabbe坦言，此前多次尝试用传统确定性模型构建数字孪生均告失败。

Google的解决方案并非取代人类，而是提供决策支持。他们向AlphaEvolve输入了一段基础规划逻辑作为“种子程序”，并喂入了三年的历史运营数据。随后，系统开始自动生成代码变体，从中发现了三条关键规则：生产整合规则、动态安全库存规则和网络级协调规则。这些原本需要领域专家手工编码的洞察，被机器自动提炼出来。最终，模型的预测准确率相比初始种子模型提升了超过80%。

目前，巴斯夫计划将这套数字孪生扩展至其全球生产网络。而根据Google官方信息，第一三共、拜耳作物科学、美国能源部国家实验室（Genesis Mission项目）也已接入Co-Scientist；瑞典金融科技公司Klarna则利用AlphaEvolve，将一个大语言模型的训练速度提升了一倍，同时改善了模型质量。

争夺「可信验证」的入场券

《自然》论文只是Google构建“AI for Science”可信生态的关键一步。其深层目的是在科研工作者心中植入一个“经过同行评审”的心理锚点，为工具链增加学术公信力。

目前，Google公开的合作网络已超百家，可信测试者从博士生覆盖到诺奖得主，都在真实场景中为系统“挑刺”。更值得关注的是其与ICML、STOC、NeurIPS等顶会的合作，旨在开发如PAT（论文助手工具）和ScholarPeer这样的智能体同行评审工具。

这意味着，科学可信度基础设施本身正在成为新的竞争战场。谁的AI建议能被严肃引用，谁的假设生成过程经得起审计，谁的系统能无缝接入顶级学术工作流，谁就能在未来科研生态中占据核心位置。

纵观全局，OpenAI在4月推出了专注于生物医学推理的GPT-Rosalind；Anthropic则将Claude for Life Sciences接入AWS，对接大数据平台。如今，Google押上了《自然》论文、百所机构以及ERA和Co-Scientist两套系统。

三大巨头不约而同地将“科学”作为独立产品线拆分出来。接下来的竞争，将聚焦于哪一个平台的工具链能真正赢得全球科学家的信赖，并成为他们日常研究中不可或缺的首选伙伴。

Nature双发！谷歌Gemini科学突破深度解析：超越AlphaFold的AI革命

一日两篇Nature：Gemini接管两段科研流水线

三个Labs原型：把科学方法拆成三段

百年化工巨头多次失败的问题，这样解决了

争夺「可信验证」的入场券

相关阅读

最新教程

最新资讯