Google I/O 2026完整发布清单：所有新品一次看

2026-06-06阅读 0热度 0

其他

距离上一届I/O大会已经过去整整一年。

Google CEO在开幕致辞中明确了核心方向：过去一年，AI行业迈入全新阶段，用户不再仅仅关注技术迭代，更期待AI能在日常产品中兑现实际价值。Google给出的答案，就是今天这场发布会。

衡量AI规模化部署的指标中，token是最直观的标尺。两年前，Google旗下各产品每月处理的token总量为9.7万亿。去年I/O时，这一数字攀升至约480万亿。今年，直接跃升到每月超过3.2千万亿，增长了7倍。

开发者和企业侧的数据同样惊人：每月使用Google模型构建应用的开发者超过850万；模型API目前每分钟处理约190亿token；过去12个月，超过375家Google Cloud客户各自处理了超过1万亿token。Google目前有13款产品月活用户超过10亿，其中5款超过30亿。

搜索依然是覆盖范围最广的AI产品入口。AI Overviews月活已超过25亿。AI Mode作为搜索有史以来最大幅度的升级，上线仅一年月活就突破10亿，用户的使用习惯也在演变——从单次查询逐渐转向持续对话。

Gemini应用去年I/O时月活4亿，今年已超过9亿，翻了一倍多，日请求量增长超过7倍。其中Nano Banana图像生成模型已累计生成超过500亿张图片。

产品更新：让AI融入日常工具

Ask YouTube

YouTube上视频数量庞大，但找到真正相关的内容并不容易。Ask YouTube重新设计了这一体验，不仅展示匹配的视频，还会直接跳转到视频中最相关的时间片段。目前正在开始测试，今年夏天将在美国全面推出。

Docs Live

Google Docs新增语音功能Docs Live。以往用Gemini写文档需要输入明确的指令，现在只需对着麦克风说出想法，Gemini会自动整理成文档。未来还将支持直接通过语音新建和编辑文档。Docs Live今年夏天向订阅用户推出，同期Gmail和Keep也将加入语音功能。

Ask Maps

Maps迎来十年来最大升级，其中包括Ask Maps功能，支持更复杂、更长的问题。

基础设施：为AI大规模运转提供支撑

支撑这些产品大规模运转，需要基础设施层面的大手笔投入。2022年，Google年度资本支出为310亿美元。今年预计达到约1800亿至1900亿美元，是当年的约6倍。

芯片层面，Google在Cloud Next上发布了第八代TPU，首次采用双芯片策略，训练和推理各自拥有专属架构：

TPU 8t用于大规模预训练，原始算力约为上一代的3倍。结合JAX和Pathways，训练不再局限于单个数据中心，可以跨多个站点分布式训练，全球可调用超过100万块TPU，构成全球最大训练集群。模型训练时间从数月缩短到数周。

TPU 8i专为推理设计，在速度上做了全面优化。两款芯片的能效均比上一代提升约2倍。

Gemini Omni：多模态世界模型

AI正从预测文字转向模拟现实。Gemini Omni是Google新发布的多模态世界模型，可接受任意模态的输入，生成任意模态的输出。首发版本以视频输出为主，后续将支持图像和文字。Gemini Omni Flash今天起可在Gemini app、Google Flow和YouTube Shorts上体验，开发者和企业客户也将在未来几周通过API获得访问权限。

1）用自然语言编辑视频。Omni支持通过对话逐步编辑视频，每一条指令都建立在上一条的基础上，角色保持一致，物理规律成立，场景前后连贯。

2）物理理解与世界知识。Omni对重力、动能、流体动力学等物理规律有更准确的直觉理解，生成的场景物理表现更真实。同时，它还能调用Gemini的历史、科学和文化背景知识，把语言、图像和含义连接起来，而不只是模式匹配。

3）任意输入组合。Omni支持把图片、文字、视频、音频同时作为参考输入，生成统一风格的输出。

4）数字A vatar。用户可以用Omni创建自己的数字A vatar，生成看起来和听起来都像自己的视频。在修改视频中的音频和语音方面，Google表示仍在测试。

不过有网友初步测试发现，Omni的视频生成效果与Seedance 2.0相比仍有差距。

Gemini 3.5 Flash：更快、更便宜、更强

Google今天推出Gemini 3.5 Flash，定位为将前沿智能与行动能力相结合的新一代模型。

与3.1 Pro相比，3.5 Flash在多项基准测试上领先，具体包括：Terminal-Bench 2.1（76.2%）、GDPval-AA（1656 Elo）和MCP Atlas（83.6%），在多模态理解上CharXiv Reasoning达到84.2%。其中GDPVal专门衡量现实世界中具有经济价值的任务，进步尤为明显。速度方面，输出token每秒是其他前沿模型的4倍，在Antigra vity中快12倍——达到800 tokens/秒。

3.5 Flash配合Antigra vity可以调度多个子Agent协同工作，处理规模化的复杂任务。前端生成能力依旧非常能打，在多模态基础上，3.5 Flash还能生成更丰富的交互式网页UI和图形，比如直接在AI Studio中为一篇研究论文生成交互式动画。

价格方面，3.5 Flash的成本不到同等前沿模型的一半。Google给出了一个估算：头部企业每天处理约1万亿token，如果将80%的工作负载从其他前沿模型切换到3.5 Flash，每年可节省超过10亿美元。

Gemini 3.5 Flash今天起对所有用户和API开放。Gemini 3.5 Pro目前在Google内部使用，下个月推出。

Google内部数据显示，借助Antigra vity平台和3.5 Flash，AI开发工具的token处理量从3月份的每天5000亿，已翻倍增长至如今每天超过3万亿。

Antigra vity 2.0与Google Spark：Agent时代的核心平台

Antigra vity原本是一个AI编程环境，现在正扩展为完整的自主AI Agent开发和管理平台。

Antigra vity 2.0是一个全新的独立桌面应用，作为Agent交互的中心，用户可在其中协调各类Agent处理不同任务。在速度上，这个版本使用了专门优化的Flash版本，比其他前沿模型快12倍。值得一提的是，Antigra vity 2.0和Codex在界面设计上非常相似。

Antigra vity用户今天起可以开始体验。

Gemini app即将推出个人AI Agent——Gemini Spark，在用户授权下代替用户在数字世界中采取行动。几个关键特点：运行在Google Cloud专用虚拟机上，7×24小时持续运行，无需保持电脑开机；由Gemini 3.5和Antigra vity驱动，可在后台轻松处理长周期任务；从Google自有工具开始整合，未来几周通过MCP接入第三方工具；支持在Gemini app中交互，未来也可以通过邮件和即时通讯使用；在Android上，可通过新UI空间Android Halo查看Agent的实时进度，今年晚些时候上线；今年夏天晚些时候，Spark将直接在Chrome中运行，成为跨网页的Agent浏览器。

本周起Spark向受信测试用户开放，下周Beta版向美国Google AI Ultra订阅用户推出。

Search也在向Agent方向进化

Search正在成为更主动、更智能的信息入口。

信息Agent：用户可以设置个性化AI Agent在后台持续运行，在合适的时机主动找到所需信息并协助采取行动。今年夏天起向Google AI Pro和Ultra订阅用户推出。

生成式UI：结合Gemini 3.5 Flash和Antigra vity，Search将为每个问题动态生成定制化界面，包括个性化布局和交互式视觉内容。今年夏天向所有用户免费开放。

持久化自定义看板：对于需要持续追踪的长期任务，Search可以为用户构建专属看板或追踪工具，类似为特定任务定制的迷你应用。未来几个月起向美国Google AI Pro和Ultra订阅用户开放。

Daily Brief：Gemini app即将推出的开箱即用Agent，整合收件箱、日历和任务，生成个性化的每日摘要，不只是汇总信息，还会做优先级排序、整理和下一步建议，以便于快速浏览的形式呈现。

Google Flow：今天向所有用户推出新Agent，可以在用户参与和控制下规划并处理复杂任务。支持在Flow中直接vibe code各类创意工具，例如视频特效设计、手绘动画或文字叠加工具。

Google Pics：基于最新Nano Banana模型的AI图像创建和编辑工具。它将图片中每个元素视为独立对象而非平面图像，支持对特定细节进行精确创建、替换和调整。目前向受信测试用户开放，今年夏天晚些时候向Workspace中的Google AI Pro和Ultra订阅用户推出。

智能眼镜：去年初次亮相的AI眼镜产品有了更多细节，分为音频眼镜（耳机形态，语音提示）和显示眼镜（可显示信息）两种，均支持免提使用Gemini。音频眼镜今年秋天率先上市。

Gemini for Science：面向科学研究的AI工具集，整合了Gemini的深度推理和研究能力、Deep Think和Deep Research，并新增了可以将Antigra vity等Agent平台连接到超过30个主要生命科学数据库和工具的Science Skills。用户可在Google Labs申请试用Gemini for Science实验功能，Science Skills今天起在Github和Antigra vity中直接可用。

从TPU 8i到Gemini 3.5，再到Antigra vity和Spark，Google在这届I/O上所呈现的，是一套从芯片到应用全面朝Agent方向演进的完整体系。