2026谷歌I/O大会前瞻:Gemini智能体时代权威解析

2026-05-21阅读 0热度 0
Gemini

去年,行业还在比拼AI功能的演示效果;今年,风向已彻底转向实际应用。5月20日的谷歌I/O大会明确宣告:AI正从对话框里的概念验证,升级为能主动执行任务的智能系统。谷歌的战略核心,是构建一个贯通信息、创作与交易的全新数字生态,其驱动力已从功能叠加,转向以“智能体”为核心的主动服务体系。

这场变革的根基,是硬件算力与基础模型的协同进化。多模态交互正趋于自然流畅,而基于智能体的全新工作流,已开始重塑搜索、电商、创意与科学研究的运作模式。

算力与模型:构建底层新基建

上层应用的爆发,始终依赖于底层基础设施的突破。此次,谷歌在算力架构上做出了关键调整:首次采用训练与推理分离的双芯片策略。

专用于模型训练的TPU 8t,其原始算力约为前代产品的3倍,专为大规模预训练设计。结合全新的基础设施,训练任务可跨全球数据中心调度超过100万颗TPU,实现了前所未有的计算规模。

而负责推理任务的TPU 8i,则专注于优化延迟与生成速度。现场演示中,即将发布的Flash模型生成小游戏代码的速度接近每秒1500个Token,响应极为迅捷。

图片

模型层面的主角是全新的Gemini 3.5 Flash。尽管名称带有“Flash”,但其在编码、智能体任务执行与工具调用等体现实用价值的基准测试中,性能已显著超越上一代的3.1 Pro模型。

一个关键佐证是,在评估真实世界任务经济价值的GDPval-AA测试中,3.5 Flash获得了1656 Elo分,远高于3.1 Pro的1314分。为实现这种生产力的大幅跃升,该模型在部分抽象推理与知识测试上做出了权衡。这实际上是一种务实的工程策略:以部分理论能力为代价,换取更强大的实际应用效能。

其性价比同样突出。该模型的输出速度比其他前沿模型快4倍,而成本更具竞争力:输入每百万Token 1.50美元,输出每百万Token 9.00美元,比3.1 Pro降低了40%。其知识截止日期更新至2025年1月,上下文窗口达到100万Token。至于旗舰版本Gemini 3.5 Pro,则计划于下个月正式发布。

多模态领域也迎来了重磅更新:Gemini Omni Flash。这是一个能够“根据任意输入生成任意内容”的世界模型,其对物理世界具备近乎直觉的理解力。

用户仅需一段简单描述,即可生成蛋白质折叠的黏土动画;也可上传自拍视频,在完全保留人物动作与表演的前提下,无缝替换背景与环境。当前发布的Omni Flash是该系列的首个模型,效果仍在持续优化,更强大的Omni Pro版本已在开发中。

智能体:全面接管数字生活

“智能体”是本届I/O大会所有产品的核心逻辑。它正成为技术开发与日常生活的底层架构。

面向开发者的Antigra vity平台升级至2.0版本。全球可用的Antigra vity CLI将全面替代旧版命令行工具。更重要的是,开发者现在能够将谷歌内部使用的Agent Harness框架部署到自有服务器上。

其效率提升显著。结合Gemini 3.5 Flash,处理速度提升了12倍。演示中,93个子智能体并行工作,在12小时内发出超过1.5万次模型请求,处理了26亿Token,最终从零构建了一个功能完整的操作系统内核。用户甚至能在该AI编写的系统中运行命令行、播放动画、运行《毁灭战士》——这在Gemini 3.1 Pro上无法实现。

面向普通消费者的对应产品是Gemini Spark,可将其视为谷歌版的“个人云端智能助理”。

在工作场景中,Spark可以梳理文档、邮件与聊天记录,并以用户惯用的语气自动生成团队周报。在生活场景中,其能力更为贴心。例如,在筹办街区派对时,Spark能自动创建实时跟踪表格,通过邮件跟进邻居回复,并为未回复者草拟提醒邮件。它还能从网盘调取小区业主公约,提醒用户周五下午前不得布置充气城堡,并最终生成一份精美的派对宣传幻灯片。

为支撑此类云端智能体的资源消耗,谷歌调整了订阅体系,新推出每月100美元的Ultra计划,提供5倍用量、20TB存储及Antigra vity的优先使用权。原每月250美元的高阶计划则降价至200美元。

安卓系统也为此进行了深度适配,新增了名为Android Halo的智能体监控区域。在状态栏顶部,它会实时显示智能体在后台执行的任务、当前进度以及是否需要用户确认。这预示着一个趋势:未来的手机用户界面,将是为智能体服务而设计,而不仅仅是承载应用程序。

Gemini App本身采用了名为Neural Expressive的全新设计语言。

其中的Daily Brief功能,会在每日早晨自动扫描用户的邮箱与日历,提炼出当天最关键的事项并建议后续行动。NotebookLM现已与Gemini深度整合,支持上传EPUB格式电子书,并能一键将大量资料转化为带动画效果的电影级讲解视频,或生成手绘、黏土等10种风格的信息图表。

更重要的是,所有新发布的模型均已接入Gemini App,而谷歌旗下的各类应用,也通过Agents框架实现了语音互联。

“动口不动手”的体验延伸至办公场景。在Docs Live中,用户只需对着麦克风口述想法,甚至中途进行修正,Gemini会自动将其整理成格式规范的文档。今年夏季,这套语音功能将扩展至Gmail Live和Google Keep的实时模式。

搜索与电商:架构大重构

月活用户已突破10亿的AI Mode搜索,完成了底层升级。传统搜索框现已支持上传图片、文件与视频进行跨模态理解,搜索结果页与对话式追问实现了无缝融合。

更关键的是,用户可以在搜索中创建“搜索智能体”。

例如,若想监控某只符合特定财务指标的生物科技股,智能体会在后台7×24小时监控市场动态,过滤噪音信息,仅将关键异动推送给用户。寻找房源、追踪球鞋发售等任务,均可交由后台智能体处理。

搜索甚至具备了实时编写代码、构建交互界面的能力,这正是“用户界面服务智能体”理念的体现。

当用户询问“黑洞如何影响时空”时,搜索后台会调用隔离的智能体环境,实时编写代码并运行渲染,直接在结果页面生成一个带有参数滑块、可拖拽交互的可视化模型。

询问周末家庭出游建议,它能直接生成一个整合行车时间、天气信息与餐厅预约的互动日程表。

谷歌生态的其他产品也随之进化。地图迎来了十年来最大升级“Ask Maps”。“Ask YouTube”功能则允许用户直接提问,例如“如何教3岁孩子从平衡车过渡到自行车”,系统会整理知识概览,并直接跳转到最相关的视频片段,还支持基于上下文进行连续追问。

电商领域的升级直接触及商业底层,推出了完整的三件套解决方案。基础是UCP(通用商业协议),可将其视为智能体电商时代的“HTTP协议”,为AI购物制定了通用标准,目前已获得亚马逊、Meta、微软等巨头的支持。

随之推出的是AP2(智能体支付协议),它解决了AI代理进行支付的安全顾虑。用户可以设定具体品牌、商品类别和金额上限三道“护栏”,全部满足条件后智能体才会执行下单,且每一笔交易都有防篡改的数字授权书作为凭证。

基于这两套协议,谷歌推出了“通用购物车”。用户在搜索、聊天、观看视频甚至阅读邮件时发现的商品,都能直接添加至这个跨商家的智能购物车中。它会自动寻找折扣、监控库存。更智能的是,若用户同时将主板和CPU加入购物车,它会主动检查两者接口是否兼容,并在不匹配时立即提醒,避免了配件选购错误。

创意工具与科学研究:全面开花

设计与创意工具在此次更新中获得了全面的效率提升。作为Workspace的新成员,Google Pics专注于图像创作与编辑,支持精准的目标分割与替换。

UI设计工具Stitch支持实时语音协作,两位不具备设计背景的用户对着屏幕提出要求,界面便能实时响应修改,并直接导出代码进行发布。整合了工作流的Google Flow创意工作室接入了Omni模型,现已支持保留原始表演动作仅修改环境特效;单张图片可同时生成16段不同机位与镜头语言的视频。

大规模场景修改功能,能将一段视频的时间从清晨一键切换至深夜,且保持光影逻辑自洽。Flow Music展示了强大的混音能力,录制一段钢琴弹奏后,提示“转向R&B风格,加入女声”,系统便能生成一首制作精良的完整歌曲。

AI生成内容的泛滥使得内容鉴伪成为刚需。SynthID水印技术目前已标记超过1000亿张图片、文本、视频以及累计时长相当于6万年的音频。在Chrome浏览器中,右键点击图片即可查验其真伪。OpenAI也与Kakao、ElevenLabs等公司一同加入了SynthID生态系统。

硬件载体方面,Android XR智能眼镜分为两条产品线:配备镜片显示屏的版本将于今年晚些时候扩大测试范围;今年秋季首发的将是音频眼镜,由Gentle Monster和Warby Parker设计,三星制造,同时兼容苹果与安卓系统。

科学领域的探索体现了技术的终极价值。Gemini for Science包含假设生成器、计算发现引擎等工具,能将复杂的医药数据分析时间从数小时压缩至几分钟。

AI天气预报模型Weather Next成功提前3天精准预测了梅丽莎飓风的路径,其准确性优于传统模型,为当地争取了宝贵的撤离时间。代码安全领域推出了能自动发现并修复漏洞的Code Mender。谷歌旗下的Isomorphic Labs正在利用AI加速针对免疫疾病与癌症的新药研发进程。

从底层算力到前沿科研,从日常事务到宏大命题,谷歌的AI正以系统化、行动化的姿态,深度融入现实世界的每一个环节。本次发布会所揭示的,已不仅是技术的迭代,更是一场围绕“智能体”展开的、关于未来人机协作模式的全面重构。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策