2024谷歌I/O大会AI亮点全解析:Gemini上新与搜索革命

2026-05-20阅读 0热度 0
ai

美东时间5月19日,谷歌年度开发者大会Google I/O 2026如期而至。与往年不同,今年的舞台几乎被AI完全占据。从搜索框的重塑、新一代多模态模型的发布,到能够持续执行任务的智能体亮相,乃至重新杀回智能眼镜市场,谷歌的意图再清晰不过:它正试图将AI深度植入其庞大的互联网入口体系,覆盖搜索、安卓、办公、视频乃至下一代硬件。

Alphabet兼谷歌CEO桑达尔·皮查伊在主题演讲中透露了几个关键数据:Gemini应用月活用户数在一年内翻倍,已超过9亿;搜索中的“AI概览”功能月活用户突破25亿;而使用“AI模式”的用户也已超过10亿。这些数字背后,是AI正从一项新奇功能转变为谷歌核心服务的现实。

皮查伊的论断更为直接:“AI已不再只是聊天机器人,而是‘下一代计算平台’。”他进一步强调,“AI正在点亮公司的每一个部分。”这句话几乎可以视为本次大会的注脚。从Gemini Omni模型、Gemini 3.5 Flash,到能自主工作的Gemini Spark智能体,再到订阅体系的重构,谷歌的目标是将Gemini从一个对话工具,升级为贯穿其所有生态的“AI操作系统”。

外界普遍将此次密集发布视为谷歌对OpenAI、微软等竞争对手的一次全面反击。过去一年,ChatGPT等工具深刻改变了用户获取信息和消费内容的方式,对谷歌赖以生存的搜索业务构成了前所未有的挑战。而I/O大会清晰地展示了谷歌的应对策略:利用其全球最大的流量入口优势,将AI“原生化”地植入每一个产品缝隙中。

搜索25年来最大改版:搜索框变成AI入口

本届I/O最核心的变化,莫过于对搜索业务的彻底改造。这可能是谷歌搜索诞生25年来最大的一次转型。

据报道,谷歌正在重新设计其标志性的搜索框,使其能够更好地处理用户向AI聊天机器人提出的那些更长、更复杂的自然语言问题。新版搜索框将支持更自然的语言输入,方便用户上传图片和文件,并能自动辅助用户完善搜索意图,甚至支持AI智能体持续执行任务。

谷歌知识与信息平台主管尼克·福克斯对此的表述非常形象:“用户应该能够把脑海中的任何问题直接输入搜索框。”这意味着搜索框正在从一个关键词接收器,演变为一个理解用户复杂意图的AI任务入口。

更进一步的是,谷歌计划在搜索中引入Agent(智能体)功能,帮助用户跟踪关注话题、预订服务、管理健康信息,甚至创建个性化的任务面板。当然,部分高级功能将仅向付费订阅用户开放。业内分析指出,这标志着谷歌搜索正从传统的“链接分发器”,转向一个能主动完成任务的新型入口。

谷歌最强多模态模型Gemini Omni亮相

模型层面的重磅更新是全新的Gemini Omni。多家科技媒体将其定位为谷歌目前最先进的多模态AI系统,能够同时无缝处理文本、图像、视频、语音以及实时交互任务。

与之前的Gemini系列相比,Omni的进化方向非常明确:更强调实时交互能力,更适配智能体(Agent)场景,并且可以跨应用、跨设备连续执行复杂任务。这显然是在直接对标OpenAI的GPT-5 Agent体系以及微软日益壮大的Copilot生态。

谷歌高管在大会上反复传递一个核心信息:“AI不只是回答问题,而是开始真正完成工作。”这一表述的转变意味深长,意味着谷歌的AI战略重心已从打造一个聪明的“聊天助手”,转向构建一个可靠的“任务执行平台”。

Gemini 3.5 Flash:主打速度与成本,Pro版6月见

除了旗舰模型,谷歌还推出了更注重效率的Gemini 3.5 Flash。根据大会信息,Flash系列定位于低延迟、高响应速度和更低的推理成本,重点面向开发者、移动端、实时交互以及AI编程和自动化场景。

作为轻量级新成员,Gemini 3.5 Flash的技术能力不容小觑,而其定价策略更具攻击性——仅为同类前沿模型的一半,某些情况下甚至低至三分之一。谷歌宣布,该模型将成为Gemini应用及谷歌搜索“AI模式”的全球默认模型。

谷歌还特别强调了其安全性,称已加强网络安全防护,使其“生成有害内容的几率更低,同时也更不容易误拒安全的查询请求”。此外,功能更强大的Gemini 3.5 Pro目前正在内部使用,预计将于下个月(6月)面向更广泛的用户发布。

这一系列动作释放出一个明确信号:AI领域的竞争维度已经扩展。它不再仅仅是“谁最聪明”的较量,更是“谁更快、更便宜、更适合大规模部署”的比拼。在智能体和实时AI时代,延迟和成本的重要性正急剧上升。Gemini 3.5 Flash也被视为谷歌新一代AI订阅体系的重要基石之一。

Gemini Spark:谷歌正式押注“AI智能体”

如果说模型更新是技术迭代,那么Gemini Spark的发布则更具战略意味。谷歌将其定义为一种“持续运行的AI智能体”,可以长期在后台执行任务,被多家媒体评为本届I/O最具战略意义的发布之一。

根据演示,Gemini Spark未来能够自动整理邮件、监控用户日程、跟踪网页信息、管理文档、完成跨应用工作流,甚至代表用户进行部分消费和预订。这背后是谷歌正在推动的“始终在线AI”理念——AI不再被动等待指令,而是主动观察、学习并处理任务。

谷歌副总裁乔什·伍德沃德表示:“Spark代表Gemini的一次重大转变。”业内共识是,这意味着AI行业正从“聊天机器人时代”迈入“智能体时代”。过去的ChatGPT或Gemini,本质仍是对话工具;而Spark则更接近一个真正能独当一面的数字助手。谷歌显然希望借助其Gmail、Chrome、YouTube、Docs和Android的庞大生态,将Gemini打造成互联网层面的AI执行入口。

“我们正进入搜索智能体时代”

“我们正进入搜索智能体时代。”谷歌高管的这句断言,为搜索的未来定下了基调。在Gemini 3.5模型的加持下,谷歌搜索已能执行诸如制定复杂旅行行程之类的任务。

谷歌搜索产品副总裁罗比·斯坦登台演示了Gemini所具备的智能袋里能力。他表示:“我们坚信,最好的搜索体验,应当是真正能为你效劳的体验。”全新的“AI概览”功能将提供极具互动性的搜索过程,例如在探索黑洞主题时,甚至能自动生成相应的动画演示和定制化界面。

更值得关注的是,谷歌搜索正获得大规模执行任务的能力,例如为用户自动构建迷你应用来处理复杂事务。一个典型的场景是:当用户想为家庭周末活动寻找灵感时,搜索可以从零开始,量身打造一份详尽的规划方案。

联手三星:谷歌AI眼镜今秋上市

硬件是本届I/O的另一大看点。谷歌首次公开展示了新一代AI智能眼镜,标志着其正式回归智能眼镜市场。谷歌宣布,已与三星以及眼镜制造商Gentle Monster和Warby Parker达成合作,将推出内置Gemini助手的智能眼镜。这些眼镜将兼容Android和iOS设备,预计于今年晚些时候上市。

Android XR产品与平台负责人沙赫拉姆·伊扎迪透露:“这仅仅是今年秋季即将推出的更大系列产品中的首批两款设计。”他强调,这款眼镜的设计理念是通过“私密地向用户耳边播报,而非通过屏幕显示”来提供信息,旨在实现无干扰的智能交互。

三星公司表示,该设备将结合Android XR平台与Gemini AI能力,打造“智能可穿戴计算体验”。演示显示,这款AI眼镜能够实现实时翻译、环境识别、导航、语音交互,并能调用Gemini智能体。业内观察认为,谷歌正试图复制Android在智能手机时代的成功,通过将AI智能体与增强现实(AR)设备结合,提前卡位下一代计算平台。

重构AI订阅:推出100美元/月开发者计划

除了技术和产品,商业模式的调整同样关键。谷歌宣布重新设计其AI收费体系,其中面向开发者的新订阅计划每月收费100美元。该计划将提供更高的Gemini API调用额度、AI Studio高级功能、Gemini Code Assist、Google Cloud积分以及更高等级的智能体访问权限。

分析指出,这意味着谷歌开始全面发力开发者商业化。此前,OpenAI、Anthropic等已在企业和开发者市场建立了先发优势,而谷歌虽然模型能力强大,但开发者生态的推进相对缓慢。如今,谷歌显然希望通过更具竞争力的价格和更深度的工具整合,重新争夺开发者群体。

AI Ultra月费从250美元降至200美元

与此同时,谷歌也调整了面向高端用户的旗舰订阅计划AI Ultra的价格,将其月费从250美元下调至200美元。AI Ultra提供最高等级的Gemini模型访问、Deep Think推理能力、高级智能体功能、AI视频与图像生成、AI编程能力、NotebookLM高级功能以及更高的API和上下文限制。

这一价格调整背后,是日趋白热化的AI订阅市场竞争。过去一年,OpenAI推出ChatGPT Pro,Anthropic强化Claude Max,微软扩大Copilot企业订阅,xAI也在推动Grok高级会员。谷歌此次下调Ultra价格,一方面是为了扩大用户规模,另一方面也清晰地表明,大模型竞争正从“技术战”全面进入“价格战”阶段。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策