Gemini 3.5 Flash模型深度测评:谷歌开发者大会重磅发布,Token容量激增7倍

2026-05-21阅读 0热度 0
Gemini

2026年谷歌I/O开发者大会的聚光灯下,CEO桑达尔・皮查伊正式宣告,谷歌已迈入由Agent智能体驱动的Gemini新时代。这意味着,AI正从被动的问答工具,转向全天候自主执行任务的数字伙伴,开始深刻重构个人与企业的数字化工作流。本次大会的布局清晰而完整:从底层模型、开发平台,到终端助手和具体场景应用,形成了一套全栈式解决方案。同时,一组关键数据被披露——Token消耗量在一年内暴增了7倍,这无疑印证了智能体时代对算力基础与商业模式的深远影响。

模型升级:速度与成本的双重突破

为支撑智能体的高效运行,谷歌推出了专为智能体优化的新一代核心模型Gemini 3.5 Flash。它的核心优势在于极致的响应速度:Token输出速度达到业内主流模型的4倍,而在其专用的Antigra vity开发平台中,这一速度更能提升至惊人的12倍。更关键的是,在实现性能飞跃的同时,其成本还不到同类旗舰模型的一半。该模型支持1M的长上下文,并已成为Gemini App与搜索AI Mode的默认技术底座。此外,多模态世界模型Gemini Omni的发布,补齐了智能体在视频理解、图像生成与交互方面的能力短板,为更复杂的任务执行铺平了道路。

终端体验:常驻智能体与可视化交互

对于终端用户而言,最直接的感受将来自云端常驻智能体Gemini Spark。它最大的特点是“永不掉线”,即便在设备关机状态下也能持续运行。它深度整合了Gmail、Docs、Sheets等谷歌核心办公应用,能够自动完成邮件撰写、信息归纳整理乃至跨应用的工作流协作。据悉,该产品将于下周面向美国的Ultra用户开启测试。同时,谷歌也调整了订阅价格并新增档位,旨在降低用户的使用门槛。在Android平台上,同步上线的Android Halo功能,则用于实时、直观地展示智能体在后台的执行状态,让无形的AI服务变得可见、可感。

开发者赋能:全栈平台与高效协同

面向开发者,谷歌将Antigra vity平台升级至2.0版本,并将其定位为“智能体优先”的全栈开发平台。新平台重点支持多智能体之间的协同编排、动态调度与后台自动化。大会现场的一个演示极具冲击力:93个智能体协同工作,仅用12小时便以极低的成本完成了一个操作系统的开发。这充分展示了智能体规模化协作的潜力。配套推出的Managed Agents API与低代码工具Agent Studio,则旨在覆盖从专业开发到业务人员快速搭建的各类场景,让智能体技术的应用门槛大幅降低。

场景深耕:从信息获取到交易闭环

在搜索与电商这两个核心场景,谷歌的智能体布局更为深入。Search Agents能够7×24小时在后台监控用户关注的信息,并主动进行推送提醒。而Universal Cart功能则实现了跨平台的比价、自动下单与售后追踪。这意味着,智能体不再仅仅是回答问题的助手,而是能深度渗透到日常服务中,主动管理信息流并完成交易闭环的袋里。

数据背后:Token爆发与产业变革

一组数据揭示了这场变革的规模:谷歌当前每月处理的Token数量已达到3200万亿,相比2025年同期的480万亿,暴增了7倍。这背后的驱动逻辑在于,智能体执行任务具有长周期、多轮次、频繁调用工具的特性,导致完成单个任务所消耗的Token数量数倍于传统的简单对话。这种需求侧的爆发,直接推动了底层算力需求的激增和商业化模式的加速成熟。

行业观察普遍认为,Agent的普及正带动Token消耗量进入爆发式增长通道。大模型的商业模式重心,正在从满足分散的需求侧提问,转向支撑系统性的供给侧能力。由此,“Token工厂”与算力租赁将成为未来产业的关键赛道,标志着AI技术正式进入规模化、深度落地的新阶段。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策