谷歌Gemini Pro/Ultra额度永久翻3倍:新计费策略深度解读
谷歌在2026年I/O开发者大会上高调推出的“按算力计费”新规,恐怕没料到会这么快就迎来一场全球付费用户的集体“声讨”。
新规上线仅仅几天,Reddit、X(原推特)等平台就已被海量的吐槽和投诉刷屏。许多重度依赖AI进行编程和内容创作的用户发现,新规下的体验堪称“钱&包刺客”——有时仅仅工作一两个小时,或者因为聊天历史变长,就会突然触发长达5小时的冷却时间,甚至直接耗尽本周的全部额度。
面对这场迅速发酵的舆论危机,谷歌DeepMind团队与AI编程工作区Antigra vity的总监Varun Mohan坐不住了,于今日紧急出面公开回应,并抛出了一套诚意十足的“灭火”方案。
紧急补丁:额度直接永久翻三倍
由于开发者和高级付费用户的反弹异常激烈,谷歌团队在极短时间内连续进行了两次额度上调,最终拿出了如下补偿措施:
- 全员额度重置: 针对所有当前订阅Pro和Ultra档位的付费用户,本周的Gemini使用额度已全部清零重置。无论之前是否被锁,现在都可以重新开始使用。
- 额度永久提升3倍: Varun Mohan明确表示,为了确保重度用户和开发者能无缝衔接工作流,Gemini在Antigra vity等核心开发场景下的配额将永久性提高至原来的3倍。
- 补偿礼包: 谷歌还为现有的Google AI Ultra订阅用户提供了限时福利——可在应用内直接领取100美元的额外Antigra vity奖励额度(领取截止日期为5月25日)。该额度将在计划配额用尽后自动激活。
目前,全球各地的付费用户已陆续在后台仪表盘中收到“Keep Building(继续构建)”的弹窗通知,意味着额度上调正在分批生效。
“按算力计费”动了谁的蛋糕?
为何一次计费模式的调整会引发如此剧烈的反弹?问题的核心在于底层逻辑的根本性改变。
过去,Gemini的计费方式相对简单,主要依据“每日提示词输入次数”。而自5月17日起实施的新规,则将请求的复杂程度、调用的特定功能(如代码执行),以及最关键的“聊天历史长度”,全部纳入了配额核算体系。
关键矛盾点: 在大模型运行机制中,对话历史越长,模型处理每次新提问所需的“上下文算力”消耗就会呈几何级数增长。程序员在排查复杂Bug时,往往需要维持一个长达数小时、包含数万行代码的上下文对话。在新规下,这种高强度、长历史的交互模式,会迅速“烧光”用户的可用额度。
尽管谷歌官方解释,“按算力计费”旨在更公平、更高效地分配服务器资源,但由于初始配额设定得过于保守,导致支付了高昂订阅费用的Ultra用户反而成了最大“受害者”。有用户无奈调侃,现在盯着额度表的时间,比盯着代码的时间还要多。
事件启示
Varun Mohan承认,团队在初期确实低估了硬核用户的实际消耗速度,并承诺将持续倾听社区反馈。
这次额度永久翻倍并重置的“紧急救援”,虽然暂时平息了核心开发者群体的不满情绪,但“按算力计费”的整体框架并未改变。对于未来需要进行大量长文本交互的用户而言,其使用成本依然存在不确定性。这场风波也再次提醒业界,在推行任何涉及用户核心体验的收费模式改革时,充分的测试与循序渐进的过渡至关重要。