谷歌Gemini Pro/Ultra额度永久翻3倍：新计费策略深度解读

2026-05-23阅读 0热度 0

Gemini

谷歌在2026年I/O开发者大会上高调推出的“按算力计费”新规，恐怕没料到会这么快就迎来一场全球付费用户的集体“声讨”。

新规上线仅仅几天，Reddit、X（原推特）等平台就已被海量的吐槽和投诉刷屏。许多重度依赖AI进行编程和内容创作的用户发现，新规下的体验堪称“钱&包刺客”——有时仅仅工作一两个小时，或者因为聊天历史变长，就会突然触发长达5小时的冷却时间，甚至直接耗尽本周的全部额度。

面对这场迅速发酵的舆论危机，谷歌DeepMind团队与AI编程工作区Antigra vity的总监Varun Mohan坐不住了，于今日紧急出面公开回应，并抛出了一套诚意十足的“灭火”方案。

紧急补丁：额度直接永久翻三倍

由于开发者和高级付费用户的反弹异常激烈，谷歌团队在极短时间内连续进行了两次额度上调，最终拿出了如下补偿措施：

全员额度重置： 针对所有当前订阅Pro和Ultra档位的付费用户，本周的Gemini使用额度已全部清零重置。无论之前是否被锁，现在都可以重新开始使用。
额度永久提升3倍： Varun Mohan明确表示，为了确保重度用户和开发者能无缝衔接工作流，Gemini在Antigra vity等核心开发场景下的配额将永久性提高至原来的3倍。
补偿礼包： 谷歌还为现有的Google AI Ultra订阅用户提供了限时福利——可在应用内直接领取100美元的额外Antigra vity奖励额度（领取截止日期为5月25日）。该额度将在计划配额用尽后自动激活。

目前，全球各地的付费用户已陆续在后台仪表盘中收到“Keep Building（继续构建）”的弹窗通知，意味着额度上调正在分批生效。

为何一次计费模式的调整会引发如此剧烈的反弹？问题的核心在于底层逻辑的根本性改变。

过去，Gemini的计费方式相对简单，主要依据“每日提示词输入次数”。而自5月17日起实施的新规，则将请求的复杂程度、调用的特定功能（如代码执行），以及最关键的“聊天历史长度”，全部纳入了配额核算体系。

关键矛盾点： 在大模型运行机制中，对话历史越长，模型处理每次新提问所需的“上下文算力”消耗就会呈几何级数增长。程序员在排查复杂Bug时，往往需要维持一个长达数小时、包含数万行代码的上下文对话。在新规下，这种高强度、长历史的交互模式，会迅速“烧光”用户的可用额度。

尽管谷歌官方解释，“按算力计费”旨在更公平、更高效地分配服务器资源，但由于初始配额设定得过于保守，导致支付了高昂订阅费用的Ultra用户反而成了最大“受害者”。有用户无奈调侃，现在盯着额度表的时间，比盯着代码的时间还要多。

Varun Mohan承认，团队在初期确实低估了硬核用户的实际消耗速度，并承诺将持续倾听社区反馈。

这次额度永久翻倍并重置的“紧急救援”，虽然暂时平息了核心开发者群体的不满情绪，但“按算力计费”的整体框架并未改变。对于未来需要进行大量长文本交互的用户而言，其使用成本依然存在不确定性。这场风波也再次提醒业界，在推行任何涉及用户核心体验的收费模式改革时，充分的测试与循序渐进的过渡至关重要。