Gemini API请求超限?速率限制调整与配额提升实战指南
调用 Gemini API 时突然冒出一个 429 错误,请求直接被拒——这不是密钥失效,也不是网络问题,而是服务端直接切断了你的请求通道。说白了,你撞上了当前项目的速率墙,必须立刻做点什么,否则下游所有依赖它的功能都会跟着停摆。
先说一个经典场景:你在代码里写好逻辑,发起调用,对方毫不犹豫地甩回一个 429。你以为要换密钥、查网络节点,结果折腾一圈才发现,问题出在请求次数上——每分钟对应的请求配额已经见底。
好了,下面直接从操作入手。
确认是否真被 RPM 限流
第一步:打开 Google Cloud Console,记得确认你登录的是调用 API 的那个正确项目,别走错片场。
第二步:进入「API 和服务」→「配额」页面,在服务筛选器里搜 Gemini API,找到那一行指标叫 Requests per minute per project 的。
第三步:重点看右侧的「已使用/限制」数值。如果显示的是 60/60、25/25,或者离满额只差一丢丢(比如 58/60),别犹豫,这就是 RPM 耗尽的铁证。哪怕你的 token 数量远没超标,请求也会在鉴权之前就被拦截。
这里有个细节要注意:免费层默认的 RPM 就是 60,而且这数值跟模型是绑定死的——gemini-1.5-flash 和 gemini-2.5-pro-preview-05-06 各自拥独立的配额池,不能混着用。
立即绕过限流的三种方法
情况确认了,怎么办?以下三条路可以走,优先级按推荐顺序排。
方法一:切换低消耗模型
最快的办法是换个低消耗的模型试试。举个例子,把你请求 URL 里的模型路径从 /v1beta/models/gemini-2.5-pro-preview-05-06:generateContent 改成 /v1beta/models/gemini-1.5-flash:generateContent,其余参数(headers、contents)纹丝不动,直接重发请求。
方法二:让客户端自动节流
代码层面加个简单的时间间隔控制:记一下上一次调用的时间戳,如果和当前这次还差不到 1000 毫秒(也就是每分钟最多发 60 次),那就主动补一个 sleep 等足时间。但这里得留神,多线程场景下要用原子计数器或者互斥锁保护,否则一不留神就漏控。
方法三:换账号接力
注册一个第二谷歌账号,在 Google AI Studio 里创建一个新项目、启用 Gemini API、然后生成新的密钥。把系统中原来的密钥换成这个新密钥,你就能瞬间拿到另一份 60 RPM 的免费额度。算是很经济实惠的应急法。
永久提升 RPM 配额的操作流程
如果暂时受不了频繁限流、又想稳定地长期使用,那就不妨考虑永久提升配额。几步走,不算复杂。
第一步:绑定支付方式
进入 Google Cloud Console,左侧导航栏点「结算」→「管理结算账号」→ 再点「+ 创建结算账号」。接着输入有效信用卡或借记卡信息,完成验证。
第二步:开启两步验证
访问 Google 账户安全中心,把「两步验证」开起来。这一步不是可选项,必须完成手机号信息或者身份验证器 App 的绑定,否则配额提升申请会被系统直接退回。
第三步:关联项目与结算账号
回到对应项目 → 「结算」→「关联结算账号」→ 从下拉菜单里拉出刚创建的那个付费账号 → 点击「关联」。到此为止,操作层面的事情已经做完。
【关键前提】这里有个容易被忽略的点:你必须等上 3~5 分钟,让系统完成后台配额重载。新 RPM 值(通常会升到 300~3000)才会真正生效。如果你刚走完流程就立刻重试,429 还是会老老实实拍在你脸上。
第四步:验证配额更新
回到「API 和服务」→「配额」页面,刷新后盯着 Requests per minute per project 那一行的「限制」列,看数字是否已经变了。同时看看「已使用」是不是开始归零累计。确认无误,就可以正常开工了。
