大模型烧钱真相:930万Token成本与效率深度测评
龙虾之父一个月消耗6030亿Token,总花费高达九百万元软妹币。移动、联通、电信,三大运营商都在推Token套餐,199元送千兆宽带外加1亿Token,这事儿你听说了吗?从硅谷到国内大厂,“Token最大化”成了公司里的新潮流,谁消耗的Token多,谁仿佛就是AI时代的模范员工。更有甚者,有00后校友向母校捐赠了20亿Token,分给数百名学生作为创业的AI工具资本。
图片来自新浪财经
短短半年,Token完成了一次惊人的身份跃迁:从一个技术术语,变成KPI指标,再变成话费套餐里的赠品,乃至慈善捐赠的“货币”。它俨然成了AI时代的“度量衡”。但一个核心问题也随之浮出水面:它到底在度量什么?似乎没人能说得清。
我们一边自己购买Token,一边使用公司的配额,部署了无数个智能体。代码、论文、周报,仿佛都是Token燃烧后的灰烬。而另一边,在大厂里,由于Token消耗排行榜的存在,员工们开始用公司的Token处理私事、玩游戏,甚至开发几十个毫无用处的子智能体,只为提升自己的排名。
“回报”这件事很难量化,但“使用量”却可以。于是,所有人都选择了那个更容易被测量的东西。这并非AI时代的新病症,而是管理学上一个古老顽疾的再次发作。
用AI消灭狗屁工作的公司,正在制造新型狗屁工作
亚马逊,这家此前裁员裁到自家网站都出现404的科技巨头,最近又贡献了一则新的“管理笑料”。原本被寄予厚望、用来消灭“狗屁工作”的AI,最终却沦为制造新型“狗屁工作”的源头。
据《金融时报》报道,为了强行推动员工拥抱AI,亚马逊祭出了一个极其复古的管理手段:“Token消耗排行榜”,用以追踪每位员工的使用量。公司强制要求超过80%的开发者每周必须完成AI使用指标,甚至将消耗Token的数量直接与考核挂钩。
图片来源:The Information
打工人的应对策略也很直接:既然公司用这种指标来考核,那就用魔法打败魔法,全面开启“Token最大化”战术。恰逢亚马逊内部上线了一款名为MeshClaw的AI智能体,它能发起代码部署、整理邮件、操控Slack。公司内部备忘录将其描述为:“它在夜间做梦来整合白天所学,在你开会时监控你的部署,在你醒来前替你分类邮件。”
于是,MeshClaw顺理成章地成了刷榜利器。开发者们开始用它来规划旅行、处理私人邮件,甚至让AI分析产品经理在Slack上说的“蠢话”。
在面向谷歌、苹果等公司认证员工的匿名社区Team Blind上,一位亚马逊员工的发言获得了疯狂点赞:“我疯狂燃烧Token,就是为了骂我的产品经理。每当他在Slack里说屁话,我就把聊天记录扔给AI,启动10个子智能体去全方位深度分析并吐槽他。这绝对是GPU算力的完美用途。”
亚马逊在回复《金融时报》时提到,MeshClaw“每天帮助数千名员工自动化重复性工作”,公司“致力于负责任地部署生成式AI”。同时,公司表示Token统计数据不会用于绩效评估。
但员工的反馈却是另一番景象:“经理在看这个数据。当他们追踪用量时,就会制造扭曲的激励,有些人在这上面很有竞争心。”公司嘴上说不算KPI,但经理偷偷在盯。这和大厂宣称“年终奖与996无关”的套路,何其相似。
无独有偶,Meta的员工也在做类似的事情。早在四月份,The Information就曾报道,Meta公司的一名员工利用内部数据,在公司内网创建了一个仪表盘,让同事们可以竞争成为公司排名第一的AI Token用户。这份排行榜汇总了超过85000名Meta员工的人工智能使用情况,并列出了排名前250位的超级用户——有趣的是,扎克伯格并未能进入前250名。
这份排行榜在两天后悄然下架。Meta在回应媒体查询时声明,“该员工自行决定撤下仪表盘;Meta并未要求采取此行动。”当你笑完这份排行榜的荒诞之处,转念一想便会发现,这其实是许多公司的现状:还没想好AI到底该怎么用,就先忙着裁员;还没厘清Token的价值,就匆忙把它定为生产力的衡量工具。
一个月6000亿Token烧出了什么
Token消耗排行榜的荒诞剧还未落幕,更魔幻的现实已经登场。三位00后校友向母校郑州西亚斯学院捐赠20亿Token,网友按市价折算,调侃说这就值100块。虽有后续媒体澄清,这20亿Token不单是API调用量,还包含生成工具使用权和平台积分,但“捐Token”这个行为本身,已经足够刷新人们对慈善的认知。校友们自称实力尚不足以捐赠教学楼,故而捐赠算力。这个时代的慈善逻辑,正在被重新定义。
Token存在的价值在被刷新,其使用的边界也在不断拓展。GitHub前CEO、现任Meta超级智能实验室CEO Nat Friedman,在一次公开活动中分享了一个故事。某天,他的OpenClaw判断他喝水不够,他随口给了个指令:“不惜一切代价确保我补充足够的水分。”
网友的评论是:他是不是喝多了
OpenClaw迅速行动了。它指示他去厨房喝一瓶水,并告知正通过家庭摄像头监控他是否执行。他照做之后,OpenClaw发来一张他喝水的截图,附言:“干得好。”原本只是手机设置一个喝水提醒的小事,现在却需要燃烧大量Token,调用摄像头来为“提醒你喝一杯水”这种简单需求服务。
那么,当Token的消耗成本被认为无关紧要,其使用边界不再被认真思考时,人们又会拿它来做什么?
最近另一件引人注目的事,是“龙虾之父”Peter Steinberger在社交平台X上分享了一张CodexBar的截图,配文称“CodexBar最新更新让API费用显示得更加友好。”然而,眼尖的网友立刻发现了这张截图的惊人之处:三十天使用了6030亿Token,累计消耗金额高达130万美元,约合软妹币930万元。
评论区充满了质疑:交付了多少代码?消耗的Token与最终可用代码的比例是多少?到目前为止,做出了什么真正有用的东西吗?要不是入职OpenAI,Codex能允许这样消耗Token吗?有评论直言不讳:“兄弟,你最好拿出点儿价值百万美元、连顶级工程师都做不到的东西,不然这可能就是前沿实验室泡沫破裂的开端了。而且这还是补贴价格,如果是实际成本,价格肯定更高。”
Peter Steinberger在评论区回应了这些声音,他提到如果关闭“快速模式”,成本能降低70%。此外,自从OpenClaw被OpenAI收购后,负责该项目的仅剩三名成员,他们在Codex上运行了100个实例,这些实例会自动处理软件开发流程中的各种问题,如代码提交、Bug修复、功能更新等。
但一个根本问题依然存在:光看OpenClaw的更新,真的需要130万美元来支撑吗?他也提到自己在进行OpenClaw之外的其他创业项目,并探索一个问题:如果Token成本不重要,软件将会怎样被构建?
这确实是个好问题。可惜,在烧掉130万美元之后,答案似乎依然模糊。这可能是2026年最昂贵的一个问号。它揭示了一个尴尬的现实:即便是手握丰沛算力资源的人,目前似乎也不完全清楚这些Token最该用来做什么。
大厂的高管们看着财报上巨额的GPU采购费用,迫切需要向董事会证明这笔投资物有所值。既然“重构真实业务流”太难、太慢、太需要魄力,那就退而求其次,去考核那个最容易量化的东西——“Token的消耗量”。员工们甚至从一开始就没被认真询问“你觉得Token该怎么用才能创造价值”,他们被追问的往往是“你这周用了多少”。
当一个工具的考核标准变成了“消耗量”而非“产出”,它就不再是工具了。它成了燃料,唯一的使命就是被烧掉。至于燃烧之后究竟驱动了什么,反而没人在意。因为一旦认真追问,很多人会发现,自己烧掉的那些Token,和年初被裁掉的那些员工一样,最终都没能换回任何实质性的东西。
我们正在经历的,仿佛是一场所有人都假装看懂了规则的游戏。公司假装知道怎么用AI,员工假装在认真使用AI,投资人假装看到了清晰的回报路径。唯一真实且不断增长的,只有那张持续超支的账单。
Token终将找到它真正的用武之地,成为真正的“新质生产力”。但在那一天到来之前,在动辄烧掉上亿Token之前,或许我们都该停下来问一句:这真的有必要吗?






