2024年AI行业深度解析:Token如何重塑大厂竞争格局
企业降本增效节省的资金,可能正被低效的AI资源消耗悄然吞噬。
近期,微软开始内部收紧对Claude Code的授权。据The Verge报道,微软的Experiences + Devices团队计划在6月底前关停大部分第三方Claude Code席位,全面转向GitHub Copilot CLI。这一决策的关键动因,正是为了应对失控的AI运营成本。相比之下,Uber的处境更为紧迫。其CTO Praveen Neppalli Naga公开表示,公司为2026年全年规划的AI预算,在四个月内已接近耗尽。
Meta采取了另一种策略。他们在内部推出了Token消耗排行榜,为高用量员工冠以“Token传奇”等称号,并将用量与绩效评估关联,实行末位警示。这套机制上线仅30天,便产生了戏剧性效果:公司全员Token总消耗量从6万亿激增至73.7万亿,增幅超过12倍,成本管控完全失效。
一边在紧急刹车,一边却在猛踩油门,但双方都暴露了同一个根本性问题:整个行业至今缺乏一套成熟、可量化、可落地的AI价值评估体系。于是,易于统计的Token消耗量,便成了那个唯一却极度危险的“硬性指标”。
百度CEO李彦宏在近期的大会上明确指出:Token易于计量,但它不等于实际价值产出。员工驱动更多AI Agent、加载超长上下文、进行反复试错,都会导致账单飞速膨胀,但业务成果却未必同步增长。
Token KPI:一场制造浪费的考核实验
以最大化Token消耗为导向的工作模式,即“Tokenmaxxing”,自去年底从硅谷兴起,现已波及国内。阿里、腾讯、字节等大厂的技术团队,已不同程度地将Token使用量纳入转正与晋升的参考维度。
当考核与Token用量深度绑定,职场形式主义便迅速渗透至AI工作流。据《财经》调查,部分员工为达成指标,刻意让AI Agent批量读取数万行代码、堆砌海量文献数据,通过纯粹“堆工作量”来刷高Token消耗,并无实际业务产出。这并非孤例,公开行业分析显示,全球企业级AI应用中,近半数的Token消耗都属于无效支出。
Meta那73.7万亿的Token里,有多少真正转化为了有效生产力?这正是所有Token KPI制度最致命的漏洞。
与硅谷企业面临成本焦虑不同,国内头部大厂正通过高额Token补贴,全力推动员工使用AI工具。
综合各方信息,各家的激励政策各有侧重:腾讯为核心研发人员提供年度22.8万元的Token套餐,并附加每月1000美元的外部工具报销额度;字节对内开放AI工具不限量使用,员工业余体验AI可报销50%,技术岗年上限为1000美元;百度为技术岗配备文心一言无限量使用权,并提供最高800美元/年的外部Token补贴;360的策略更为直接,为全员预充1亿Token。
AI工具已不再是简单的办公插件,它正在演变为新的生产资料。过去,企业为员工配置的是电脑、软件许可和云存储;如今,研发、设计、产品、运营等岗位都可能需要模型调用额度。尤其在代码生成、Agent工作流、视频制作、知识检索等场景中,Token就是驱动生产的核心燃料。
关键在于,燃料已经下发,但油耗如何计算、价值如何衡量,多数公司尚未建立清晰的体系。
吞金的Agent,算不清的变量账
Uber的内部数据,精准揭示了企业AI成本失控的核心机制缺陷。目前,其95%的工程师常态化使用AI编码工具,单人每月AI调用成本介于500至2000美元,70%的代码提交由AI生成,AI Agent每周可完成1800次代码变更,相关工作量占比从不足1%攀升至8%。
从业务渗透视角看,这无疑是AI应用的成功;但对财务部门而言,这意味着原本刚性可控的IT成本结构被彻底颠覆。
成本失控的根源,在于AI Agent自身的高消耗特性。Gartner分析指出,完成同等任务,Agent的Token消耗是传统聊天机器人的5至30倍。高盛进一步预测,到2030年,全球Token月消耗量将达到约120 quadrillion(约12亿亿),是2026年水平的24倍,其核心驱动力正是企业端Agent的规模化部署。
传统SaaS按席位计费,IT部门可在采购时锁定年度支出上限。但AI工具的成本结构与前者完全不兼容。Token账单随使用行为动态波动,而财务部门缺乏历史数据建立成本基准,IT部门没有成熟工具进行实时追踪与成本分摊,业务部门在推广时,也往往忽略了建立成本归因机制。
问题不在于AI没有价值,而在于企业的FinOps(财务运营)体系完全跟不上AI的消费速度。这正是微软和Uber紧急踩下刹车的原因。
员工在薅羊毛,业务在画饼
国内公司的现状,与硅谷存在差异。硅谷的焦虑在于用量激增、预算超支;而国内大厂更现实的困境是:资金投入后,员工使用深度不足,实际业务价值依然模糊。
从C端数据看,国内AI应用热度持续攀升。量子位智库2026年行业报告显示,今年4月国内AI应用Web端月访问量突破9亿次,APP端月下载量超2.4亿、日活达6.7亿,同比增幅达223%。QuestMobile数据同步印证,截至2026年3月,国内AI原生APP月活用户达4.4亿,豆包、千问、DeepSeek稳居行业前三。
然而,火热的C端数据,并未同步转化为企业端的生产力突破。埃森哲《2025中国企业数字化转型指数》数据显示,国内46%的企业已启动AI适配,但仅9%的企业实现了显著的业务价值增长。绝大多数企业的AI落地,仍停留在浅层试用、盲目推广、摸索场景的初级阶段。
内容创作、客服问答、代码辅助等浅层场景,AI落地门槛低、见效快;但在核心研发、供应链优化、财务风控、组织协同等关键业务环节,AI落地的适配难度、合规门槛和实施成本都呈指数级上升。
大厂全员发放Token补贴,旨在通过资金激励降低AI试错成本,强制推动全员融入AI工作流。这套策略有其逻辑:只有达到足够的使用密度,才能倒逼企业筛选出适配业务的真实场景,并培养员工的使用习惯。
但关键在于,只鼓励使用而不建立价值度量体系,福利就会演变为纯粹的财务负担,同时催生堆砌“PPT”和“文档”的伪AI工作方式。
AI对职场的渗透速度远超预期。据Cognizant 2026年报告测算,美国93%的岗位都将受到AI不同程度的影响,这一时间点比此前预估提前了6年。
主要岗位的AI渗透正呈现全面爆发态势。数据显示,2023年管理、金融运营、行政支持类岗位的AI暴露度仅为14%-21%,如今已飙升至60%-68%;律师岗位的AI暴露度从9%跃升至63%,就连CEO岗位的AI理论暴露度也突破了60%。报告同时强调,理论渗透不代表实际替代,责任归属、行业监管以及人类的最终决策,仍是制约AI全面落地的核心壁垒。
这意味着,AI将继续渗透更多岗位,Token消耗也将从研发部门扩散至更广泛的组织层面。企业真正面临的挑战,是如何评估一笔Token投入的产出回报率。
挤掉Token泡沫:从“用量崇拜”转向“效率度量”
Token本身并非原罪。企业构建成熟的AI生产力体系,必然需要充足的Token投入作为基础。行业乱象的核心症结,从来不是“Token用太多”,而是“错把Token用量当成了终极目标”。
Meta的Token排行榜机制,看似激发了全员使用AI的热情,一定程度上推动了工具尝试,但无法规避其根本缺陷:Token消耗总量,与员工的真实业务产出缺乏直接关联。
而微软、Uber的成本危机也证实,单纯一刀切地缩减Token额度仅是权宜之计,反而可能误伤那些真正高效的AI应用场景。
李彦宏尝试提出一个解决方案,他引入了DAA(Daily Active Agent,日活跃Agent数)的概念,主张用每日活跃的Agent数量来衡量AI的实际渗透程度,而非单纯的Token消耗总量。这个方向具有启发性,但具体计算方式和有效性仍需完善,毕竟一个“活跃”的Agent也未必能驱动有价值的业务流程。
企业的核心转型方向,应是彻底摒弃对Token的盲目崇拜,转而建立AI效率思维。
考核研发的AI工作质量,应聚焦AI生成代码的合并通过率、缺陷率、返工率以及项目交付周期的优化,而非单纯的调用频次;评估客服场景,核心应关注问题的一次解决率、人工接管率与用户满意度;衡量营销内容产出,则应侧重创作效率、转化效果与合规风险控制;针对AI Agent工作流,则需要重点排查无效重试、冗余上下文、不合理模型调用等资源浪费行为。
这套精细化的成本与价值管理体系,其核心逻辑在于精准区分有效AI调用与无效资源消耗,从根本上杜绝那种纯粹为了“堆量”而进行的浪费。
随着AI向纵深落地,Token将成为与电费、云服务费、人力成本并列的核心生产性开支。硅谷企业正在为前期的盲目扩张补课,国内企业则仍在依靠补贴普及AI使用。
从Token到DAA,是从“烧了多少”走向“跑了多少”,算是向前迈出了一步。但关于“值多少”这个终极问题,目前整个行业尚未给出令人信服的答案。



