Claude Code使用成本优化指南:2024年实测省token方案
连微软都用不起AI了?这听起来像是个玩笑,但最近的一则消息却让这个玩笑变得严肃起来。
有消息称,微软本周取消了内部的Claude Code授权。原因很简单:基于token的计费方式导致成本过高,高到连微软这样坐拥近乎无限云资源的巨头都觉得“肉疼”。
这释放出一个强烈的信号:AI的“补贴时代”或许正在走向终结。想想看,微软曾是OpenAI的130亿美元金主,也为Anthropic提供了大量的Azure云计算资源。如今,面对竞争对手Anthropic旗下Claude Code工具的账单,微软却选择了“断供”。
问题不在于产品本身。关键在于,按token计费的模式,让企业不得不直面大规模使用AI模型的真实成本。这个数字,远比早期采用固定费率试用时所想象的要高昂得多。
过去半年,Anthropic、OpenAI和Google都已悄然上调了实际价格。许多企业曾乐观地假设AI成本会持续下降,并据此大力构建各类AI工作流程。如今,真实的账单纷至沓来,结果便是年度预算在短短几个月内消耗殆尽。
今年4月,Uber的CTO在一份内部备忘录中透露,公司在四个月内就烧光了为2026年准备的全年AI预算,主要原因正是Claude Code在其内部各工程团队中被广泛采用。
数据显示,美国AI软件价格在过去一年上涨了20%至37%。与此同时,微软旗下的GitHub也正在其所有产品中取消固定费率方案,全面转向按用量计费。
市场正面临一个两难选择:要么企业为了控制预算而大幅削减AI使用,这将直接拖慢各大AI实验室的收入增长,进而影响其高估值和IPO计划;要么AI实验室继续降价补贴,自行承担损失,但这会在最糟糕的时机进一步恶化其单位经济效益。
无论选择哪条路,最终结果似乎都指向同一个方向:盈利能力下降,总有人需要承担减值损失。
微软取消Claude Code,另有隐情
然而,事情或许没那么简单。如果仔细审视,微软此次“痛下杀手”,全面“砍掉”Claude Code许可证,恐怕不仅仅是因为“用不起”。背后还有一个更深层的原因:如果再不加以控制,自家产品GitHub Copilot CLI的市场,恐怕真要被竞争对手Anthropic的Claude Code给“偷家”了。
GitHub Copilot CLI是GitHub Copilot的命令行版本,允许在Visual Studio Code等开发环境之外使用。
去年12月,微软向数千名内部开发者开放了Claude Code的使用权限。初衷本是鼓励项目经理、设计师等非技术员工尝试低门槛的编程原型开发。同时,也藏着一个“小心思”:将其作为与自家Copilot进行基准测试的参照物,并收集反馈。
据报道,微软Experiences + Devices集团执行副总裁Rajesh Jha在一份内部备忘录中写道:“当我们开始同时提供Copilot CLI和Claude Code时,目标是快速学习、在真实工程工作流中对这些工具进行基准测试,并了解什么最能支持我们的团队。Claude Code是这一学习过程中的重要组成部分。而Copilot CLI则给了我们一个尤其重要的东西:这是一款我们可以直接与GitHub共同塑造的产品,能够更好地适配微软的代码仓库、工作流、安全预期和工程需求。”
但出乎意料的是,在过去六个月里,Claude Code在微软内部大受欢迎,风头甚至一度盖过了自家的GitHub Copilot CLI。有报道称,在开放Claude Code之前,微软91%的工程团队都在使用GitHub Copilot。如今,这一高频使用率显然遭到了“严重蚕食”。
如此一来,即便为了挽回局面,微软也得“引导”员工回归GitHub Copilot CLI。
据悉,为了在6月底前逐步停用Claude Code,微软正鼓励工程师在未来几周内将工作流迁移至GitHub Copilot CLI。但这并非易事。一方面,过去几个月工程师们对Claude Code的偏好形成了不小的“戒断”阻力;另一方面,两款产品之间仍存在明显差距。为此,有知情人士透露,微软正在加大对GitHub团队的督促力度,要求其在6月底前,根据内部员工的错误报告和反馈,快速对Copilot CLI进行迭代升级。
甚至有传言称,微软近几个月曾考虑收购代码编辑器Cursor以补足GitHub Copilot的短板,后来或许是为了避免潜在的监管审查,转而开始关注其他小型AI初创公司。
综合来看,为了让内部工程师顺利完成过渡,压力已经给到了GitHub团队。他们需要在短时间内改进Copilot CLI,使其达到甚至超越Claude Code的水平。
Claude Code推出Token用量追踪
就在微软内部变动之际,Claude Code团队也有了新动作。团队成员Boris Cherny在社交媒体上发布更新公告称,在Claude Code的下一个版本中,将新增 /usage 命令。
用户可以直接查看各类组件(如Skills、Agents、MCPs和插件)的token使用明细。目前CLI版本已经支持该功能,桌面版也将很快推出。
这个功能不仅能显示当前会话的消耗,还支持聚合所有会话的数据,并可按天或周进行筛选。更重要的是,它能将下游产生的token正确归因到对应的技能或插件上。
此前,许多用户反馈不清楚具体是哪个技能或MCP在消耗token。这一功能提供了亟需的透明度,有助于用户优化提示词、禁用非必要工具、从而有效控制成本,对于重度用户和团队管理而言尤其实用。
巨头成本压力下的战略收索,与工具自身在成本透明度上的进化,同时发生。这或许标志着AI工具的应用正从狂热试用期,进入一个更理性、更注重投资回报率的务实新阶段。



