华尔街激辩AI Token经济学:成本飙升还是可控增长?

2026-06-14阅读 0热度 0
华尔街

一张图表,正成为全球资本市场审视AI产业健康度的关键压力计。

由Silicon Data编制的这张图表,追踪大语言模型每百万Token的加权平均支出价格。其曲线动态,已成为衡量“市场为AI单位能力支付多少溢价”的核心晴雨表,直接牵引着从芯片、存储到云服务的整条产业链资本预期。

Token指数图

截至6月11日的数据显示,该指数已连续7个交易日下行,创下2026年1月以来的最长连跌周期;过去12个交易日中,有11天呈现跌势。值得注意的是,自2025年12月以来,该指数曾在一轮强劲上涨中累计翻倍,直至近期出现明确的技术性拐点。

这一信号的价值何在?美国宏观策略师Andreas Steno Larsen在6月9日将其称为“当前全球资本市场最值得紧盯的单一指标”。他警告称,若Token定价疲软趋势延续,则本轮从内存芯片延伸至更广泛AI硬件与基础设施的投资周期,可能面临提前收缩的风险。

当然,市场解读远未统一。一个核心分歧点在于:Token价格走弱,是否直接等同于AI需求见顶?答案比表面现象更为复杂。

01 指数下滑等同需求触顶?解码图表背后的真实信号

该图表绝非“AI热潮退却”的简单信号。它衡量的并非Token使用总量或企业AI支出总额,而是聚焦于每百万Token的加权平均成交价格。本质上,它揭示的是用户在调用AI能力时,对不同性能层级的模型所愿意支付的实际对价。

一个简化的例子可以清晰说明:假设顶级前沿模型的定价为每百万Token 10美元,而一款轻量级模型的定价仅为1美元。如果某月所有Token用量均来自前沿模型,那么指数就是10。到了下一个月,总用量翻倍,但新增部分全部由廉价模型处理批量任务,指数将骤降至5.5。

用量翻倍,指数腰斩。可见,指数下滑背后至少存在两种归因:一是真实AI需求萎缩;二是用量激增,但用户正主动、成规模地向成本更优的模型迁移

这正是当前市场辩论的焦点:价格回落,究竟是AI增长周期的拐点,还是规模化应用阶段结构性成本优化的必然结果?Citadel证券在其《Tokenomics》报告中明确指出,AI商业化的核心瓶颈已从“模型性能上限”转向“成本效率与资源稀缺性”,用户正加速拥抱更高性价比的方案。

摩根大通的TMT分析师Mark Schilsky则一语中的:“AI账单正在失控。”但他同时强调,当前的支出波动,可能只是通往更高总量支出道路上一次必要的成本结构优化。

分析

02 Citadel研判:成本效率与物理约束成为新标尺

关于这场结构性迁移,Citadel证券的《Tokenomics》报告提供了清晰的框架。

其核心论点明确:驱动AI规模化应用的核心变量,已由“模型能力”切换至“成本结构”与“资源稀缺性”。报告指出,技术规模化的关键,不再取决于前沿模型的理论能力,而在于支撑AI运行的实际投入品——算力、电力、散热、内存带宽与推理预算——其自身的价格与供给刚性。

报告援引基础经济学原理:价格承担着传递稀缺信号、激发替代方案、引导资源流向高价值用途三大功能。这三重机制正在AI产业内同步生效。结论指向一个深刻的行业转变:未来的超额回报,将更多来自“降本增效型”企业,而非单纯追逐参数规模的玩家。

当然,前沿推理模型不会消失,它们将日益集中于少数资金雄厚、研发积淀深厚、并能将复杂问题转化为规模收益的头部机构。但对于更广泛的实体经济应用而言,在物理层瓶颈(如芯片制程、供电密度、冷却效率)取得根本性突破前,轻量化、本地化、高性价比的模型,往往更具实操价值与生产力。

成本逻辑

03 低价模型如何重塑企业AI账单

现实数据为这一趋势提供了佐证。高盛One-Delta部门负责人Rich Privorotsky曾指出,像DeepSeek等模型的降价幅度高达75%,小米MiMo的价格下降更接近99%。基础设施供应的改善正迅速催化价格竞争。

Coinbase首席执行官Brian Armstrong预测,未来12至18个月内,约80%的AI工作负载将迁移至成本降低99%的模型。仅有20%对极致智能有硬性需求的关键任务,才需继续依赖前沿模型。

Hugging Face首席执行官Clement Delangue援引斯坦福研究数据称,本地部署的模型在真实场景查询中的准确率已达71.3%,而其边际成本趋近于零。

这一切正与Citadel的判断形成共振。前沿AI的门槛将持续抬高。未来的赢家,将是那些能将高价值任务精准匹配至高成本模型、同时将海量常规任务高效分流至低成本路径的企业。由此,一个清晰分层的AI应用生态正在确立:

  • 高价值、强定制、高容错任务 → 前沿云端模型
  • 标准化、批处理、低投资回报率(ROI)的实验性任务 → 轻量模型或端侧本地模型

04 摩根大通:账单优化不等于需求触顶

与部分市场担忧情绪不同,摩根大通持有更乐观的视角。他们认为,当前的AI支出焦虑,更像是市场渗透初期的自然“校准”过程;拉长时间维度,一年后的Token总支出,极有可能迎来新一轮跃升。

背后的逻辑清晰:如果每百万Token的均价在下降,但美国企业的AI付费渗透率仍在快速提升,那么,总用量就必须以更快的速度增长才能支撑这一趋势。换言之,“单价走低”与“总量爆发”在未来可以并行不悖。

在企业内部,这种双轨制同样明显。已深度应用AI的公司正精细化管控Token预算,削减冗余消耗;而尚未全面启用的组织,则因模型门槛降低、部署更便捷,正在加速入场。

另一关键驱动来自智能体(Agent)架构的演进,它将进一步放大Token消耗。过去一个任务可能只需单次API调用,现在则可能被拆解为多步规划、工具调用、上下文检索与反复验证,单任务Token用量显著上升。市场案例显示,有中小企业在业务实现Agent化后,单任务Token消耗增至原来的3.5倍。

因此,市场真正的博弈点,或许并非“Token用量是否会增长”,而在于支撑这种增长的单位经济学是否可持续,背后是否有扎实的商业回报作为支撑。

逻辑推演

05 企业端:精细化账单管理已成运营刚需

对压力最直接、最早的感知,往往不在技术图表上,而在企业的财务明细中。

Axios曾援引一位AI咨询顾问的披露,其某客户仅在Claude平台上的月开支就高达5亿美元,原因竟是公司未对员工调用量设置任何阈值。内部考核机制也曾催生副作用。此前,一些美国公司将AI调用量设为KPI或内部排名依据,引发了“Tokenmaxxing”行为——员工为刷高指标,频繁调用AI执行无实质产出的任务。

亚马逊有过类似教训。其开发者平台Kiro曾上线内部排行榜“Kirorank”。亚马逊高级副总裁Dave Treadwell坦承,有员工为冲榜让AI处理大量无效请求,徒增成本。他随后公开呼吁“不要为了用AI而用AI”,该测试版仪表盘很快下线。亚马逊转而采用“归一化部署率”作为新指标,重点评估AI生成代码的实际交付质量与业务价值,而非单纯统计Token消耗。类似现象在Meta内部也曾短暂出现。

这些调整释放出明确信号:企业并非在放弃AI,而是开始严格区分“有效Token”与“无效Token”。摩根大通指出,像Cloudflare推出的AI Gateway这类工具,核心目标正是帮助企业实施Token预算管控。而OpenRouter等跨模型路由平台的长期价值,也在于实现多种模型间成本最优的调度。

与此同时,定价模式也在同步演进。

6月1日,GitHub Copilot正式从按请求计费转向按Token用量计费。 Reddit社区有用户测算,这一变动可能导致其月度费用从不足45美元飙升至超过847美元。GitHub首席产品官Mario Rodriguez此前表示,随着智能体AI普及,传统订阅制已难以覆盖真实算力成本。

Gartner分析师Arun Chandrasekaran向Business Insider透露,随着高级推理模型持续推高算力需求,越来越多的企业将转向按实际用量付费模式。这意味着,过去被固定订阅费、内部补贴或免费额度掩盖的真实成本,正被系统性地置于企业财务体系的审视之下。

06 多空交锋:AI硬件投资逻辑面临重构?

这场围绕Token价格的辩论,其终极落点在于AI基础设施领域的投资范式是否面临根本性重构。

看多派的依据扎实。高盛的Jim Schneider测算,到2030年,由智能体驱动的AI将推动Token总消耗量增长24倍,云服务商的毛利率有望借此在短期内转正。摩根大通的Mark Schilsky也强调,短期的支出波动难以撼动长期的增长底层逻辑。

然而,看空派提出了有力的警示。高盛半导体分析师Jim Covello指出,当前产业链的繁荣建立在上游资源透支之上,几乎全部利润流向芯片设计与制造环节,这种失衡状态难以持续。投资人Tommy Shaughnessy警告,AI巨头普遍还处于深度亏损中,一旦企业直面按量计费的真实账单,支撑GPU采购与模型训练的那套资本循环可能被逆转。

近期,多位重量级人物的言论表达了相似忧虑。Anthropic的CEO Dario Amodei、博通总裁Hock Tan,甚至《大空头》原型Steve Eisman都提及,企业当前存在“AI过度支出”或“Token最大化”倾向。随着企业成本意识觉醒和计费方式转变,未来的投资决策将更加聚焦于真实的投资回报率(ROI)。

在社交平台,对该图表叙事框架的质疑一直存在。有用户指出:“去年AI采用高峰期,六日连跌就出现过四次”;“模型越便宜,部署速度反而越快,因为准入门槛被大幅降低。”也有人反驳:“不管模型变得多廉价,每次新一代模型的发布,都会带来指数级的Token消耗增长。”

社交评论
反驳观点

目前,这场辩论远未结束。但一个共识已然浮现:Token支出的边际变化,正通过“GPU算力需求→DRAM采购节奏→数据中心扩容计划”这条紧密的传导链,直接影响着英伟达、存储芯片厂商及云服务巨头的资本开支预期。这张图表,已从技术指标蜕变为投资者每日必读的关键市场信号,它指向的不只是代码价格,更是一个产业变迁的十字路口。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策