老黄可能开始焦虑了

2026-04-26阅读 305热度 305
其他

算力的地主,token 的租客

先来看看大洋彼岸的美国。

一组数据很能说明问题。根据EpochAI在4月14日发布的最新报告,亚马逊、谷歌、Meta、微软、甲骨文这五家美国超大规模云服务商,合计持有全球67%的AI算力(按H100等价口径折算)。要知道,在2024年第一季度,这个数字还是60%。短短十八个月,全球AI算力的集中度又提高了七个百分点,而且上升趋势丝毫没有放缓的迹象。

这五家公司有个有趣的共同点:它们基本都不亲自下场做最前沿的模型。

谷歌算是个例外,既有自研的TPU,也在力推自家的Gemini。但其余几家的核心身份,更像是“收租的地主”——微软通过Azure为OpenAI提供算力租赁;亚马逊用AWS和自研的Trainium芯片,将Anthropic牢牢绑定在身边;甲骨文则凭借“Stargate”项目,切入了OpenAI的基础设施版图;Meta虽然自研芯片,但主要用于内部,就在4月13日,它刚与博通签下了1GW的自研芯片订单。

那么,谁在租用这些庞大的算力呢?答案正是那些风光无限的前沿AI实验室。Anthropic刚宣布扩大与谷歌的TPU合作,未来几年将接入多GW级别的算力。OpenAI的骨干算力则来自微软Azure和甲骨文的Stargate项目。别忘了,OpenAI在2月刚完成1100亿美元融资,其中亚马逊投了500亿,软银投了300亿,英伟达也追加了300亿(这笔投资是从原本承诺的1000亿中“缩水”而来)。即便是自建集群的xAI,其芯片也依然要从英伟达采购。

所以,美国AI产业真实的权力结构,其实是这样的:5家算力地主 + 3家前沿模型租客 + 一个英伟达。外界常常以为OpenAI、Anthropic、xAI是舞台中央的主角,但实际上,它们是交租的一方。它们每完成一轮天价融资,大部分资金都流向了那五家地主——而后者,同时扮演着它们的投资人、供应商和谈判对手。

在这个结构里,英伟达看上去是最大的赢家。它坐拥2026财年约1150亿美元的数据中心收入,市值超过3万亿美元。但这个位置的脆弱性,恐怕没人比黄仁勋自己看得更清楚。

他在3月的摩根士丹利大会上宣布,英伟达投资OpenAI的300亿美元和投资Anthropic的100亿美元,大概率都是最后一笔了。颇具戏剧性的是,就在两个月前,他刚把100亿美元押给Anthropic,后者转身就加大了与谷歌TPU的合作——英伟达投出去的钱,某种程度上流回去帮助对手壮大了非英伟达的算力生态。

这背后是纯粹的商业逻辑:Anthropic不可能只依赖一家芯片供应商,分散风险是必然选择。而英伟达的客户结构本就高度集中——全球算力版图上,真正的大户就是那五家美国公司。加上中国市场,构成了它过去两年数据中心业务的核心收入池。然而,2025年4月之后的H20禁令,让中国市场这池水基本蒸发。剩下的五家美国客户,每一家都比英伟达更渴望向上游延伸:Meta在自研芯片,亚马逊有Trainium,谷歌有TPU,微软和甲骨文则押注OpenAI的自研Titan芯片。

一个卖铲子的人,面对的客户是五个正在自己造铲子的人。这就是英伟达在美国权力结构中的真实处境。

token 的工厂,没有业主也没有租客

视线转回中国,看到的则是另一番截然不同的景象。

中国前四大云厂商——阿里云、字节火山引擎、腾讯云、百度智能云——不约而同地在做两件事:一边售卖算力,一边研发自己的大模型。阿里云底座是通义千问,火山引擎支撑着豆包和Seedance,腾讯云背后是混元,百度智能云则倚仗文心一言。再加上对各类AI“新势力”错综复杂的投资,整个产业布局显得异常完备。

这就形成了一个独特的链条:中国的云厂商同时扮演了业主和租客——自己搭建算力、自己训练模型、自己消耗token,最终将token作为商品出售给下游企业。算力、模型、应用三层价值被同一家公司内部消化,整条价值链上,唯一能作为标准化商品对外出货的,就只剩下token

阿里是这个模式的典型代表。其成立的ATH(阿里通义控股)公司,核心使命被CEO吴泳铭在内部备忘录中明确为:“创造Token、输送Token、应用Token。”值得注意的是,ATH成立后的一个月,成了阿里过去两年动作最密集的时期。

3月30日,阿里发布Qwen3.5-Omni,这是通义千问系列近年来首次从开源转向闭源。紧接着,Qwen 3.6 Plus在OpenRouter平台上以4.6万亿/周的调用量,登顶全球大模型周调用榜冠军,同系列的Preview版本也拿下了第三。随后,ATH又推出了最新的开放式世界模型产品Happy Oyster,研发效率之高,令人侧目。

然而,比ATH成立本身更具分量的一句话,出自吴泳铭在3月19日的财报电话会。他说:“企业在消耗Token时,不再将其视为IT预算,而是当作生产资料。” 这绝非简单的修辞变化。IT预算是成本项,是需要被优化的对象;而生产资料是投入项,是值得扩张的对象。一家万亿美金市值公司的CEO向华尔街宣告——token已经从“支出”变成了“投入”,从“IT科目”升维为“经济活动本身”。他给出的具体目标是:未来五年,阿里云和AI商业化年收入要冲击1000亿美元。按照新的token消耗算法,这1000亿美元甚至可以将电商业务产生的AI收入纳入其中。

在企业行动之前,监管层面早已为这场科技盛宴定下了基调。3月23日,国家数据局局长刘烈宏在中国发展高层论坛年会上,正式将token的中文译名定为“词元”,并称其为“智能时代的价值锚点”和“连接技术供给与商业需求的结算单位”。第二天,他在国新办发布会上公布了一组官方数字——中国日均词元调用量已突破140万亿,对比2024年初的1000亿,两年增长超过一千倍。

这是将token从技术概念抬升为经济统计指标的关键动作。其意义,堪比“流量”之于互联网时代。而OpenRouter平台为这套叙事提供了最坚实的数据支点:在2月9日至15日那一周,中国大模型的Token调用量首次超过美国,达到4.12万亿对2.94万亿。 到了4月初,中国模型的周调用量已达12.96万亿,美国模型为3.03万亿,中国已连续五周领先,全球调用量前六名全部是中国模型。MiniMax的M2.5发布后,七天调用量突破3.07万亿;Kimi的K2.5发布不到一个月,近20天累计收入已超过月之暗面2025年全年总收入;智谱GLM-5甚至在春节期间因流量爆单,公开“寻找算力合伙人”——这并非营销噱头,而是真实订单撑爆了产能。

算一下两边的结构差异就一目了然了。在美国那边,算力是核心资产,token只是算力消耗后的副产品。而在中国这边,情况完全反过来——token是核心商品,算力不过是生产token的原料。 定价逻辑、商业模式、公司估值、监管指标,全部围绕这两种不同的核心展开。

于是,一个有趣的图景出现了:大洋彼岸充满了算力,但token却源源不断地从大洋此岸产生。

老黄为什么焦虑

让我们回到Dwarkesh Patel的那场播客访谈。

黄仁勋在对话中反复使用一个框架——“五层蛋糕”。他认为AI产业分为五层:能源、芯片、系统、模型、应用。他强调美国必须在每一层都保持领先,否则就是败局。他提到中国是全球开源软件最大的贡献者,说这话时连用了两次“Fact”(事实)。他指出中国拥有全球一半的AI研究员,制造全球60%以上的主流芯片,还有大量满电空置的“幽灵数据中心”。他承认AI的大部分进步来自算法,而非硬件本身。最后,他抛出一句重磅判断——“如果DeepSeek的下一个版本首发在华&为芯片上,对美国来说是灾难。”

把这些话串联起来,意思已经非常清晰。他的焦虑并非源于“中国追上来”这种泛泛的宏观叙事,而是来自一个非常具体而尴尬的窘境——在美国那边,他正在失去议价权;在中国这边,他正在失去入场券。

在美国那边:5家超大规模云商拿走了全球67%的算力,它们既是英伟达最大的客户,也是最强的对手。每一家都在推进自研芯片——Meta刚签下1GW的博通订单,亚马逊的Trainium拿下了Anthropic,谷歌的TPU正在侵蚀英伟达的份额。当你的客户同时是你的对手,当你的市场集中到只剩五家主要买主,定价权就是一个被缓慢蚕食的过程。Anthropic在拿到英伟达100亿美元投资后,反手就加大与TPU的合作,这绝非偶然,而是趋势的缩影。

在中国这边:以token为核心的生态正在尝试绕过英伟达。DeepSeek V4蓄势待发,其训练和推理都跑在华&为昇腾950PR上。阿里、字节、腾讯为此批量下单了数十万片华&为芯片。通义千问、Kimi、MiniMax们每周产出数万亿token的模型,每多运行一天,华&为芯片的装机量和生态成熟度就增长一天。更严峻的是,这些模型的用户正在全球扩张——OpenRouter上中国模型连续五周调用量超过美国,MiniMax主打“1美元跑一小时AI数字员工”,Kimi的海外付费用户增速迅猛。当全球开发者的默认技术栈开始从英伟达向华&为切换时,英伟达在这条价值链上,可能连一个字都插不进去。

面对这两线困境,英伟达过去半年做了两件事,其动机都可以在这个框架下得到重新解读。

第一件事,亲自下场做原本不属于自己的产品。 在3月的GTC大会上,英伟达接连发布了Cosmos 3(世界基础模型)、Isaac GR00T N1.7(机器人)、Alpamayo 1.5(自动驾驶)、Nemotron(开源大模型家族)——一整套覆盖物理AI和前沿模型的软件栈。4月14日世界量子日,它又发布了Ising——开源的量子AI模型家族。黄仁勋亲自为其定性:“AI将成为控制面,成为量子机器的操作系统。” 这些密集发布传递的信号非常明确:英伟达不再满足于只做芯片供应商,它要涉足模型、操作系统、物理世界模拟器乃至量子计算的控制层。一个卖铲子的人开始自己挖矿,未必是因为贪心,更可能是因为原有的位置正在被两头的结构挤压。

第二件事,将公司的核心价值指标从“算力”迁移到“产出”。 “把电子变成token”这个比喻,他在访谈中使用了不下五次。他将英伟达形容为“全球每瓦生产token最多的架构”——注意,不是每瓦算力最多,而是每瓦token最多。一家将核心指标从“算力”改为“token”的公司,实质上已经承认了这个时代的硬通货究竟是什么。

然而,承认不等于解决。他手中的GPU,本质仍是生产算力的机器,而非直接生产token的机器。他在两个结构里所做的努力——在美国向上游扩张、试图用技术栈锁定开发者——都无法改变一个基本面:算力和token并不在同一个价值平面上。一家只生产算力的公司,无论怎样重新定义自己,都难以同时占据两种权力。

只做那个卖铲人,已经无法让英伟达高枕无忧了。

结语

AI时代的全球权力结构,已然清晰地分成了两半。

美国那边是“地产”模式——5家超大规模云商坐拥全球67%的算力土地,前沿AI实验室是它们的租客。在这个结构里,算力是硬资产,估值逻辑是“地皮面积 × 租金收益率”。中国这边是“工厂”模式——4家云厂商将算力、模型、应用压成一条高效流水线,token是唯一出厂的商品。在这个结构里,token是硬通货,估值逻辑是“产出量 × 单价”。

两种结构相互依存,却难以互相吞并。美国的算力地主无法直接进入中国的token工厂——监管壁垒、生态差异、开发者习惯都是障碍。中国的token工厂也无法直接替代美国的算力地主——最前沿的模型训练仍然需要顶级的硬件,华&为昇腾追赶速度再快,短期内也难以完全填补与顶级英伟达芯片的代际差距。两种权力各自运转,各自扩张,各自寻找出口。

黄仁勋和他的英伟达,正被夹在中间。他原本可能是这个时代最大的赢家——算力是上游,模型是下游,他为上下游同时供货,似乎是唯一的瓶颈。但这个瓶颈的位置正在从两端松动。在上游,5家地主开始自己造芯片;在下游,中国用国产芯片跑出了自成体系的token生态。向左扩张(投资OpenAI、Anthropic)未能牢牢守住下游生态,向右扩张(自研模型栈)尚未证明能守住技术栈的统治力。他一个人,两条战线,都面临着增长的困境。

他在播客里说,“必须有东西把电子变成token”。这句话既是在为英伟达的未来辩护,也无意中承认了一个事实:这个时代的硬通货早已不是电子,而是token。而目前生产token最密集的地方,并不在美国。

身处两种结构之间,英伟达正在失去那个曾经最舒适的位置。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策