老黄可能开始焦虑了

2026-04-26阅读 305热度 305

其他

算力的地主，token 的租客

先来看看大洋彼岸的美国。

一组数据很能说明问题。根据EpochAI在4月14日发布的最新报告，亚马逊、谷歌、Meta、微软、甲骨文这五家美国超大规模云服务商，合计持有全球67%的AI算力（按H100等价口径折算）。要知道，在2024年第一季度，这个数字还是60%。短短十八个月，全球AI算力的集中度又提高了七个百分点，而且上升趋势丝毫没有放缓的迹象。

这五家公司有个有趣的共同点：它们基本都不亲自下场做最前沿的模型。

谷歌算是个例外，既有自研的TPU，也在力推自家的Gemini。但其余几家的核心身份，更像是“收租的地主”——微软通过Azure为OpenAI提供算力租赁；亚马逊用AWS和自研的Trainium芯片，将Anthropic牢牢绑定在身边；甲骨文则凭借“Stargate”项目，切入了OpenAI的基础设施版图；Meta虽然自研芯片，但主要用于内部，就在4月13日，它刚与博通签下了1GW的自研芯片订单。

那么，谁在租用这些庞大的算力呢？答案正是那些风光无限的前沿AI实验室。Anthropic刚宣布扩大与谷歌的TPU合作，未来几年将接入多GW级别的算力。OpenAI的骨干算力则来自微软Azure和甲骨文的Stargate项目。别忘了，OpenAI在2月刚完成1100亿美元融资，其中亚马逊投了500亿，软银投了300亿，英伟达也追加了300亿（这笔投资是从原本承诺的1000亿中“缩水”而来）。即便是自建集群的xAI，其芯片也依然要从英伟达采购。

所以，美国AI产业真实的权力结构，其实是这样的：5家算力地主 + 3家前沿模型租客 + 一个英伟达。外界常常以为OpenAI、Anthropic、xAI是舞台中央的主角，但实际上，它们是交租的一方。它们每完成一轮天价融资，大部分资金都流向了那五家地主——而后者，同时扮演着它们的投资人、供应商和谈判对手。

在这个结构里，英伟达看上去是最大的赢家。它坐拥2026财年约1150亿美元的数据中心收入，市值超过3万亿美元。但这个位置的脆弱性，恐怕没人比黄仁勋自己看得更清楚。

他在3月的摩根士丹利大会上宣布，英伟达投资OpenAI的300亿美元和投资Anthropic的100亿美元，大概率都是最后一笔了。颇具戏剧性的是，就在两个月前，他刚把100亿美元押给Anthropic，后者转身就加大了与谷歌TPU的合作——英伟达投出去的钱，某种程度上流回去帮助对手壮大了非英伟达的算力生态。

这背后是纯粹的商业逻辑：Anthropic不可能只依赖一家芯片供应商，分散风险是必然选择。而英伟达的客户结构本就高度集中——全球算力版图上，真正的大户就是那五家美国公司。加上中国市场，构成了它过去两年数据中心业务的核心收入池。然而，2025年4月之后的H20禁令，让中国市场这池水基本蒸发。剩下的五家美国客户，每一家都比英伟达更渴望向上游延伸：Meta在自研芯片，亚马逊有Trainium，谷歌有TPU，微软和甲骨文则押注OpenAI的自研Titan芯片。

一个卖铲子的人，面对的客户是五个正在自己造铲子的人。这就是英伟达在美国权力结构中的真实处境。

token 的工厂，没有业主也没有租客

视线转回中国，看到的则是另一番截然不同的景象。

中国前四大云厂商——阿里云、字节火山引擎、腾讯云、百度智能云——不约而同地在做两件事：一边售卖算力，一边研发自己的大模型。阿里云底座是通义千问，火山引擎支撑着豆包和Seedance，腾讯云背后是混元，百度智能云则倚仗文心一言。再加上对各类AI“新势力”错综复杂的投资，整个产业布局显得异常完备。

这就形成了一个独特的链条：中国的云厂商同时扮演了业主和租客——自己搭建算力、自己训练模型、自己消耗token，最终将token作为商品出售给下游企业。算力、模型、应用三层价值被同一家公司内部消化，整条价值链上，唯一能作为标准化商品对外出货的，就只剩下token。

阿里是这个模式的典型代表。其成立的ATH（阿里通义控股）公司，核心使命被CEO吴泳铭在内部备忘录中明确为：“创造Token、输送Token、应用Token。”值得注意的是，ATH成立后的一个月，成了阿里过去两年动作最密集的时期。

3月30日，阿里发布Qwen3.5-Omni，这是通义千问系列近年来首次从开源转向闭源。紧接着，Qwen 3.6 Plus在OpenRouter平台上以4.6万亿/周的调用量，登顶全球大模型周调用榜冠军，同系列的Preview版本也拿下了第三。随后，ATH又推出了最新的开放式世界模型产品Happy Oyster，研发效率之高，令人侧目。

然而，比ATH成立本身更具分量的一句话，出自吴泳铭在3月19日的财报电话会。他说：“企业在消耗Token时，不再将其视为IT预算，而是当作生产资料。” 这绝非简单的修辞变化。IT预算是成本项，是需要被优化的对象；而生产资料是投入项，是值得扩张的对象。一家万亿美金市值公司的CEO向华尔街宣告——token已经从“支出”变成了“投入”，从“IT科目”升维为“经济活动本身”。他给出的具体目标是：未来五年，阿里云和AI商业化年收入要冲击1000亿美元。按照新的token消耗算法，这1000亿美元甚至可以将电商业务产生的AI收入纳入其中。

在企业行动之前，监管层面早已为这场科技盛宴定下了基调。3月23日，国家数据局局长刘烈宏在中国发展高层论坛年会上，正式将token的中文译名定为“词元”，并称其为“智能时代的价值锚点”和“连接技术供给与商业需求的结算单位”。第二天，他在国新办发布会上公布了一组官方数字——中国日均词元调用量已突破140万亿，对比2024年初的1000亿，两年增长超过一千倍。

这是将token从技术概念抬升为经济统计指标的关键动作。其意义，堪比“流量”之于互联网时代。而OpenRouter平台为这套叙事提供了最坚实的数据支点：在2月9日至15日那一周，中国大模型的Token调用量首次超过美国，达到4.12万亿对2.94万亿。 到了4月初，中国模型的周调用量已达12.96万亿，美国模型为3.03万亿，中国已连续五周领先，全球调用量前六名全部是中国模型。MiniMax的M2.5发布后，七天调用量突破3.07万亿；Kimi的K2.5发布不到一个月，近20天累计收入已超过月之暗面2025年全年总收入；智谱GLM-5甚至在春节期间因流量爆单，公开“寻找算力合伙人”——这并非营销噱头，而是真实订单撑爆了产能。

算一下两边的结构差异就一目了然了。在美国那边，算力是核心资产，token只是算力消耗后的副产品。而在中国这边，情况完全反过来——token是核心商品，算力不过是生产token的原料。 定价逻辑、商业模式、公司估值、监管指标，全部围绕这两种不同的核心展开。

于是，一个有趣的图景出现了：大洋彼岸充满了算力，但token却源源不断地从大洋此岸产生。

老黄为什么焦虑

让我们回到Dwarkesh Patel的那场播客访谈。

黄仁勋在对话中反复使用一个框架——“五层蛋糕”。他认为AI产业分为五层：能源、芯片、系统、模型、应用。他强调美国必须在每一层都保持领先，否则就是败局。他提到中国是全球开源软件最大的贡献者，说这话时连用了两次“Fact”（事实）。他指出中国拥有全球一半的AI研究员，制造全球60%以上的主流芯片，还有大量满电空置的“幽灵数据中心”。他承认AI的大部分进步来自算法，而非硬件本身。最后，他抛出一句重磅判断——“如果DeepSeek的下一个版本首发在华&为芯片上，对美国来说是灾难。”

把这些话串联起来，意思已经非常清晰。他的焦虑并非源于“中国追上来”这种泛泛的宏观叙事，而是来自一个非常具体而尴尬的窘境——在美国那边，他正在失去议价权；在中国这边，他正在失去入场券。

在美国那边：5家超大规模云商拿走了全球67%的算力，它们既是英伟达最大的客户，也是最强的对手。每一家都在推进自研芯片——Meta刚签下1GW的博通订单，亚马逊的Trainium拿下了Anthropic，谷歌的TPU正在侵蚀英伟达的份额。当你的客户同时是你的对手，当你的市场集中到只剩五家主要买主，定价权就是一个被缓慢蚕食的过程。Anthropic在拿到英伟达100亿美元投资后，反手就加大与TPU的合作，这绝非偶然，而是趋势的缩影。

在中国这边：以token为核心的生态正在尝试绕过英伟达。DeepSeek V4蓄势待发，其训练和推理都跑在华&为昇腾950PR上。阿里、字节、腾讯为此批量下单了数十万片华&为芯片。通义千问、Kimi、MiniMax们每周产出数万亿token的模型，每多运行一天，华&为芯片的装机量和生态成熟度就增长一天。更严峻的是，这些模型的用户正在全球扩张——OpenRouter上中国模型连续五周调用量超过美国，MiniMax主打“1美元跑一小时AI数字员工”，Kimi的海外付费用户增速迅猛。当全球开发者的默认技术栈开始从英伟达向华&为切换时，英伟达在这条价值链上，可能连一个字都插不进去。

面对这两线困境，英伟达过去半年做了两件事，其动机都可以在这个框架下得到重新解读。

第一件事，亲自下场做原本不属于自己的产品。 在3月的GTC大会上，英伟达接连发布了Cosmos 3（世界基础模型）、Isaac GR00T N1.7（机器人）、Alpamayo 1.5（自动驾驶）、Nemotron（开源大模型家族）——一整套覆盖物理AI和前沿模型的软件栈。4月14日世界量子日，它又发布了Ising——开源的量子AI模型家族。黄仁勋亲自为其定性：“AI将成为控制面，成为量子机器的操作系统。” 这些密集发布传递的信号非常明确：英伟达不再满足于只做芯片供应商，它要涉足模型、操作系统、物理世界模拟器乃至量子计算的控制层。一个卖铲子的人开始自己挖矿，未必是因为贪心，更可能是因为原有的位置正在被两头的结构挤压。

第二件事，将公司的核心价值指标从“算力”迁移到“产出”。 “把电子变成token”这个比喻，他在访谈中使用了不下五次。他将英伟达形容为“全球每瓦生产token最多的架构”——注意，不是每瓦算力最多，而是每瓦token最多。一家将核心指标从“算力”改为“token”的公司，实质上已经承认了这个时代的硬通货究竟是什么。

然而，承认不等于解决。他手中的GPU，本质仍是生产算力的机器，而非直接生产token的机器。他在两个结构里所做的努力——在美国向上游扩张、试图用技术栈锁定开发者——都无法改变一个基本面：算力和token并不在同一个价值平面上。一家只生产算力的公司，无论怎样重新定义自己，都难以同时占据两种权力。

只做那个卖铲人，已经无法让英伟达高枕无忧了。

结语

AI时代的全球权力结构，已然清晰地分成了两半。

美国那边是“地产”模式——5家超大规模云商坐拥全球67%的算力土地，前沿AI实验室是它们的租客。在这个结构里，算力是硬资产，估值逻辑是“地皮面积 × 租金收益率”。中国这边是“工厂”模式——4家云厂商将算力、模型、应用压成一条高效流水线，token是唯一出厂的商品。在这个结构里，token是硬通货，估值逻辑是“产出量 × 单价”。

两种结构相互依存，却难以互相吞并。美国的算力地主无法直接进入中国的token工厂——监管壁垒、生态差异、开发者习惯都是障碍。中国的token工厂也无法直接替代美国的算力地主——最前沿的模型训练仍然需要顶级的硬件，华&为昇腾追赶速度再快，短期内也难以完全填补与顶级英伟达芯片的代际差距。两种权力各自运转，各自扩张，各自寻找出口。

黄仁勋和他的英伟达，正被夹在中间。他原本可能是这个时代最大的赢家——算力是上游，模型是下游，他为上下游同时供货，似乎是唯一的瓶颈。但这个瓶颈的位置正在从两端松动。在上游，5家地主开始自己造芯片；在下游，中国用国产芯片跑出了自成体系的token生态。向左扩张（投资OpenAI、Anthropic）未能牢牢守住下游生态，向右扩张（自研模型栈）尚未证明能守住技术栈的统治力。他一个人，两条战线，都面临着增长的困境。

他在播客里说，“必须有东西把电子变成token”。这句话既是在为英伟达的未来辩护，也无意中承认了一个事实：这个时代的硬通货早已不是电子，而是token。而目前生产token最密集的地方，并不在美国。

身处两种结构之间，英伟达正在失去那个曾经最舒适的位置。

老黄可能开始焦虑了

算力的地主，token 的租客

token 的工厂，没有业主也没有租客

老黄为什么焦虑

结语

相关阅读

最新教程

最新资讯