Anthropic获谷歌400亿美元投资,集齐三大云巨头加持
云巨头自研芯片战局升级:推理赛道成新焦点
最近行业里有个动向值得关注:AI发展的重心,正从训练向推理加速迁移。为了抓住这个趋势,几家超大规模云厂商不约而同地调整了芯片战略,自研动作频频,目标直指更高的性价比和更自主的算力掌控权。
谷歌云:发布首款推理专用芯片,性能能效双突破
先看谷歌云。他们最近亮出了首款专门为推理设计的芯片——TPU 8i。这款芯片的设计思路很明确:为推理场景做深度优化。具体怎么做的?一是把SRAM优化到了384MB,二是将通信链路减少到7级,同时还搭载了CAE引擎。这一套组合拳下来,效果立竿见影,实现了每美元性能提升80%,能效更是直接翻倍。别忘了他们的训练芯片TPU 8t,训练速度比前代提升了3倍,足以支撑起百万级规模的芯片集群。这架势,显然是训练和推理两手都要抓。
AWS与Meta:强化生态绑定,推动算力多元化
另一边,AWS的策略是强化现有芯片的推理能力。他们的Trainium 3芯片,单芯片就配备了144GB的高带宽内存,主打一个“训完即部署”的流畅体验,甚至被宣称为“全球最佳推理平台”。有意思的是,对于专门用于推理的Inferentia 3,他们这次反而没有多谈。生态合作方面,AWS收获了大单:Meta已经与其达成了价值数十亿美元的长期协议,重点采购192核的Gra viton 5 CPU,并成为了AWS的前五大客户之一。这背后,是Meta推动算力来源多元化、降低对单一供应商(尤其是英伟达)依赖的明确意图。
微软与Anthropic:算力军备竞赛下的资本联盟
微软的动作也不小。今年1月发布的Maia 200推理芯片,其FP4算力据称达到了AWS Trainium 3的3倍,并搭载了216GB的HBM3e内存,参数上相当亮眼。然而,比硬件竞赛更值得玩味的,是资本层面的合纵连横。AI公司Anthropic成了一个独特的焦点,它成为了唯一一家同时获得AWS、微软、谷歌三大云厂商投资的企业:谷歌投资了400亿美元(其中100亿即时到位,公司估值达3500亿,并提供5GW算力);亚马逊累计投资330亿美元(包含250亿追加投资,提供3GW算力);微软则联合英伟达投资了150亿美元(微软出资50亿,提供约1–1.5GW算力)。这不仅仅是财务投资,更是以算力承诺为形式的深度绑定,标志着云厂商之间的算力竞争格局已经全面升级。