Uber采用亚马逊自研AI芯片 携手AWS升级核心出行业务
全球出行巨头Uber近日宣布了一项关键合作升级——扩大与亚马逊云科技(AWS)的协议,计划将派单算法、运力预测等核心网约车业务模块迁移至亚马逊自研AI芯片集群上运行。这不仅是服务扩容,更被业内视为一次战略性的“供应商替换”:Uber正在用AWS方案直接替代原有的Oracle和谷歌云服务。对亚马逊而言,这无疑是其自研芯片在ToB云服务市场拿下的又一个标杆客户,也进一步挑战了英伟达在AI加速硬件领域的绝对统治地位。
此次合作更新细节于2026年4月正式对外披露。根据公开信息,Uber首批迁移的业务聚焦在实时性要求最高的C端出行服务场景。首批上线的芯片集群算力规模已超过1200 PetaFLOPS,足以支撑其全球17个国家和地区的日常出行调度需求。
过去两年,AI算力需求爆发式增长,倒逼所有云服务巨头下场自研芯片。这背后是一箭双雕:既能摆脱对英伟达单一供应链的依赖,也能为客户提供更具成本效益的算力方案。亚马逊在此领域布局较早,2018年便启动自研项目,如今已迭代至第三代Inferentia推理芯片和第二代Trainium训练芯片。根据公开测试数据,其推理场景的单位算力成本相比英伟达A100降低了42%,能效比则提升了60%。
事实上,在Uber之前,Snap、Spotify等互联网公司已将部分AI业务迁移至亚马逊自研芯片。但Uber的加入意义不同——它是出行行业首个大规模采用该方案的头部企业,其示范效应更为显著。
对Uber而言,AI芯片性能直接关系到核心业务的用户体验和运营成本。实时派单算法需在毫秒内完成供需匹配;高峰时段运力预测要处理PB级历史出行数据;就连车内智能语音、安全识别等功能,也离不开海量推理算力支撑。
此前,Uber的AI算力由Oracle云和谷歌云共同分担,但始终面临两大痛点。其一,谷歌自身也在布局自动驾驶和出行业务,这让Uber对核心数据的安全性心存顾虑。其二,两家服务商的AI算力扩容成本高、交付周期长,难以匹配Uber在新兴市场快速扩张的业务节奏。而AWS提供的一体化“芯片+云服务”方案,据称能帮助Uber将核心业务的推理延迟降低23%,年度算力成本有望压缩近3亿美元。
Uber此次选择向市场释放了一个清晰信号:企业客户采购AI算力的逻辑正在发生根本转变。大家不再盲目“唯GPU论”,而是转向“场景优先”,不再愿意被单一供应商或单一硬件路线所绑定。
目前,这场由云厂商主导的“换芯”浪潮正在加速。除亚马逊外,谷歌的TPU、微软的雅典娜(Athena)芯片都在快速推进商业化落地,同时多家创业公司的专用AI芯片已进入测试阶段。行业预测显示,到2030年,云厂商自研芯片的市场份额将从2025年的约8%大幅提升至32%。英伟达一家独大的市场格局注定会被打破,而不同场景的AI应用也将因此获得更多元、更经济高效的算力支撑。