HPE AI网络产品组合深度评测:GPU利用率提升
HPE大幅扩展AI网络产品组合,新增基于Juniper的全新交换系列,旨在将Juniper技术更深层嵌入AI数据中心方案,同时增强自动化功能,核心目标直指提升昂贵AI基础设施的实际利用率。
该发布在HPE Discover 2026大会上正式揭晓,是HPE持续推进Juniper Networks融入统一AI基础设施的最新一步,涵盖数据中心网络到运营、安全及企业互联全场景。
网络深度整合至AI基础设施体系
本次发布的核心在于:将HPE Juniper Networking QFX交换机纳入HPE AI数据中心解决方案,并通过HPE Networking Data Center Director实现统一管理。此举将Juniper的数据中心网络产品更紧密地嵌入HPE已有AI基础设施体系——该体系已覆盖计算、存储、网络、软件和服务等完整栈。
在HPE Discover大会上,HPE网络业务执行副总裁兼总裁Rami Rahim向媒体坦言,网络已成为决定AI基础设施经济性的关键变量。
“行业已经认识到,一旦网络出现拥塞或可靠性问题,那些耗资数亿乃至数十亿美元的GPU,实际利用率可能仅剩75%、50%甚至25%,”Rahim强调,“网络实际上已成为大规模AI数据中心投资的倍增器。”
云服务商Vultr的CEO J.J. Kardwell对此深表认同。他指出,随着AI集群规模持续膨胀,网络的战略地位愈发突出。“由于这些系统独特的架构需求,网络的影响力前所未有。”他在HPE Discover媒体简报会上表示。
Kardwell进一步阐明,挑战已不仅仅局限于单台GPU服务器,而是延伸到连接机架、集群和数据中心的整个网络层次。“机柜之间以及集群内部的网络,已经成为支撑大规模训练和推理工作负载的关键瓶颈。”
网络与AI基础设施的经济逻辑
Dell'Oro Group副总裁Sameh Boujelbene同样看得清晰:运营商正全力将昂贵的计算投入转化为实际生产系统,网络成为衡量AI基础设施经济性的核心标尺。
“AI基础设施的竞争早已不限于GPU,”Boujelbene对Data Center Knowledge表示,“这是一场系统级竞争,而网络正成为决定谁能将原始算力高效、盈利地转化为可用智能的核心经济杠杆。”
本次发布的新产品覆盖AI训练集群、推理环境、数据中心互联及边缘部署,映射出市场对支撑完整AI生命周期的网络架构需求正持续攀升。
具体而言,HPE还推出了两款全新AI网络产品:HPE Juniper Networking QFX5140交换机,面向推理集群和边缘AI部署;新款QFX5252交换机托盘,专为AMD Helios机架级AI平台设计。HPE表示,这两款产品的核心目标均是降低网络延迟,避免GPU因等待数据而空转,从而提升整体AI基础设施的实际利用效率。
Rahim指出,收购Juniper使HPE具备了同时应对横向扩展与纵向扩展两种AI网络架构的能力。他表示,在Juniper原有深耕路由和横向扩展网络的基础上,与HPE计算系统的深度集成加速了纵向扩展技术的研发——例如当前在AMD Helios中部署的相关技术。
Mist与Marvis能力全面延伸
HPE还将Juniper的Mist平台进一步扩展至Aruba现有用户群。
具体来说,HPE宣布HPE Networking CX交换机将在Mist平台上获得支持,提供AI驱动的可见性、自动故障排查、服务水平洞察及Marvis AI操作功能。与此同时,HPE将Marvis自动驾驶能力引入Aruba Central,涵盖有线端口故障排查等自动化修复功能。
Mist平台新增的能力还包括:针对光模块及系统故障的预测性分析,以及一个AI推理引擎——用于整合运营遥测数据、支持案例和网络数据,加速根因分析与故障修复。
Rahim表示,在已部署自动驾驶模式的环境中,超过80%的网络故障现已实现自动修复,或能在故障发生时即时向运营人员提供根因信息。
Kardwell指出,AI基础设施日益复杂,使得自动化运营的价值愈发凸显。“故障和停机的代价无法承受,自愈能力至关重要。”他说。
安全与运营的深度融合
HPE还拓展了网络与基础设施管理平台之间的集成。HPE Mist Networking数据中心保障功能现已与HPE Compute Ops Management及GreenLake平台集成,为运营人员提供网络与计算基础设施的统一视图。
在安全领域,HPE发布了统一的安全访问服务边缘(SASE)平台,通过单一管理控制台整合SD-WAN与安全服务边缘能力。该平台基于HPE Networking EdgeConnect构建,融入零信任访问控制和AI辅助运营功能,旨在简化安全与网络管理。
对于完成收购以来的进展,Rahim表示团队整合速度之快令他感到意外。
“我原本以为有些事会非常棘手,比如整合团队、让大家产生归属感、在产品路线图上做出艰难决策等,但实际上这些都比我预想的要顺利得多。”他说。
Q&A
Q1:HPE推出的QFX5140和QFX5252交换机分别适用于哪些场景?
A:QFX5140交换机主要面向推理集群和边缘AI部署;QFX5252交换机托盘则专为AMD Helios机架级AI平台设计。两款产品的核心目标都是减少网络延迟,避免GPU因等待数据而空转,从而提升整体AI基础设施的利用效率。
Q2:网络质量如何影响GPU利用率?
A:据HPE网络业务负责人Rami Rahim介绍,一旦网络出现拥塞或可靠性问题,GPU的实际利用率可能从理论峰值骤降至75%、50%甚至25%。这意味着企业花费数亿乃至数十亿美元购置的GPU算力会被大量浪费,因此网络质量直接决定了AI基础设施投资的回报效率。
Q3:HPE的Marvis自动驾驶能力能解决哪些网络运维痛点?
A:Marvis自动驾驶能力已被引入Aruba Central平台,支持有线端口故障排查等自动化修复功能。据HPE数据,在已部署自动驾驶模式的环境中,超过80%的网络故障可实现自动修复,或在故障发生时即时向运营人员推送根因分析结果,大幅降低人工介入成本和故障处理时间。
