HCCL同交换机下2机与4机性能对比测试

2026-06-23阅读 0热度 0
其他

910B基于单轨接入架构,单机HCCL测试实质上是衡量机内HCCS的带宽与延迟,仅反映单级内部通信性能。一旦扩展至多机集群,必须借助ROCE交换机实现跨机互联,而实际训练和推理的吞吐瓶颈正集中在跨机通信环节。

以下是单机测试结果:

mpirun -f hostfile.2 -n 16 ./bin/all_reduce_test -p 8 -b 1G -e 1G

扩展至四机互联的测试配置:

mpirun -f hostfile.4 -n 32 ./bin/all_reduce_test -p 8 -b 1G -e 1G

实际测得四机互联后HCCL带宽显著下滑,验证了此前判断:跨机互连依赖的ROCE网络,正是制约整体性能的核心瓶颈。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策