时间:26-04-24
中国电信广东公司与阿里云在韶关数据中心联合建设的智算集群已正式投入商用。该集群不仅是粤港澳大湾区首个基于阿里云“真武”专用芯片的万卡级智算设施,其规划更指向十万卡的远期规模。这标志着“超大规模智算集群”这一新型基础设施首次在大湾区实现完整落地。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
从技术自主的维度看,该项目实现了从底层芯片、云计算平台到上层模型应用的全栈自主研发。这并非简单的硬件集成,而是构建自主可控算力底座的关键示范工程。
集群的技术架构有何优势?其内部采用卡间RoCE高性能组网与双平面多轨通信技术,将端到端网络时延控制在4微秒以内,网络峰值利用率超过95%。这意味着数据在万级计算卡间传输的“高速公路”实现了极低延迟与超高效率,为千亿乃至万亿参数规模的AI训练提供了必需的通信基础。
核心硬件参数同样领先。“真武”芯片整机提供1.5T超大显存,卡间互联带宽突破700GB/s。这一配置直接瞄准下一代超大规模模型对内存容量与通信带宽的苛刻需求。
性能提升直接体现在效率上。相比传统单机部署,集群的单卡吞吐性能提升9.3倍,每秒Token生成总量提升近10倍。这种量级的效率跃升,能显著加速模型研发迭代,降低企业试错成本。
强大的硬件需配以易用的服务。集群提供从IaaS、PaaS到MaaS的全栈AI智算云化服务。这种一体化产品体系让用户能聚焦于模型开发而非基础设施运维。全栈优化使整体训练与推理效率提升超过30%。
在软件生态兼容性方面,集群已支持DeepSeek-V3.2满血版、Qwen3.5-397B-A17B等主流开源模型,支持单机快速部署。这为开发者与科研机构提供了无缝迁移现有工作流、快速利用先进算力的路径。
技术价值最终通过场景落地验证。目前集群已在多个行业展开应用,尤其在医疗领域,“全诊通”应用已在中山大学肿瘤防治中心等机构启动国产化迁移与试点,展现了先进算力在精准医疗与民生服务中的赋能潜力。
为促进算力普惠,集群资源已同步上架“广东电信算力超市”。企业可按卡或按小时灵活采购算力服务。这种零售化模式降低了中小团队使用尖端算力的门槛,有望进一步激活区域AI创新生态。