2024年腾讯混元Hy3 preview适配评测:海光DCU性能表现与优化指南
海光信息5月8日披露,其深算3号DCU已完成与腾讯开源大模型混元Hy3 preview的全面适配与联合优化。此次国产高性能计算芯片与前沿大语言模型的深度协同,为AI基础设施的自主可控与高效部署提供了关键验证。
技术资料显示,腾讯混元Hy3 preview采用快慢思考融合的混合专家架构,具备295B总参数与21B激活参数,在维持强大模型容量的同时优化了推理能效。该模型支持256K超长上下文,是混元架构升级后的首款产品,在复杂逻辑推理、指令理解、代码生成及智能体应用等核心评测中表现突出,整体推理效率较上一代提升约40%。
