菜鸟AI AI提示词 · 教程 · 资讯

首页>产业资讯

清华腾讯混元夺冠MLSys推理赛，NPU性能提升4.1倍权威评测

2026-05-25阅读 0热度 0

腾讯混元

清华大学存储实验室与腾讯混元AI Infra团队联合提出的方案，荣获MLSys 2026会议MoE模型推理优化挑战赛全球冠军。

上图展示了其核心的系统架构，集成了E-Shard专家分片、连续DMA传输、PSUM与GEMV计算并发、冷启动流水线以及智能预取控制等多项优化技术。

团队自主研发的、基于Agent的推理算子优化器“Knight”是本次获胜的另一关键。该工具实现了从优化策略生成、代码自动实现到效果评估迭代的全流程自动化，大幅扩展了优化策略的搜索边界，解决了传统人工优化难以覆盖的复杂性能瓶颈。

优化成效显著。该方案将模型端到端推理耗时从14.91秒降至3.56秒，实现了4.1倍的性能加速。单步解码延迟也从12.63毫秒优化至5.45毫秒，响应速度提升一倍以上。同时，权重加载阶段DMA引擎利用率提升至约80%，显著提高了硬件计算资源的有效使用率。

在Stanford、MIT等顶尖团队的激烈竞争中夺魁，充分证明了该方案的技术领先性。这一成果不仅体现了团队在大模型底层系统适配与核心算子深度优化方面扎实的工程能力，也为未来在超大规模算力平台上高效部署万亿参数MoE模型，提供了具备高度可行性的系统级实践参考。

上一篇OpenClaw工程师警示：AI代码安全隐患深度测评与防范指南 下一篇Qwen3.7-Max深度测评：阿里千问新一代大模型性能与优势全解析

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

相关阅读

产业资讯05-29

Hy-Memory深度测评：腾讯混元Agent记忆插件排行

Hy-Memory核心机制解析每位Agent开发者都面临一个棘手...

产业资讯05-29

腾讯混元Hy-Memory实测：记忆密度提升45% Token节省35%

腾讯混元推出Hy-Memory智能记忆插件，解决长期协作型A...

产业资讯05-25

清华腾讯混元夺冠MLSys推理赛，NPU性能提升4.1倍权威评测

清华大学与腾讯混元团队在MLSys2026竞赛中夺冠，其方...

产业资讯05-24

腾讯混元AI翻译工具Hy测评：移动端多语言翻译新选择

腾讯混元团队于2026年5月推出移动端AI翻译工具“Hy翻...

产业资讯05-21

腾讯混元开源翻译大模型Hy-MT2权威测评：新一代性能对比与榜单推荐

翻译远非简单的词汇转换，它追求的是语义的精准传递、...

产业资讯05-21

腾讯混元AI翻译小程序深度测评：精准度与易用性全解析

Hy翻译：腾讯混元出品的AI翻译新选择，有何不同？在...

最新教程

BAUHAUS框架的安装与环境配置详细步骤 AI 驱动的 video enhancer 工具安装与基础配置指南使用AI拜年黑科技工具的具体步骤与配置方法 AI 驱动的 video enhancer 工具安装与基础配置指南使用AI拜年黑科技工具的具体步骤与配置方法 DEEPSEEK 本地部署常见问题与解决方案

最新资讯

ChatGPT写文档格式问题排行榜：踩坑总结与解法 Grok AI免费本地部署实战：程序员必看评测 AI编程模式实践：从计划到落地的核心总结 2024 AI生图工具横评：GPT Image 2领先，Gemini免费更值 2024年十大HTML5+AI数据可视化工具库排行榜 AI Agent从0到1：底层逻辑、工具链与代码实现 2025年一文搞懂克劳德代码与克劳德桌面：两大AI助手功能详细对比 2024年最新十大1.6T光模块权威排行榜：AI数据中心主流对比与精选推荐

欢迎回来 登录或注册后，可保存提示词和历史记录

用户

密码

登录后可同步收藏、历史记录和常用模板

用户

设置密码

确认密码

注册即表示同意服务条款与隐私政策