菜鸟AI AI提示词 · 教程 · 资讯

首页>其他资讯

Stem稀疏注意力算法：腾讯混元实现首字延迟降低3.6倍

2026-06-06阅读 0热度 0

腾讯混元

腾讯混元提出Stem稀疏注意力算法，已被ICML-2026收录

6月5日，腾讯混元发布重要成果——其提出的Stem稀疏注意力算法正式被机器学习顶会ICML-2026收录。这项研究直击大模型推理效率瓶颈，实现在线推理阶段的显著加速。

整体方案采用“算法×算子”协同优化的设计。算法层面，Stem通过Token位置衰减（TPD）和输出感知度量（OAM）两个核心机制，仅消耗25%的计算预算即可达到近乎无损的精度。这意味着，用四分之一算力换接近完整模型的输出质量，为长序列推理场景提供了切实可行的降本路径。

算法理论必须落到实际加速上。腾讯混元同步开源了Stem+BSA高性能计算（HPC）算子，将算法层稀疏性转化为硬件级加速效果。实测数据显示，在128K长上下文场景下，首字延迟降低了3.7倍。这一数字在长序列推理中意义重大——直接削减用户等待时间，改善对话流畅度与实时交互体验。

值得关注的是，ICML这类顶级学术会议对Stem的认可，反映了高效稀疏注意力方向的持续热度。从行业落地角度看，这类研究正为大规模语言模型部署中的成本控制与效率提升，提供更具工程可行性的解决方案。

上一篇800G光模块一季度激增139倍排行榜 下一篇高海拔宇宙线观测站拉索捕获天外来信

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

相关阅读

其他资讯05-21

腾讯混元Hy-MT2翻译模型开源：手机本地部署指南与性能实测

腾讯混元团队今日宣布，其新一代多语言翻译模型 Hy-M...

其他资讯05-20

腾讯混元Hy3预览版开源：推理效率提升40%，多场景性能与性价比评测

大模型领域的竞争，从来不只是参数规模的比拼，更是实...

其他资讯05-19

腾讯混元Hy3 preview开源发布：Agent性能全面升级与实战评测

腾讯混元大模型家族迎来了新成员。4月23日，混元Hy3 ...

其他资讯05-17

腾讯混元CL-bench续作发布：读懂日常生活的AI模型深度测评

我们对“个人AI助手”的期待，正从概念走向具体应用。...

其他资讯05-16

腾讯混元团队迎来新专家：前阿里通义视觉负责人薄列峰深度解析

原阿里通义视觉负责人薄列峰已加入腾讯混元团队，向副...

其他资讯05-09

2026年腾讯混元Hy3 preview适配评测：海光DCU性能表现与优化指南

海光信息宣布其深算3号DCU已完成与腾讯混元Hy3preview...

最新教程

vLLM部署指南：内网环境配置与端口权限优化详解 OpenAI Codex安装与隐私设置实战指南：新手必看步骤详解 Linux用户专属：Fooocus安装配置与报错修复全攻略 Dify部署全攻略：从服务安装到模型接入的完整流程详解 Windows与Mac环境下的海螺AI安装指南：权限配置与稳定部署详解 Linux用户专属InvokeAI安装指南：节点安装疑难解析与配置全攻略 LTX Video本地部署全攻略：从模型下载到批量生成视频教程 Mochi 1 从零搭建教程：本地部署成功后，高效导入工作流指南

最新资讯

PyCharm安装通义灵码插件，AI写代码实战指南手把手2025最新Trae+MCP+Figma实操对比深度评测：AI设计稿转代码完整案例教程 AI写代码80%技术债？深度测评避坑基于Elasticsearch的零人工决策灾害响应系统实测 ROS2 action必要性解析与核心优势测试工具精选：微软开源ASSERT，Playwright 1.59 AI进化，k6 v2.0 意法半导体2026年数据营收目标翻倍 AI需求驱动 2024免费开源阅读器测评：TXT一键上色+AI朗读

欢迎回来 登录或注册后，可保存提示词和历史记录

用户

密码

登录后可同步收藏、历史记录和常用模板

用户

设置密码

确认密码

注册即表示同意服务条款与隐私政策