2025最新京东云率先上线MiniMax M3模型推理吞吐性能显著提升权威榜单
6月1日,京东云官方公众号正式确认,MiniMax M3模型已全面上线,其JoyBuilder模型开发平台同步完成接入并开放服务。基于京东云自研推理引擎采用的PD分离部署、KV Cache缓存及投机采样等优化技术,模型推理吞吐量与响应效率均实现显著提升。
从技术维度看,MiniMax M3在编程、智能体等专业任务上已达到前沿水准。该模型引入全新MiniMax稀疏注意力架构(MSA),支持最高100万token的超长上下文。作为原生多模态模型,M3不仅能处理图片与视频输入,还具备直接操作电脑桌面的能力,这一功能在当前AI应用场景中极具实用价值。
目前,京东云JoyBuilder平台已聚合大量通用及行业优质大模型,所有模型均通过统一标准化接口提供服务。对用户而言,无需自行配置算力、搭建复杂架构或组建专业团队,即可快速完成大模型接入与落地应用。
从产品能力来看,JoyBuilder具备以下几个核心亮点:高性能推理服务层面,依托京东云自研推理引擎,可实现毫秒级响应与高并发处理,为企业级大规模应用提供稳定支撑。模型生态方面,平台汇聚百余种主流开源大模型,统一模型服务入口与标准化调用接口,企业可根据不同业务场景灵活选择。运维层面,全链路可观测体系支持实时监控模型服务运行状态、资源消耗及调用情况,有效保障运维效率与服务稳定性。
即日起,用户登录京东云官网,在JoyBuilder模型开发平台页面即可直接调用最新的MiniMax M3,体验1M超长上下文记忆带来的全新效果。
