小米罗福莉 AI 团队最新突破,自研 Agent 效率系统使算力成本直降 71.2%
小米AI团队新突破:自研Agent效率系统,算力成本直降71.2%
智能纪元AGI在3月16日发布了一则重磅消息。由前DeepSeek研究员、现任小米MiMo大模型负责人罗福莉主导,并与北京大学联合攻关,一项名为ARL-Tangram的统一资源管理系统正式通过论文形式亮相。
这套系统的核心价值何在?关键在于它采用了一套统一的动作级公式和一套极具弹性的调度算法。这不仅意味着它能游刃有余地应对各种异构资源的限制,更在性能上实现了双重飞跃:一是最大程度地压缩了单个动作的完成时间,二则是打造了一个高度定制化的异构资源管理引擎。
理论说得再漂亮,也得用实际效果说话。在真实的智能体强化学习任务中进行评估后,数据显示ARL-Tangram的表现相当抢眼。它能够将平均动作完成时间提升高达4.3分,将强化学习训练的步骤持续时间缩短最多1.5倍。而最引人瞩目的,或许是它在成本控制上的能力——这套系统最高能节省下71.2%的外部资源开销。对于动辄消耗巨额算力的大模型训练而言,这个降本幅度无疑具有巨大的吸引力。
值得一提的是,这已经是罗福莉在小米期间发表的第二项突破性技术成果。回顾去年10月,小米AI实验室与北京大学联合发布了一篇聚焦混合专家模型与强化学习的前沿论文,罗福莉的名字便已位列其中,那成为了她在小米的首个公开发表成果。短短数月,再从理论探索到系统实现,研发节奏可谓紧凑。
实际上,罗福莉在小米的“首秀”可以追溯到更早。在2025年小米人车家全生态合作伙伴大会上,她便已正式亮相。此后,她在个人社交平台官宣加入小米MiMo大模型团队时,写下这样一段话,清晰地展露了其技术信仰与团队愿景:
智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来,全力奔赴我们心目中的AGI!
目前,该项研究的详细论文已公开,感兴趣的读者可通过以下链接查阅全文:
https://arxiv.org/pdf/2603.13019

