手机智能体榜单:中兴GUI智能体91.29分登顶
2026年6月10日,最新一轮手机图形界面智能体综合能力测评结果揭晓。中兴自研GUI智能体以91.29分夺得榜首,领先第二名优势显著。
本次测评采用AgentCLUE-Mobile基准测试体系,在真实手机环境中模拟日常操作任务,如点外卖、订车票、查询信息等,真实反映实际使用场景。
中兴夺冠核心在于自研Nebula-Pilot V1.0 27B大模型,采用API调用模式。值得注意的是,榜单前三名均采用API调用架构,得分远超本地部署方案。本地部署赛道中,阿里巴巴MAI-UI获65.91分,字节跳动UI-TARS获30.19分。
参与机构排名显示:中兴通讯、智谱AI、阿里巴巴位列前三,阶跃星辰、字节跳动紧随其后。性能差距核心在于模型对界面结构理解深度、控件识别准确度及多步连续操作的稳定性。中兴方案在上述环节展现出更强的鲁棒性与一致性。
用户对手机自动化操作需求持续攀升,高频重复任务正逐步交由智能体执行。此次测评表明,中兴在移动端智能交互领域已构建系统化优势,模型能力与工程落地均处于行业前列。未来,高效自主操作的智能体将加速融入日常场景,推动手机便捷性与用户体验显著提升。