中兴手机AI智能体测评:性能断层领先榜首

2026-06-11阅读 0热度 0
智能体

6月10日,手机智能体领域迎来一次硬核实战检验——AgentCLUE-Mobile手机GUI Agent基准测评结果正式公布。榜单上最抢眼的是中兴的GUI手机智能体,以断层式领先拿下第一,将第二名远远甩在身后。

本次测评的考核标准非常直接:评估各智能体能否在实际手机APP中自动完成用户指令——包括点外卖、订车票、信息查询等典型任务。简单说,就是检验AI在真实手机环境下的“动手执行能力”。

手机AI天花板 中兴gui手机智能体全方位断层第一

具体分数上,中兴产品拿下91.29分,而排名第二的智谱AI旗下Open-AutoGLM仅获73.11分——分差超过18分。在同类技术评测中,这样的优势堪称断崖级。

支撑中兴此次成绩的核心是其自研的Nebula-Pilot V1.0 27B模型,并采用API调用方式运行。值得关注的是,本次测评前几名全部使用API调用方案,整体得分明显高于本地部署模型。从数据看,本地部署方案中最高分来自阿里的MAI-UI,为65.91分;而字节的UI-TARS仅拿到30.19分。这一细节极具参考价值——API调用在灵活性和资源利用效率上,在手机场景下确实占据明显优势。

手机AI天花板 中兴gui手机智能体全方位断层第一

从机构排名看,中兴通讯稳居榜首,智谱AI与阿里巴巴分列二、三名。阶跃星辰和字节跳动产品排名相对靠后。不同方案间的差距,归根结底源于模型能力与调用方式的差异。中兴的大模型在界面理解、控件识别、连续操作等关键环节均展露出更稳定扎实的表现。

当前用户对手机智能体的期待持续升高——谁都希望它能自动代劳繁琐的重复操作,为自己省下精力。此次测评结果表明,中兴在手机端智能交互的技术储备足够硬核,无论模型能力还是整体方案都已相当成熟。

从不同调用方案的对比来看

API调用方案的整体表现显著优于本地部署模型。中兴采用的API方案兼具稳定性与灵活性,这也是其高分的重要原因。

手机AI天花板 中兴gui手机智能体全方位断层第一

手机AI天花板 中兴gui手机智能体全方位断层第一

手机AI天花板 中兴gui手机智能体全方位断层第一

手机AI天花板 中兴gui手机智能体全方位断层第一

可以预见,接下来这类手机智能体产品将密集涌现。用户手中的手机,使用体验也会变得更省心、更聪明。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策