MiniMax上线桌面Agent两项新功能 支持远程操控本地电脑
桌面AI的“手”与“眼”:MiniMax新功能如何让智能体更自主
2026年4月14日,国内大模型领域的活跃玩家MiniMax,为其桌面端智能体产品带来了两项颇具看点的更新:测试版Pocket与Computer Use功能。这并非简单的功能叠加,而是从两个关键维度,进一步拓展了AI智能体在桌面环境下的自主操作边界。
简单来说,Pocket让用户能随时随地通过微信、飞书、Slack这些日常通讯工具,远程向家里的电脑“发号施令”;而Computer Use则赋予了AI一双“眼睛”和一双“手”,让它能识别屏幕内容,并直接操控鼠标键盘来使用本地软件。距离其底层命令行工具MMX发布仅一周,如此密集的迭代节奏,无疑透露出在AI Agent落地应用这场竞赛中,玩家们正如何争分夺秒。
打破空间限制:Pocket如何实现远程“遥控”
先来看Pocket。它的核心价值,在于巧妙地打破了物理空间的限制。想象一下,你正在通勤的地铁上,突然想起电脑里有一份报告需要修改格式并发送。过去,你可能需要远程桌面连接,操作繁琐。而现在,你只需在常用的微信或飞书里,像给同事发消息一样,向绑定的桌面Agent下达指令即可。Agent在接收到指令后,便会自动在你的本地电脑上执行任务。这相当于为你的桌面智能体配备了一个随身“遥控器”,将AI的便利性从电脑桌前延伸到了移动场景中。
核心技术突破:Computer Use让AI真正“上手”操作
如果说Pocket解决了“指挥”的问题,那么Computer Use功能则解决了“执行”的难题,这被视为本次更新的技术核心。这项功能让AI不再仅仅依赖于API或脚本,而是能像真人用户一样,“看”懂屏幕上的按钮、菜单、输入框等界面元素,并自主驱动鼠标点击、键盘输入来完成操作。
这意味着什么?这意味着AI不仅能处理那些已经为其开放了接口的在线应用,更能直接打开你电脑本地的Word、Excel等办公软件进行内容编辑,甚至调整系统设置。它开始从“幕后”走向“台前”,直接与最广泛、最原生的桌面软件生态进行交互。这无疑是向通用型桌面智能助理迈出的关键一步。