年最新Vision Pro AI视觉功能全面体验与对比评测报告:让Siri看见你的世界

2026-06-16阅读 0热度 0
其他

在办公空间中,书架上陈列着各类魔术道具,旁侧是一扇可俯瞰巴黎全景的窗户——当然,这扇窗属于虚拟投影。这一切,均通过佩戴Apple Vision Pro头显呈现的混合现实叠加画面,精确映射到真实窗户所在位置。墙面还悬挂着一只虚拟时钟。

Siri视觉感知:Vision Pro AI图像识别与空间理解实测

书架是真实存在的,巴黎窗景与挂钟则属于数字构建。当我以一个发光球体的形态唤出Siri时,它能同时观测这两类对象。询问眼前有何物,Siri的文字回复框便将视野内所有元素逐一列举。

首次佩戴Vision Pro、并在VisionOS 26开发者预览版中体验“全知Siri”的初始感受,既伴随着惊喜,又带有似曾相识感。此前在三星Galaxy XR头显上已获得类似体验——该设备支持Gemini Live模式,能识别所在房间及打开的虚拟应用与窗口。也曾佩戴多款带摄像头的智能眼镜,在移动过程中向AI询问周围环境。

如预期所示,Apple今年秋季将为Apple Watch、iPhone、iPad等设备推送全面升级的Siri,并将视觉智能能力从iPhone拓展至更多平台。其中,Vision Pro上的Siri最令人瞩目,或许也最具战略性——它能在你需要时洞察视野内的一切,如同一位随行的感知助手。

这个在Apple WWDC上刚刚发布数日的早期预览版本并不完美,但其表现已足以勾勒出未来演进方向。如今,能实现这一能力的眼镜产品感觉完全触手可及。与此同时,Vision Pro的辅助功能也将变得愈发值得关注。

Siri发光球体:随时待命的视觉感知入口

与iOS和iPadOS上通过相机应用启动的视觉智能模式不同,Vision Pro上的Siri只需说出“Hey Siri”并发出指令,即可立即感知周遭环境。

Siri以一个三维发光球体的形态呈现,如同精灵般降落在房间中。你可以随意拖动它的位置,那颗发光球体借助VisionOS的空间图形引擎,在桌面或室内投射出真实的光影效果,视觉冲击力相当强烈。

只需说出“Hey Siri,我面前有什么?”即可触发视觉智能功能——系统会发出一声全新的提示音,随后根据眼球追踪技术,对视线所及区域进行快速视觉扫描。扫描覆盖范围相当广泛:它能识别面前书架上满满的书籍,以及陈列在那里的各类手办与玩具,还能读出几本书的书名,例如《漩涡》和《奇书》。

AI的反馈基于摄像头对眼前场景(无论真实还是虚拟)拍摄的静止画面,这与Meta智能眼镜或三星Galaxy XR上其他基于摄像头的AI的“拍摄-响应”节奏相似。不过,它目前尚不具备那些设备所支持的实时连续识别模式,每次请求只能拍摄一张静态图像进行分析。

同时识别真实与虚拟物体

在桌面上,Siri成功识别出一台红色Virtual Boy虚拟现实头显和一台Steam Deck掌机,两者均为真实物品。随后,视线转向虚拟的巴黎窗景、墙上的时钟小组件以及装满魔术道具的书架,它同样一一辨认了出来。

在这个早期测试版本中,Siri有时会在一段时间内停留在某个特定视角进行分析,除非关闭Siri或移动发光球体重新尝试。当然,也可能只是对操作方式尚不熟练。

但我已经开始思考如何借助这种视觉感知能力来提升工作效率。让Siri总结一篇关于近期剧本创作的备忘录——只需开口询问,它便调出了内容并提炼了关键点。我还询问了MacBook虚拟屏幕上打开的浏览器窗口情况。(就在通过Mac在Vision Pro中撰写这篇文章的此刻,Siri正在告知,打开了一个Google文档窗口,里面记录的正是Siri识别真实与虚拟物体的内容。)

将个人照片转化为全景三维背景

VisionOS 26中的全景照片转换新功能——它能将相册中的任意全景照片转换为可环绕包裹的三维背景,供工作时段使用。

转换效果并不像Apple自家的沉浸式环境那样完全三维环绕,也没有动态效果或环境音效,更像是超大型的环绕式三维窗口,办公室的部分实景依然在边缘可见。

视觉效果相当美观,尽管并非所有全景照片都能成功转换(这仍是极为早期的阶段,相信后续版本会持续优化)。我调出了一张疫情期间探望母亲时在她后院拍摄的照片,现在每次启动时,那个场景便会迎接我,仿佛又回到了那里。如果Vision Pro能像Meta Quest那样,支持从多张照片生成完全沉浸式的高斯泼溅场景,那就更完美了。

我不禁开始畅想,Apple即将推出的智能眼镜将如何借助具备视觉能力的Siri实现辅助功能。但这或许有些超前。目前,体验这一切需要一台售价3499美元的Vision Pro。然而,当Apple推出类似谷歌或Xreal Project Aura那样体积更小、价格更亲民的AR眼镜,当更多应用能够接入Siri的视觉框架时,一切将会如何演变?站在未来的门槛上,满怀期待地向前展望。

Q&A

Q1:Vision Pro上的Siri视觉功能与其他设备上的视觉智能有何差异?

A:Vision Pro上的Siri视觉功能无需进入相机应用,只需说出“Hey Siri”并提问即可触发。它以三维发光球体形态呈现,能同时识别真实与虚拟物体,并结合眼球追踪技术扫描视野范围。不过目前每次请求仅能拍摄一张静态图像分析,尚不支持Meta眼镜或三星Galaxy XR那样的实时连续识别模式。

Q2:VisionOS 26的全景照片转换功能效果如何?

A:该功能可将相册中的全景照片转换为环绕式三维背景,用于工作时的视觉环境。效果介于普通大屏和完全沉浸式环境之间,没有动态效果或环境音效,办公室实景仍在边缘可见。目前并非所有全景照片都能成功转换,功能仍处于早期阶段,预计后续版本会持续完善。

Q3:Apple智能眼镜何时会推出类似Vision Pro的Siri视觉功能?

A:目前Apple尚未正式发布智能眼镜产品,体验Siri视觉功能仍需3499美元的Vision Pro。但随着谷歌、Xreal等厂商推出体积更小、价格更亲民的AR眼镜,加之Apple预计将推出类似产品,具备视觉感知能力的Siri有望在未来以更低门槛的硬件形态普及。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策