京东开源图像模型JoyAI-Image-Edit,从平面修图升级为三维空间重塑

2026-05-03阅读 0热度 0
空间 模型 图像

京东开源图像模型JoyAI-Image-Edit,从平面修图升级为三维空间重塑

4月7日,京东探索研究院正式宣布,开源自研的JoyAI-Image-Edit图像模型。这不仅是又一个开源工具,更标志着图像生成编辑技术的一次关键转向:从二维平面迈入了三维空间。

简单来说,这个模型被设计为业内首个将“空间智能”深度融入架构的开源方案。它让AI不再局限于表面的像素涂抹,而是真正尝试去“理解”和“操控”图像中的三维空间关系。这意味着,图像编辑正从传统的平面修图,升级为对场景进行三维层面的重塑。更重要的是,其推理代码已全部开放,开发者可以直接将其集成到自己的应用中。

京东开源图像模型JoyAI-Image-Edit,从平面修图升级为三维空间重塑

那么,何为“空间智能”?JoyAI-Image-Edit的答案是对真实世界空间规律的深度贴合。模型从空间位置关系、多视角一致性、相机参数感知乃至场景逻辑推理等多个维度进行综合建模。由此带来的,是相机坐标视角变换、物体空间位移旋转、几何结构精准控制等一系列空间编辑技术的实质性突破。根据京东内部的实验验证,在物体移动精度、空间一致性等核心空间编辑指标上,该模型已达到世界一流水准。

具体来看,JoyAI-Image-Edit攻克了此前开源模型普遍存在的空间理解难题,并展现出三大极具辨识度的核心能力:

视角变换 —— 用户只需通过自然语言描述,例如指定相机的偏航角、俯仰角或缩放程度,模型就能在严格保持场景几何一致性的前提下,生成对应新视角的图像。这相当于为静态图片安装了一个虚拟的、可自由操控的摄像头。

空间漫游 —— 更进一步,模型支持连续的视角移动,能够生成在三维空间中逻辑完全连贯的多视角图像序列。这个过程,就好比让观察者在场景内部“走动”起来,获得一系列连贯的视觉体验。

物体空间关系操控 —— 在确保场景整体结构稳定的基础上,用户可以对特定物体进行位移、缩放等空间变换操作。关键在于,模型能同步调整物体间的遮挡关系与光影效果,确保最终结果自然合理,不露破绽。

在实现空间维度突破的同时,JoyAI-Image-Edit并未牺牲通用性。它全面兼容多达15类通用图像编辑能力,深度覆盖了内容创作中的高频需求。无论是物体的替换、删除、添加,还是整体风格迁移、局部细节精修,模型均能提供高性能的处理支持。

京东开源图像模型JoyAI-Image-Edit,从平面修图升级为三维空间重塑

这种兼具深度与广度的能力组合,极大地拓展了其应用边界。从电商内容的高效生产、创意设计的快速渲染,到智能图像处理、3D模型辅助重建,乃至前沿的具身智能视觉感知领域,JoyAI-Image-Edit都能大幅提升AI技术在复杂空间场景中的适配性与实用性。尤其在具身智能这一热门方向,该模型为机器人或智能体理解、交互三维环境提供了关键的底层视觉能力支撑。可以预见,随着此类技术的开源与普及,整个AI内容生成生态将加速向更立体、更真实的方向演进。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策