京东开源图像模型JoyAI-Image-Edit，从平面修图升级为三维空间重塑

2026-05-03阅读 0热度 0

空间模型图像

京东开源图像模型JoyAI-Image-Edit，从平面修图升级为三维空间重塑

4月7日，京东探索研究院正式宣布，开源自研的JoyAI-Image-Edit图像模型。这不仅是又一个开源工具，更标志着图像生成编辑技术的一次关键转向：从二维平面迈入了三维空间。

简单来说，这个模型被设计为业内首个将“空间智能”深度融入架构的开源方案。它让AI不再局限于表面的像素涂抹，而是真正尝试去“理解”和“操控”图像中的三维空间关系。这意味着，图像编辑正从传统的平面修图，升级为对场景进行三维层面的重塑。更重要的是，其推理代码已全部开放，开发者可以直接将其集成到自己的应用中。

那么，何为“空间智能”？JoyAI-Image-Edit的答案是对真实世界空间规律的深度贴合。模型从空间位置关系、多视角一致性、相机参数感知乃至场景逻辑推理等多个维度进行综合建模。由此带来的，是相机坐标视角变换、物体空间位移旋转、几何结构精准控制等一系列空间编辑技术的实质性突破。根据京东内部的实验验证，在物体移动精度、空间一致性等核心空间编辑指标上，该模型已达到世界一流水准。

具体来看，JoyAI-Image-Edit攻克了此前开源模型普遍存在的空间理解难题，并展现出三大极具辨识度的核心能力：

视角变换 —— 用户只需通过自然语言描述，例如指定相机的偏航角、俯仰角或缩放程度，模型就能在严格保持场景几何一致性的前提下，生成对应新视角的图像。这相当于为静态图片安装了一个虚拟的、可自由操控的摄像头。

空间漫游 —— 更进一步，模型支持连续的视角移动，能够生成在三维空间中逻辑完全连贯的多视角图像序列。这个过程，就好比让观察者在场景内部“走动”起来，获得一系列连贯的视觉体验。

物体空间关系操控 —— 在确保场景整体结构稳定的基础上，用户可以对特定物体进行位移、缩放等空间变换操作。关键在于，模型能同步调整物体间的遮挡关系与光影效果，确保最终结果自然合理，不露破绽。

在实现空间维度突破的同时，JoyAI-Image-Edit并未牺牲通用性。它全面兼容多达15类通用图像编辑能力，深度覆盖了内容创作中的高频需求。无论是物体的替换、删除、添加，还是整体风格迁移、局部细节精修，模型均能提供高性能的处理支持。

这种兼具深度与广度的能力组合，极大地拓展了其应用边界。从电商内容的高效生产、创意设计的快速渲染，到智能图像处理、3D模型辅助重建，乃至前沿的具身智能视觉感知领域，JoyAI-Image-Edit都能大幅提升AI技术在复杂空间场景中的适配性与实用性。尤其在具身智能这一热门方向，该模型为机器人或智能体理解、交互三维环境提供了关键的底层视觉能力支撑。可以预见，随着此类技术的开源与普及，整个AI内容生成生态将加速向更立体、更真实的方向演进。

京东开源图像模型JoyAI-Image-Edit，从平面修图升级为三维空间重塑

京东开源图像模型JoyAI-Image-Edit，从平面修图升级为三维空间重塑

相关阅读

最新教程

最新资讯