摩尔线程与光轮智能战略合作深度解析:强强联合的行业影响与未来展望
近日,国产全功能GPU企业摩尔线程与物理AI仿真基础设施提供商光轮智能宣布达成战略合作。双方将基于摩尔线程全功能GPU与夸娥(KUAE)智算集群,结合光轮智能“求解—测量—生成”三位一体的全栈自研仿真平台,共同构建高置信度的仿真数据合成方案。此举旨在推动国产算力与仿真算法的深度融合,为具身智能的发展构建自主可控的基础设施。
此次合作不仅是两家同处海淀的“邻居”之间的强强联合,更标志着国产具身智能基础设施的建设,正从单点技术突破迈向系统化协同的新阶段。
随着人工智能向物理世界演进,一个核心挑战日益凸显:驱动具身智能持续进化所需的高质量训练数据,其来源问题亟待解决。
回顾过往,大语言模型的成功得益于海量的互联网文本数据;自动驾驶的进步则依赖于真实道路数据的持续采集。然而,当具身智能以机器人等形态进入千行百业时,其所需要的、包含复杂物理交互的高质量、规模化数据,几乎是一片空白。
正如光轮智能联合创始人兼总裁杨海波所言:“我们不可能让医疗手术机器人在真实手术室中‘试错’,也不可能放任工业机器人在产线上通过碰撞报废来学习精密装配。”真机数据采集长期面临物理数据稀缺、成本高昂、场景覆盖有限、复杂物理过程难以稳定复现等核心瓶颈。为训练单一任务让机器人反复试错数十万次,不仅耗时数月,成本也令人望而却步。因此,通过高保真仿真合成数据,成为破解具身智能数据瓶颈的关键路径。
但随之而来的问题是:仿真合成数据的规模化生产,本身又遭遇了渲染量指数级增长带来的算力瓶颈。以一个典型操作任务为例,一条机械臂的执行轨迹可能涉及5个不同相机机位的画面渲染。若将4种装修风格与4种灯光环境组合,则形成16组渲染条件。每组条件对应5个机位,每个机位需渲染600帧画面,单条轨迹的渲染总量即达4.8万帧。当任务扩展至数百条轨迹时,渲染规模轻松达到数百万帧,传统算力架构难以支撑。这类海量并发渲染与复杂物理仿真任务,对GPU的AI计算、图形渲染、物理仿真等全功能能力提出了刚性需求,而硬件级光线追踪技术,更是确保合成数据物理真实度的关键。
正是在此双重挑战下,摩尔线程与光轮智能的合作应运而生。
光轮智能自2023年初成立起,便锚定“构建物理AI数据与仿真基础设施”的战略定位。它未选择物理失真的游戏引擎路线,也未沿用计算迟缓的传统工业仿真软件,而是选择了全栈自研这条根本路径。
光轮智能首创了“求解—测量—生成”三位一体的全栈自研仿真技术范式,旨在系统性攻克物理仿真的核心难题。
在仿真层
光轮自研的高精度GPU物理求解器,具备可微分、多物理、多材质统一求解能力,能够支持刚体、柔体、流体、颗粒等复杂物理过程的高精度实时仿真。关键在于,该求解器已深度适配摩尔线程的MUSA架构,在MTT S5000智算卡上,依托全功能GPU的原生加速与光线追踪硬件单元,实现了高效稳定的运行与高保真渲染。例如,在模拟机械臂抓取不同质量柔性物体的场景中,随着抓取物质量从左往右依次增大,光轮的求解器能够精准模拟出线缆在各种抓取、缠绕、插拔状态下的精确形变与多维力反馈。
在测量层
光轮构建了全自动的虚实对标物理测量工厂。通过自研的高精度测量设备,精确捕获材料、摩擦、刚度等真实物理特性,建立了基于“真值”而非“经验值”的物理属性数据库。结合其SimReady标准体系,核心物理参数的仿真准确度可达99%以上,从数据源头确保了仿真输入的准确性。
在生成层
在精准求解与测量的坚实基础上,光轮能够生成与物理信息严格对齐的仿真资产与场景,实现了视觉表现与物理交互的双重保真,并以此定义了在全球范围内获得广泛认可的物理仿真资产规范。
凭借这一整套体系,光轮智能的仿真平台每周能生成上万小时的高质量训练数据,总规模已达百万小时级别,远超真机采集的数据体量。目前,全球排名前五的世界模型研发团队均已与光轮智能开展合作。在国际主流的具身智能头部企业中,超过80%正在使用光轮提供的仿真资产与训练场景。其客户包括阿里巴巴、字节跳动、智元机器人、银河通用、比亚迪等全球顶尖科技公司。
2026年,光轮智能推出了全球首个具身智能工业级仿真评测平台——RoboFinals。该平台设计了超过100项涵盖操作、移动、认知等维度的标准化任务,为各类“机器人大脑”提供了统一、客观的能力标尺。
如果说光轮智能解决的是“仿真数据从哪里来”的问题,那么摩尔线程解决的,就是“这些数据如何高效算出来”的问题。
作为国内稀缺的全功能GPU企业,摩尔线程基于自研的MUSA架构,实现了单颗芯片同时支持AI计算、图形渲染、物理仿真、科学计算与超高清视频编解码的技术突破,为具身智能合成数据的生产提供了一体化、全链路的算力支撑。
其旗舰级AI训推一体智算卡MTT S5000,是国内极少数同时支持硬件级光线追踪与AI训练推理的国产GPU,内置独立的光线追踪硬件单元(RT Core),可支撑复杂物理场景的实时高保真渲染。实测数据显示,使用MTT S5000的RT Core进行硬件光线追踪加速渲染,可获得高达2.7倍的性能提升。
基于MTT S5000构建的夸娥(KUAE)千卡智算集群,凭借其全精度通用计算能力,为海量合成数据生产提供了稳定、高效的算力保障。夸娥智算集群以全功能GPU为技术底座,单集群浮点运算能力达10 Exa-Flops(万P级),训练算力利用率(MFU)在稠密模型上最高可达60%,在混合专家(MoE)模型上达40%,训练线性扩展效率达95%,平均无故障运行时间超过15天,最长可实现大模型稳定训练30天以上。
更为重要的是,摩尔线程的全功能GPU能够良好支持光轮自研的物理求解器,实现柔性体动力学、刚体碰撞、流体模拟等复杂物理计算,确保合成数据在物理一致性上达到工业级精度要求。双方的合作已验证了国产自研物理求解器与国产全功能GPU算力底座的深度兼容能力,为行业提供了一个从核心算法到底层芯片全面协同攻关的可复制范本。