宋鸿涌创业项目解析:通用机器人基座模型的技术前景与行业影响
AI与强化学习领域的资深专家Flood Sung,正式将其技术视野投向具身智能领域。
独家获悉,前月之暗面(Moonshot AI)后训练与强化学习负责人宋鸿涌,已于2025年12月离任,并创立机器人公司“北京十六号机器人科技有限公司”。公司战略清晰聚焦于一个核心目标:研发面向通用人形机器人的基座模型。
公开信息显示,该公司成立于2025年12月。其官方定位明确指向构建大规模基座模型,旨在赋予人形机器人环境理解、任务推理与自主物理行动的综合能力。
一位“三栖”研究者的独特路径
宋鸿涌(Flood Sung)在学术界与AI工程界均享有声誉,被视为国内系统性推进强化学习研究的先行者之一。其职业履历横跨游戏AI、大模型后训练及机器人三大前沿板块,这一复合背景为其切入具身智能赛道提供了独特的技术逻辑与连续性。
在学术贡献上,他在少样本学习领域的研究具有奠基意义。其2018年发表于CVPR的论文《Learning to Compare: Relation Network for Few-Shot Learning》,引用量已超6000次,成为该领域的标志性文献。此外,他在GitHub上维护的“Deep-Learning-Papers-Reading-Roadmap”项目,收获超3.9万星标,长期是国内最具影响力的AI开源学习资源之一。
在工程实践层面,其经验同样深厚。2020年至2024年,他于字节跳动AI Lab担任研究科学家,深度参与游戏AI中的多智能体强化学习项目,曾主导3D-MOBA类游戏中多智能体AI的算法研发与工程落地。2024年加入月之暗面后,作为后训练与强化学习负责人,他主导构建了Kimi K1.5至K2.5系列模型的核心强化学习训练体系,是推动Kimi模型能力持续迭代的关键技术负责人。
为何是“通用机器人基座模型”?
宋鸿涌选择的创业方向,直指当前具身智能领域技术壁垒最高、竞争最聚焦、资本关注最密集的核心赛道。
“通用人形机器人基座模型”的本质,在于将大语言模型在数字领域展现的通用认知与推理能力,有效迁移至机器人的物理控制与交互任务中。其终极目标是实现机器人对开放场景的指令理解、动态环境感知与自主动作规划,从而摆脱对海量场景专用数据的依赖。
该路径面临的核心技术挑战——例如在稀疏、不确定的物理反馈中实现模型高效自进化与新任务泛化——恰恰与宋鸿涌在大模型后训练及强化学习领域积累的专长高度契合。此次创业可视为其技术栈的一次战略性延伸与聚焦应用。
目前,XVI Robotics团队尚处于早期组建阶段。据悉,公司已完成由知名机构参与的种子轮融资。关于具体产品形态与商业化路线,更多细节有待后续披露,其进展值得行业密切追踪。
