宋鸿涌创业聚焦通用机器人模型：前Kimi训练负责人深度解析行业前景

2026-05-22阅读 0热度 0

Kimi

大模型与强化学习专家Flood Sung，将其技术视野投向了物理世界，正式进军机器人赛道。

根据AI科技评论获得的信息，前月之暗面后训练与强化学习负责人宋鸿涌（Flood Sung）已于2025年12月离任，并创立了机器人公司「北京十六号机器人科技有限公司」（XVI Robotics）。新公司的技术路线清晰聚焦：研发面向通用人形机器人的基座模型。

企查查数据显示，北京十六号机器人科技有限公司注册于2025年12月。其公开的技术愿景是构建大规模基座模型，旨在为人形机器人赋予环境理解、任务推理与自主行动的核心能力。

从游戏AI到大模型：一位RL专家的技术演进

宋鸿涌，业内多以英文名Flood Sung称呼，在强化学习研究者和开发者社区中享有声誉。他被视为国内系统性推进强化学习研究的先行者之一。其职业路径贯穿了游戏AI、大模型后训练与机器人三大领域，这一技术积累构成了他当前探索具身智能的坚实基础。

在学术研究方面，宋鸿涌在少样本学习领域贡献卓著。其2018年发表于CVPR的论文《Learning to Compare: Relation Network for Few-Shot Learning》，引用量已超6000次，成为该领域的经典文献。此外，他在GitHub上维护的「Deep-Learning-Papers-Reading-Roadmap」项目，收获超3.9万星标，是中文AI社区中极具影响力的开源学习指南。

在工业实践层面，他的履历同样扎实。2020年至2022年，他在字节跳动AI Lab担任研究科学家，深度参与游戏AI中的多智能体强化学习项目，曾主导3D-MOBA类游戏中多智能体AI的算法研发与工程落地。2023年，他加入月之暗面，负责后训练与强化学习，主导构建了Kimi K1.5、K2、K2.5等系列模型的核心强化学习训练体系，是推动Kimi模型能力持续迭代的关键人物。

攻坚核心难题：通用人形机器人基座模型

宋鸿涌此次创业选择的切入点，是当前具身智能领域技术壁垒最高、竞争最聚焦、资本关注度最密集的核心地带。

“通用人形机器人基座模型”的核心目标，是将大语言模型在数字领域展现的通用认知与推理能力，有效迁移至物理世界的机器人控制中。其终极愿景是让机器人能够在开放、未知的复杂场景中，仅凭自然语言指令，即可完成环境感知、任务规划与动作执行，摆脱对大量场景特定数据的依赖。

这一路径面临的根本挑战——例如，如何在稀疏、延迟的物理反馈中实现模型的自我优化与泛化——正与宋鸿涌在大模型RL后训练中积累的技术专长相契合。这或许是其选择此时入场的关键逻辑。

目前，XVI Robotics团队尚处于早期建设阶段。据悉，公司已完成由知名机构投资的种子轮融资。关于具体的技术产品形态与商业规划，公司暂未对外披露，后续进展值得业界密切关注。

宋鸿涌创业聚焦通用机器人模型：前Kimi训练负责人深度解析行业前景

从游戏AI到大模型：一位RL专家的技术演进

攻坚核心难题：通用人形机器人基座模型

相关阅读

最新教程

最新资讯