宋鸿涌创业聚焦通用机器人模型:前Kimi训练负责人深度解析行业前景

2026-05-22阅读 0热度 0
Kimi

大模型与强化学习专家Flood Sung,将其技术视野投向了物理世界,正式进军机器人赛道。

根据AI科技评论获得的信息,前月之暗面后训练与强化学习负责人宋鸿涌(Flood Sung)已于2025年12月离任,并创立了机器人公司「北京十六号机器人科技有限公司」(XVI Robotics)。新公司的技术路线清晰聚焦:研发面向通用人形机器人的基座模型。

企查查数据显示,北京十六号机器人科技有限公司注册于2025年12月。其公开的技术愿景是构建大规模基座模型,旨在为人形机器人赋予环境理解、任务推理与自主行动的核心能力。

从游戏AI到大模型:一位RL专家的技术演进

宋鸿涌,业内多以英文名Flood Sung称呼,在强化学习研究者和开发者社区中享有声誉。他被视为国内系统性推进强化学习研究的先行者之一。其职业路径贯穿了游戏AI、大模型后训练与机器人三大领域,这一技术积累构成了他当前探索具身智能的坚实基础。

在学术研究方面,宋鸿涌在少样本学习领域贡献卓著。其2018年发表于CVPR的论文《Learning to Compare: Relation Network for Few-Shot Learning》,引用量已超6000次,成为该领域的经典文献。此外,他在GitHub上维护的「Deep-Learning-Papers-Reading-Roadmap」项目,收获超3.9万星标,是中文AI社区中极具影响力的开源学习指南。

在工业实践层面,他的履历同样扎实。2020年至2022年,他在字节跳动AI Lab担任研究科学家,深度参与游戏AI中的多智能体强化学习项目,曾主导3D-MOBA类游戏中多智能体AI的算法研发与工程落地。2023年,他加入月之暗面,负责后训练与强化学习,主导构建了Kimi K1.5、K2、K2.5等系列模型的核心强化学习训练体系,是推动Kimi模型能力持续迭代的关键人物。

攻坚核心难题:通用人形机器人基座模型

宋鸿涌此次创业选择的切入点,是当前具身智能领域技术壁垒最高、竞争最聚焦、资本关注度最密集的核心地带。

“通用人形机器人基座模型”的核心目标,是将大语言模型在数字领域展现的通用认知与推理能力,有效迁移至物理世界的机器人控制中。其终极愿景是让机器人能够在开放、未知的复杂场景中,仅凭自然语言指令,即可完成环境感知、任务规划与动作执行,摆脱对大量场景特定数据的依赖。

这一路径面临的根本挑战——例如,如何在稀疏、延迟的物理反馈中实现模型的自我优化与泛化——正与宋鸿涌在大模型RL后训练中积累的技术专长相契合。这或许是其选择此时入场的关键逻辑。

目前,XVI Robotics团队尚处于早期建设阶段。据悉,公司已完成由知名机构投资的种子轮融资。关于具体的技术产品形态与商业规划,公司暂未对外披露,后续进展值得业界密切关注。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策