世界模型训练新路径:如祺出行高价值场景AI数据版图深度解析

2026-05-19阅读 0热度 0
模型训练

具身智能的突破正面临一个根本性挑战:训练模型所需的高质量、因果逻辑清晰且符合物理规律的交互数据严重匮乏。如今,一个日均产出1600小时、完整记录决策与反馈链条的“黄金数据矿”被正式激活,为物理世界的数字化建模提供了前所未有的资源。

开启这一数据宝库的关键,在于出行服务平台如祺出行。

近期,如祺出行旗下数据业务板块首次系统公布了其AI数据资产布局,凭借大规模、高价值的真实出行场景数据,正式进入具身智能与世界模型的训练领域。目前,其已构建起涵盖标注数据、行为数据、合成数据及多模态训练数据集的完整资产矩阵,初步形成了服务于物理世界AI的真实场景数据基础设施。

截至2026年5月,如祺出行已在广州、上海、重庆、沈阳等核心城市投入运营超过300辆智能驾驶数据采集车。这支车队每日合规产出约130TB、时长达1600小时的高质量数据,为自动驾驶及更广泛的具身智能、世界模型演进提供了稳定且规模化的数据支撑。



这些源自真实交通环境的多模态数据,其应用价值已超越自动驾驶范畴。它们能够同时赋能多个行业的AI模型训练,为具身智能和世界模型构建一个可扩展的真实世界数据基座。业内资深AI模型训练专家指出,在空间智能成为AI演进关键方向的当下,融合了驾驶行为、道路交互、空间关系与时间序列的真实出行数据,是训练物理世界AI模型的稀缺优质资源。

手握AI训练的“黄金数据矿”

当前,以具身智能为载体的世界模型,已成为全球AI竞赛的新焦点。然而,高质量物理交互数据的极度短缺,正成为制约其规模化应用的核心障碍。行业分析显示,全球可用于具身智能背后世界模型训练的高质量数据总量,目前仅约50万小时。而头部厂商的年需求已达百万小时量级,供需缺口巨大。

值得注意的是,如祺出行这类出行服务平台,天然具备持续生成并沉淀此类高价值训练数据的独特条件。依托每年数亿级的订单与海量车辆运行数据,平台能够持续积累涵盖行车、泊车、城市道路通行等高频复杂场景的多模态数据。与静态图像、视频或人工模拟数据不同,这些数据完整封装了“决策-响应-反馈”的因果链条,具备内在的交互逻辑。这直接解决了出行相关AI模型训练面临的“数据饥渴”问题,堪称训练世界模型与具身智能的核心战略资产。

公开资料显示,如祺出行自2024年起便开始布局AI数据解决方案。凭借其出行平台的运营网络,公司将搭载激光雷达、高清摄像头、毫米波雷达等多传感器的智能驾驶数据采集车投入日常运营,同步合规采集真实的驾驶行为与道路环境数据。



以典型泊车场景为例,如祺数据不仅记录3D障碍物的空间坐标,还同步采集车辆底盘CAN信号、毫米波雷达回波、激光点云与多路摄像头视频流,从而围绕单一的泊车动作,构建起一个多模态的“行为-状态-环境”联合数据集。



长期从事大模型训练的专家认为,这类具备完整推理、决策与反馈闭环的数据,能有效帮助具身智能体与世界模型理解复杂的空间关系、动态交互及长尾场景。其数据价值远超传统静态图像或合成视频,是训练空间智能模型名副其实的“黄金数据矿”。据接近如祺出行的消息人士透露,公司已开始利用其数据资产训练车后服务机器人,探索数据价值向具身智能体的延伸应用。

全栈服务能力延伸至具身智能

与多数传统AI数据服务商局限于基础标注不同,如祺数据已完成从单一标注向“数据集+全栈能力”的升级。其构建了从数据采集、规模化处理、精准标注,到合成数据生成、多模态数据处理的端到端服务能力。这一完整的技术栈,使其服务边界从智能驾驶高效拓展至具身智能、通用大模型等高价值赛道。

目前,如祺数据已具备将完整服务封装为标准产品的能力,实现客户侧“开箱即用”,无需再投入资源进行底层数据清洗与标注,显著降低了高质量真实数据的应用门槛。

在规模化交付层面,如祺出行已在全国设立3大服务交付基地,拥有超过1500人的服务团队,并整合了超1000家BPO合作伙伴及近百万众包资源,可实现月千万级标注产能,满足高并发、大规模的数据处理需求。技术上,公司自研的OCC自动化标注算法,可减少90%的人工标注耗时,同时将交付准确率稳定在98%以上。此外,如祺的合成数据能模拟不同时段、天气与座舱场景,有效填补真实数据采集的空白;其多模态训练数据集覆盖图像、文本、音频、视频,可直接支持大模型的垂直领域微调与快速迭代。



商业化路径获得验证

凭借真实场景的数据优势、全栈技术能力与规模化交付体系,如祺数据在AI数据服务赛道建立了差异化壁垒。其服务已从智能驾驶成功拓展至具身智能、大模型、消费电子、医疗等多个高价值领域,形成了多赛道协同增长的业务格局。

商业化方面,如祺数据已与腾讯、小马智行、理想汽车、火山引擎、百度智能云、广汽集团等行业领军企业达成合作,其商业模式已获得市场初步验证。这一点在财务表现上得到直接体现。根据如祺出行2025年财报,以AI数据服务为核心的技术服务营收达1.60亿元,同比大幅增长487.4%,成为公司增长最快的业务单元。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策