出行平台具身智能数据宝藏:破解AI数据荒的实战案例解析

2026-05-18阅读 0热度 0
具身智能

5月18日,如祺出行旗下数据业务板块首次完整披露其AI数据资产版图,清晰展示了公司在通用人工智能、具身智能及世界模型等前沿领域的核心数据能力。根据披露,如祺数据已构建起覆盖标注数据、行为数据、合成数据及多模态训练数据集的完整体系,形成了适配前沿AI模型训练需求的高价值数据资源矩阵。

如祺出行的AI数据业务增长显著。2025年,其以AI数据服务为核心的技术服务板块营收达1.60亿元,同比增长487.4%。截至今年5月,公司已在广州、上海、重庆、沈阳等核心城市部署超300辆智能驾驶数据采集车。这些车辆日均产出1600小时、130TB的高质量合规数据,为AI模型的规模化迭代提供了稳定供给。

如祺出行表示,依托长期积累的真实出行场景数据,公司正为自动驾驶及多行业AI模型训练提供支持,并为具身智能、世界模型等领域提供可延展的数据支撑。

当前AI产业正迈向空间智能新阶段,能够还原物理世界规则与交互的高质量数据已成为稀缺资源。分析认为,如祺出行平台积累的多模态数据,包含驾驶员决策、道路交互、空间位置及时序变化等丰富信息,具备成为训练世界模型与具身智能体的关键数据源潜力。

锁定真实出行场景,坐拥具身智能训练“黄金数据矿”

当前,具身智能与世界模型的训练面临核心瓶颈:适配物理交互与真实场景推理的高质量训练数据严重不足,制约了其规模化落地与精准迭代。

区别于传统数据服务商,如祺出行的核心优势在于其真实的场景数据。每年数亿级的出行订单与车辆运行数据,沉淀了高频复杂交通场景下的多模态信息,完整记录了“决策-响应-反馈”的闭环过程。自2024年起,公司开始投放搭载激光雷达、高清摄像头等传感器的智能驾驶数据采集车。这些车辆在提供出行服务的同时,能够合规采集驾驶行为、人车互动、交通交互等真实数据,大幅降低了高质量数据的边际获取成本。

以泊车场景为例,如祺能够同步采集3D障碍物坐标、CAN总线信号、毫米波雷达回波、激光点云及全景视频,构建起覆盖“车辆行为、运行状态、环境变化”的多模态联合数据集。大模型训练专业人士指出,此类具备完整决策闭环的数据,能有效帮助具身智能体或世界模型理解真实空间关系、动态交互逻辑及长尾复杂场景,其数据价值远超静态数据与模拟合成数据,堪称空间智能模型训练的“黄金数据矿”。

消息人士透露,如祺出行正探索将平台数据应用于车后服务机器人训练,覆盖洗车、换电、维修等多个场景。

从单一数据服务到全栈能力,完成“数据集+标准化服务”进化

区别于国内多数局限于基础数据标注的传统服务商,如祺出行已完成从单一标注供应商向“数据集+全栈技术能力”综合AI数据服务商的升级。公司已具备数据采集、清洗、智能标注、合成数据生成及多模态处理的全链路能力,并拥有AI数据服务的标准化封装能力,可提供开箱即用的数据产品,显著降低了真实场景数据的使用门槛与落地成本。

这套完整能力使其能同时满足智能驾驶等行业的基础数据需求,以及具身智能、通用大模型等前沿AI赛道的训练要求,从而推动其场景数据价值实现跨行业落地。

公司在国内布局了3大交付基地,拥有超过1500人的专业团队、超1000家BPO合作伙伴及百万级众包资源,月均标注交付能力达千万级。其自研的OCC自动化标注算法可替代90%的人工标注工作,交付准确率超过98%。此外,如祺自研的合成数据能覆盖多时段、多天气等复杂场景,其多模态数据集涵盖图像、文本、音频、视频全品类,可直接适配各类大模型的垂类微调与迭代优化。

目前,如祺的AI数据服务已成功落地于智能驾驶、具身智能、大模型、消费电子、医疗等多个领域,客户包括腾讯、小马智行、理想汽车、火山引擎、百度智能云、广汽集团等知名企业,其商业模式与落地路径已获得市场验证。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策