2025中国AI数据总量权威榜单:199.48EB揭示增长趋势
数据作为数字经济的核心生产要素,其流动规模与结构直接映射人工智能产业的发展阶段。国家数据局近期发布的权威数据,精准揭示了2025年中国AI算力格局的关键性转折。
2025年,我国专门投入人工智能训练与推理环节的数据总量攀升至199.48 EB,同比增长率高达42.86%。一个更具里程碑意义的信号在于,推理环节的数据消耗量首次超越训练数据,达到101.34 EB。这标志着产业重心正从模型的集中化训练,转向模型在实际场景中的规模化部署与应用。
数据生成源头也发生了结构性迁移。2025年,由系统软件与人工智能自身产生的数据量达到26.92 ZB,首次超越传统上占主导的物联感知数据。这表明AI系统不仅是海量数据的消费者,其运行过程本身已成为一个强大的、自我驱动的数据生成引擎,形成了数据供给与模型优化的增强闭环。
数据流向的转变,直接驱动算力需求结构的重塑。行业测算显示,未来推理算力需求与训练算力需求的比例可能攀升至3:1乃至更高。为应对这一趋势,国家数据局已明确规划方向:将围绕智慧城市、工业互联网等对时延、可靠性与安全性要求严苛的场景,系统性布局城市级算力基础设施。这实质是在构建支撑实时智能决策的“算力服务网络”。
关联指标同样印证了AI应用落地的加速。2025年,全国日均词元(Token)调用量从年初的万亿级别跃升至年末的100万亿量级,呈现指数级增长态势。全年累计调用量约达21100万亿。词元调用量是衡量大模型实际业务渗透率的核心指标,其激增直观反映了AI技术正从技术研发层面向各行各业的生产、运营与服务环节深度渗透。
这些数据共同勾勒出一个明确的产业图景:中国人工智能正跨越以模型训练为主导的“构建期”,全面进入以推理应用为核心的“部署期”。推理数据量反超、调用量指数增长,均表明产业价值重心已转向实际应用效能。相应地,算力基础设施的布局逻辑,必须从支撑集中化训练的超级集群,转向满足高并发、低时延、分布式需求的推理网络,以承载即将爆发的普适性智能需求。这场静默而深刻的数据结构变迁,已然定义了下一阶段产业竞争的关键维度。
