顶级国家AI科研语料库建设:应用加速与中试基地指南

2026-06-14阅读 0热度 0
人工智能

(澎湃新闻)

中国科学院:加快国家人工智能应用中试基地和国家级科研语料库建设

6月11日,国家数据局举办2026年度首场“数据要素×”新闻发布会,中国科学院科技基础能力局副局长张韵系统阐述了该计划的落地成效。发布内容围绕科学数据资源体系建设、要素价值转化以及智能科研范式驱动三个核心层面展开,层层深入,洞察丰富。

构筑基石:320PB科学数据体系的构建逻辑

首要目标是筑牢科研数据基础,这既是战略需要也是能力体现。中国科学院的数据资源布局,核心在于构建数据采集、治理与共享一体化的协同体系。具体举措包括:重大科技基础设施层面,25个已运行装置正同步进行数字化与智能化升级;科技项目管理层面,战略性先导专项的数据汇交与管理机制已全面实施,累计完成超过24PB数据汇交,开放共享率达93%;数据出版方面,已汇聚来自全球近100个国家和地区科研人员贡献的超过1500万项数据集,并成功入选联合国教科文组织全球开放科学优秀实践。截至2025年底,全院科学数据总量已突破320PB,覆盖多学科领域,形成了一个规模化、体系化的高质量数据资源池。

驱动价值:从中试基地到数据确权的系统化实践

关键环节在于激活并释放科学数据的要素价值,当前聚焦在两大实践路径。其一是为“AI for Science”提供基础设施支撑,包括加速建设国家人工智能应用中试基地与国家级科研语料库,并推动现有科学数据中心向智能化服务模式转型,旨在实现数据从存储到智能分析与应用的全链路打通。其二是构建制度保障体系,围绕数据确权、可信流通与价值评估等关键节点完善服务。通过自主构建的科技资源标识服务平台(CSTR),为设施、人员、数据及论文等核心要素提供全生命周期标识管理;新办20本数据期刊,探索数据论文作为新型科研成果的发布与共享机制;科学数据库可信认证服务平台亦已获得国家认证认可监督管理委员会(CNCA)资质批准。这一系列举措正逐步构建起数据要素流通的完整闭环。

实战验证:“数据要素×”大赛催化创新生态

以赛事为平台直接检验数据要素的应用效能,构成了有效的创新加速器。过去两年,“数据要素×”科技创新赛道累计吸引全国超过3000支团队参与,孵化出500余个高质量项目。中国科学院系统连续两年包揽该赛道唯一一等奖,并有18个项目晋级全国总决赛。赛事不仅遴选出优秀解决方案,更实质性地促进了数据要素与前沿科研场景的深度融合。今年4月发布的“磐石·100”模型体系,便是将科学数据、人工智能算法与具体科研问题相结合的典型成果,为智能化科研范式与重大科学发现提供了新型基础工具。整体来看,一条从数据汇聚、价值挖掘到驱动科研变革的清晰路径已初步形成。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策