时间:26-04-25
四月,在开放数据中心委员会(ODCC)春季全会上,一项关键的产业进展正式确立:超擎数智获授“ODCC AI存储实验室”。这一授牌仪式由中国信通院云大所总工程师、ODCC AI存储实验室联合主任郭亮与超擎数智总经理唐春峰共同见证,标志着AI存储产业向标准化与规模化发展的关键一步。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
该实验室的建立,意味着一个面向大规模推理场景的前沿技术平台,在超擎数智坚实的技术基础上正式启动。它清晰地表明,在AI基础设施与应用深度融合的赛道上,具备全栈解决方案与端到端实践闭环能力的企业,方能占据核心优势。未来,实验室将聚焦AI存储与推理场景的核心技术演进,成为驱动行业标准制定与生态协同的关键枢纽,为产业的高质量发展提供底层支撑。
这一实验室的成立,汇聚了国内顶尖的技术共识,吸引了从国际领先企业到本土创新公司的广泛参与,其行业影响力显著。在ODCC的框架内,其定位已超越单一的技术验证平台,更承担着为AI基础设施制定技术标准、建立性能评估基准的核心任务,引领作用明确。
超擎数智总经理唐春峰(右)中国信通院云大所总工程师、ODCC AI存储实验室联合主任郭亮(左)
ODCC作为由中国信通院联合腾讯、阿里巴巴、百度及三大运营商等领军企业于2014年发起的关键组织,长期聚焦服务器、数据中心与网络等核心技术领域,致力于构建开放、协同的产业生态。其累计发布的超300项成果,已成为数据中心产业发展的核心参考。
为何在此时设立AI存储实验室?核心驱动力在于产业正处于关键转折。当前,AI产业正从大规模模型训练阶段,进入更为复杂且要求严苛的大规模推理部署阶段。随着生成式AI深入各行业应用,海量并发推理请求导致数据访问模式发生根本变化,数据量呈指数级增长。传统的紧耦合存算架构,在扩展性、性能与成本效率上均面临挑战——存储系统的读写效率与高速网络性能,直接决定了AI应用的最终性能与商业可行性。
破解这一瓶颈的关键路径在于“存算分离”架构。ODCC AI存储实验室正是在此背景下成立,旨在聚焦先进的存算分离技术,构建行业级的基准测试平台,并在产业规模化爆发前夜,建立起统一的AI存储评估规范。这为基础设施的关键组件选型、系统级优化乃至行业标准制定,提供了不可或缺的实证依据,将加速AI基础设施的技术创新与规模化部署。
在众多实力参与者中,ODCC将这一战略性实验室授予超擎数智,源于其经过验证的AI全栈解决方案能力与规模化落地实践。
区别于仅提供单点硬件产品的传统厂商,超擎数智的核心优势在于,能够紧密围绕客户实际业务场景,深度融合算力、网络、存储与软件能力。这种从架构设计到部署交付的端到端闭环能力,构成了其在AI基础设施领域独特的技术壁垒,也是获得ODCC权威认可的根本。
作为AI原生基础设施整体解决方案提供商,超擎数智的产品线覆盖AI算力、无损网络、高速光电互联、AI加速软件、集群交付服务及算力运营。尤为关键的是,作为NVIDIA在计算与网络双领域的精英级合作伙伴,超擎数智在存算分离核心技术领域构筑了显著优势。依托自建研发测试中心及NVIDIA授权的DPU与DOCA卓越中心,其将DPU的网络处理与存储卸载能力深度优化,全面实现了计算节点的数据加速与存储资源的高效池化。
网络是释放存储潜能的基石。超擎数智凭借在InfiniBand、RoCE方案及高速光电互联产品上的深厚积累,构建了高带宽、超低延迟、零丢包的无损网络环境。结合其自主研发的元景、擎天、锋锐系列AI服务器,可为用户提供从算力方案设计、建设到交付的一站式交钥匙服务,综合竞争力突出。
技术理论的价值在于落地验证。面对大规模推理带来的严苛性能挑战,超擎数智已完成了从技术方案到业务应用的全链路实践。
在本次会议上,超擎数智解决方案技术经理张浩然的技术报告《大规模推理效率革命:PD分离实战与最佳实践》,分享了宝贵的实战经验与测试数据。报告精准定位大模型推理阶段的性能瓶颈,聚焦“PD分离”、“KV Cache卸载”等核心技术,深度优化了算力与存储的协同调度机制。基于这些前沿实践,超擎数智有效突破了海量并发场景下的显存与存储I/O限制,形成了一套可复现、可验证的AI推理加速方案,实现了方法论与实战经验的统一。
实验室的核心价值,在于将测试数据转化为实际生产力。超擎数智正发挥其技术底座与生态连接器的作用,致力于打通从软硬件到上层应用的完整闭环。
对内,实验室针对核心业务痛点,构建了四大AI关键测试场景:
AI训练场景:模拟多GPU节点并发数据读取与频繁检查点写入,测试SSD在网络饱和状态下的持续吞吐性能,确保训练数据流水线零中断;
AI推理场景:模拟网络抖动与突发请求,测试SSD的平均延迟与尾延迟控制能力,保障在线推理服务实现稳定、极致的响应速度;
分布式存储场景:基于Ceph、HDFS等主流系统,测试不同RAID级别与多副本策略对SSD性能的影响,寻求可靠性与企业级性能的最佳平衡点;
虚拟化与云原生场景:基于VMware/KVM平台,测试虚拟机实时迁移时的存储中断时长,对比SR-IOV直通与传统虚拟化的I/O延迟差异,以满足云原生AI的敏捷部署需求。
对外,实验室致力于汇聚产业头部力量,共建开放协同的生态体系。在中国信通院与ODCC的主导下,超擎数智联合了NVIDIA、联想、华瑞指数云、超云、焱融科技、英韧科技、三星、Solidigm、纳多德等全球顶尖的软硬件伙伴,提供从服务器、NVMe SSD、DPU到底层软件的全面支持。同时,积极引入国内外头部AI应用厂商及新兴大模型公司作为场景使用方,提供真实的业务负载模型,驱动测试规范的动态迭代。这一“测试-反馈-优化”的闭环机制,确保了实验室成果具备高度的实用性与可落地性,实现了从基础部件到全链路系统的协同验证,为大模型与智能推理应用夯实存储基石。
超擎数智获授ODCC AI存储实验室,标志着KV Cache优化、存算分离、智算网络及存算网一体化等前沿技术,在成果转化与标准制定层面进入了实质性推进阶段。在AI存储与大规模推理走向广泛产业化的新周期,超擎数智将以该实验室为核心平台,持续深耕AI推理应用前沿,充分发挥其在标准引领、生态协同与核心技术深耕方面的综合优势,加速创新技术的产品化与行业标准的形成,为AI推理赋能千行百业提供坚实、高效的基础设施支撑。