九章云极AI工厂排行榜:10万P智算集群实现Token千倍降本

2026-06-18阅读 0热度 0
ai

这场发布会释放的核心信息密度极高。九章云极DataCanvas正式推出“AI工厂”战略,并同步发布基于该战略打造的新一代智算云Alaya NeW Cloud 3.0。核心逻辑是将AI基础设施从单纯的资源供给平台,升级为能够规模化、低成本、高稳定地“生产”和“交付”智能的工业化体系。

发布会上最受关注的是多个硬核目标:规划建成10万P智能算力集群,日均承载10万亿Token流转,汇聚超过1000个模型,并通过五条工程路径,最终实现Token综合成本下降1000倍。单独看每个数字都极具冲击力,但更值得深挖的是背后的底层逻辑——AI产业的竞争正从单点大模型能力比拼,转向更系统化的工业级命题:能否像成熟工业一样,实现规模化、低成本、高稳定的智能交付。

方磊发布“AI工厂”战略:用DCU度量投入,以专业Token度量产出

九章云极创始人兼董事长方磊在开场演讲中直接点明这一转型方向。他提出的“AI工厂”由两大核心引擎构成:一是“训练工厂”,负责将算力资源(通过自研DCU度量体系)高效喂给大规模模型进行训练;二是“Token工厂”,负责将训练好的专业模型封装为标准化的Token,让智能能力像水电一样即取即用。两个工厂通过训练、交付和反馈形成闭环,确保模型在真实任务中持续迭代优化。


方磊指出,Token正从大模型的一个调用单位,逐步演变为面向产业、可衡量ROI的新型生产力组件。九章云极甚至将其细分为消费级、专业级和前沿级三类,分别对应不同复杂度和价值密度的交付场景。



针对“千倍级综合降本”目标,方磊特意强调,这绝非低价内卷的价格战,而是底层工程体系效率的全面比拼。


Alaya NeW Cloud 3.0亮相:AI双工厂支撑智能规模化落地

随后,九章云极副总裁胡宗星拆解了技术细节,深入剖析AI工厂背后的技术底座——Alaya NeW Cloud 3.0。该平台以训练工厂和Token工厂为核心,并由全栈智算底座提供支撑。


训练工厂定位为专业模型生成引擎,覆盖强化学习训练、领域精调与评测等关键环节;Token工厂则定位为专业智能的流通网络,重点解决上下文管理、推理优化、PD分离、KV重用等实际工程问题,确保Token输出的质量和效率。

胡宗星指出一个关键痛点:进入Agent原生时代后,推理状态空间快速膨胀,传统算力架构普遍面临三大瓶颈——异构硬件低效堆叠、静态调度导致资源浪费、被动供能导致能效偏低。针对这些挑战,Alaya NeW Cloud 3.0在系统架构、计算调度范式和能效架构上做了三大重构。


在系统架构层面,通过PD算力调度分离、KV Fabric高速显存互联、全链路零拷贝传输等技术,实现算、存、传的一体化协同。直接效果是端到端推理TPS性能提升可达10倍。


计算调度层面,落地了持久化执行流机制,通过内核复用、智能执行计划等手段,大幅减少任务切换带来的算力空耗。能效架构则升级为“能源定义计算”,实现算电实时协同调度,让专业Token的能耗全程可量化、可溯源、可管控。


关于千倍级降本,胡宗星也解释了实现路径:它并非单一技术突破,而是基础架构、算电协同、异构算力、全局调度和模型优化五条路径的乘积效应,最终直接反映在客户成本和产能曲线的改善上。


缪旭:Token工厂将走向可学习、可编译、自我进化

九章云极AI首席科学家缪旭的分享则更偏向技术深度与远景。他提出“可进化的Token工厂”概念,核心是打造一个AI基础设施编译器。该编译器的目标是将复杂任务转化为可改写的执行图,使底层基础设施变成一个可学习的优化器。


具体来看,系统通过Token/Task IR统一描述任务、资源、约束与执行意图,再由Optimizer Passes、Agentic RL Runtime和Serving & Resource Layer完成路由、压缩、缓存、能耗优化、执行轨迹记录及资源调度等一系列动作。


缪旭认为,Token工厂的关键壁垒在于三点:一是统一Token/Task IR,使整个推理过程可观测、可重写;二是引入Agentic RL Runtime,形成计划、执行、评估、学习、灰度发布的自我进化飞轮;三是通过模型资源操作系统,将模型调用、度量和优化策略统一起来。


基于这些壁垒,他给出了清晰的三阶段建设路径:第一阶段是可观测化,先建立Token质量、延迟、能耗等核心指标;第二阶段是可编译化,建立Token/Task IR与优化Pass库,支持回放评估和策略回滚;第三阶段是自我进化,由Agentic RL自动发现和部署优化策略,并向系统架构和芯片协同设计进行反馈。


从Token经济到开放生态:推进普惠智算布局

产业视角的观察同样值得关注。中国银河证券研究所所长助理吴砚靖分享了Token经济对智能算力投资框架的影响。她的核心判断是,AI商业化的统一计量尺度正从流量经济转向Token经济。单位Token成本的下降并不会压缩市场规模,反而会降低调用门槛,推高应用场景的扩张和总Token消耗——这一点与许多互联网服务的发展规律高度相似。同时她指出,中国Token词元经济的未来增速有望超过海外,市场空间、场景ROI和产业链价值重估将是接下来的关注重点。


易观合伙人张澄宇在现场解读了《2026年中国第三方普惠智算云市场专题研究报告(华北篇)》。报告显示,九章云极在全国第三方普惠智算云市场中位居前列,在华东、华南、华北等核心区域处于领先地位。报告同时指出一个趋势:智算云的竞争,正从算力持有规模转向跨区域、多算力集群的统一纳管和调度能力。


发布会现场,九章云极还与多家芯片、服务器、大模型、能源类企业及行业应用企业完成生态战略合作签约,并与中关村环保落地了EOD绿色智算全域合作。九章云极联合创始人尚明栋表示,公司希望专注做好AI工厂这一智能生产底座,推动形成开放、中立、共赢的普惠算力共同体。


九章云极同步披露了全球化算力网络布局:国内已在山东、安徽、宁夏、浙江、青海、云南、湖北、广东等地完成智算中心布局,海外已在印度尼西亚实现节点运营,并正在多个国家和地区推进。圆桌环节中,多位嘉宾提到,普惠算力不是单一企业能独立完成的事,需要产业、资本、研究机构和政策的多方协同。


从AI工厂战略到Alaya NeW Cloud 3.0,九章云极本次发布的核心指向是把AI基础设施从资源供给进一步推向工业化交付。10万P算力集群、10万亿Token/日流转、千倍级降本——这些目标确实野心勃勃,但能否真正实现,考验的远不止单一平台的工程能力,而是芯片、服务器、能源、网络、模型、应用和产业客户之间能否形成有效协同。如果这套体系能够跑通,最终受益的不只是模型开发者和企业客户,还包括大量需要调用AI能力的应用厂商和终端消费者。AI能力的使用成本真正降下来,才有可能推动更多Agent、行业应用和智能服务进入规模化落地阶段。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策