国产AI工厂领跑全球4万亿市场,最新榜单揭示领先优势
一场围绕智能体(Agent)的全球基础设施竞赛,已经跨过了不可逆转的临界点。
全球权威研究机构Omdia的最新报告预测,到2026年,全球科技巨头在AI基础设施上的资本支出将超过6000亿美元(约合4.07万亿元软妹币)。这个规模,足以与一个世纪前那场改变世界的工业电气化革命相提并论。
国际AI巨头们正以前所未有的力度投入这场竞赛。OpenAI刚刚披露,其2026年全年的算力预算高达500亿美元,并牵头一个千亿级别的“星际之门”超级算力工厂项目。Anthropic则先后与谷歌、亚马逊达成数百亿美元的算力及投资合作,甚至租赁SpaceX的大型超算作为推理算力工厂,同时计划投入500亿美元自建数据中心集群。
当英伟达CEO黄仁勋断言“AI不是软件,而是工厂”,当微软CEO纳德拉将Azure重构为“全球最大的AI工厂网络”,产业竞争的焦点已经悄然转移。胜负手不再是模型本身有多强,而是能否稳定、低成本、规模化地“生产智能”。
Omdia这份名为《2026全球AI工厂市场格局》的报告,清晰地指出了新时代的核心逻辑:决定胜负的,不再是谁拥有更多GPU,而是谁能更高效地将“电力+算力+数据”转化为真正有价值的Token(智能输出单元)。
更值得关注的是,这份报告首次系统性地梳理了全球AI工厂玩家的不同发展路径。其中,一个来自中国的样本被Omdia单独定义为“智能精炼(Intelligence Refiner)”范式的代表——商汤大装置。
与此同时,IDC发布的最新中国企业级MaaS(模型即服务)市场报告显示,商汤大装置旗下的“万象”大模型平台,凭借11.3%的市场份额,位居中国大模型平台私有化部署市场第二位,成功跻身行业第一梯队。
眼下,正值OpenAI、Anthropic等全球AI巨头纷纷杀入企业级服务市场的关键时刻。竞赛的号角已经吹响,一个关键问题随之浮现:国产厂商如何守住阵地并向外围突破?商汤大装置又凭什么能被国际权威机构盖章认证为“开创者”?
结合Omdia的报告,并通过对商汤大装置解决方案总经理代继的独家访谈,我们可以从产业最前线拆解两个核心问题:AI工厂为何在今年突然爆火,以及一家中国企业是如何提前卡位这场新基础设施竞赛的。
一、AI工厂爆火:从训练模型到生产智能,“精炼师”登场
AI工厂的概念为何会在今年突然成为焦点?
答案其实很直接:因为智能体(Agent)真正逼近了产业爆发的临界点,整个AI产业的水平线已经彻底改变了。
回顾过去两年,行业的注意力主要集中在模型训练上,核心议题始终是“大模型能力够不够强”、“刷榜速度快不快”。然而,随着Agent加速落地,越来越多的企业开始发现,真正消耗海量资源的其实是推理阶段。训练可能只发生一次,但推理会长期、持续地发生。未来,80%以上的算力消耗,都可能来自于推理与Agent的日常运行。
这意味着,AI产业正从一次性的研发逻辑,转向持续性的工业化运营逻辑。企业开始关心新的问题:模型已经足够聪明了,但如何把它变成一个稳定、可控、可规模化的AI生产系统?
这正是AI工厂概念迅速升温的核心原因。
根据Omdia报告的定义,传统数据中心,本质上是在提供服务器、存储与网络资源;AIDC(智算中心)则主要提供GPU算力;而AI工厂输出的,已经不再是简单的“计算资源”,而是企业级的AI能力、智能体以及Token生产能力。
一旦进入AI工业化运营的逻辑,企业关心的指标也随之变化。他们不再只盯着模型性能参数,而是开始追问:单位Token的成本到底是多少?GPU利用率能不能持续提升?多种国产芯片能否混合运行?推理与训练任务能否动态调度?电力成本是否还有压缩空间?Agent一旦失控,如何保障核心业务安全?
这些问题,本质上都是基础设施问题。
Omdia在报告中明确指出,AI工厂已经不是传统数据中心的升级版,而是一种“以生产智能为目标的新型工业基础设施”。
全球科技产业的重心,也开始集体向这里迁移。
一边是海外巨头的全面加码。英伟达、微软、亚马逊、谷歌持续扩张其AI基础设施版图;另一边,中国市场也正进入AI工厂建设的高峰期。特别是在金融、政务、能源、制造等行业,越来越多的头部企业开始推进私有化AI工厂的建设。
全球AI工厂市场随之演变出了不同类型的核心参与者:有提供“一体化盒子”的私有AI底座供应商,有提供端到端服务的全栈公有云巨头,有主打极致性能的算力原生AI云,也有深耕本地化服务的区域运营商。竞争的焦点在于,谁能把Token的价值密度做得更高,谁就有望占据优势生态位。
▲全球AI工厂市场演变出了四类核心玩家群体
在这场激烈的角逐中,Omdia之所以将商汤大装置推举为“智能精炼范式”的开创者,核心在于其率先完成了从“算力生产能源公司”向“企业级智能制造工厂”的进化。
所谓“智能精炼”,本质上是通过一套围绕模型生产和智能输出构建的完整系统工程,形成“智能生产线”的运行模式,把原始算力、推理服务、数据处理、模型测评、算力调度等环节深度融合,最终实现更高效的Token生产。代继表示,商汤大装置是在这一领域最早布局的代表性玩家之一。
二、为什么是商汤大装置?五层架构,把算力数据炼成生产力
事实上,商汤布局AI工厂,并非始于今年。
早在2022年,当行业还在争论“大模型到底有没有商业价值”时,商汤内部就已经提出了“AI数字工厂”的构想。
过去几年,商汤大装置逐渐打磨出一套完整的“五层架构”。而这套架构,正是围绕AI工厂落地过程中最棘手的问题逐层展开的。
1、能源与物理层:联手“宁王”,先解决“电老虎”痛点
AI工厂首先要面对的,是能源问题。
AI时代的数据中心,耗电量远超传统IDC。尤其在推理规模持续爆发之后,电力已经成为AI工厂最核心的运营成本之一。可以说,AI工厂的竞争,首先是能源效率的竞争。
为此,商汤大装置与宁德时代合作,在临港智算中心落地了算电协同平台。其核心目标是通过电力预测、储能调度与负载优化,让整个AI工厂的运行效率最大化。
根据Omdia的数据,该系统的能源预测准确率达到88%,决策准确率达到93%,PUE(能源使用效率)降至1.265,年节约电费约7%,实现每万P算力碳减排4000吨。
在AI进入高耗能时代后,“电”已经不再是辅助资源,而是AI工厂核心生产资料的一部分。
2、异构算力层:真正难啃的,是国产芯片碎片化
如果说能源是AI工厂的血液,那么异构芯片的协同,就是最难打通的神经系统。
代继坦言,五层架构里最难的一层,就是异构算力层。原因很简单:国产芯片生态高度碎片化。每一家国产AI芯片或GPU厂商,几乎都是一个独立的“黑盒”。不同芯片拥有不同的通信协议、调度方式和硬件架构,很难通过统一方法实现高效协同。
而现实情况是,很多大型企业内部,本身就已经采购了多个品牌的AI芯片。“每个客户基本都会有一点。”代继说,“你必须帮他把这些东西真正协同起来。”
据了解,商汤大装置率先实现了万卡级国产GPU集群的异构混合训练。Omdia数据显示,其异构训练效率已达到同构训练的95%水平。这意味着,客户无需再过多关注不同芯片之间的适配与调度问题,商汤在底层就把这些碎片化难题解决了。
这背后,是长期底层优化能力的积累。代继透露,很多国产AI芯片的优化,往往需要针对具体的超级节点、交换机结构、通信协议逐层写代码、调优。这不是简单地把任务拉起来跑就行,而是必须清楚知道每一层的瓶颈在哪里,并不断调整到最优值。
这种能力,很难通过短期堆砌资源获得。
3、调度平台层:AI工厂最大的浪费,是GPU闲着
AI工厂需要同时服务训练和推理两种截然不同的工作负载,这就必须实现“训推共池”。
过去,很多训练集群一旦任务结束,大量GPU就会出现空转;而推理系统则可能在业务高峰期爆满、低谷期闲置。如何在同一资源池中实现两者的高效共存,避免资源浪费的同时保障服务等级协议(SLA),是全行业的共同难题。
为此,商汤大装置通过自研训练框架,开发并优化多种并行策略,以提升训练性能和显存管理效率。同时,平台支持开源vLLM及自研LightLLM双推理引擎,极大提升了推理效率并压低了推理成本。
本质上,AI工厂已经越来越像现代工业流水线。对于金融、政务等对稳定性要求极高的客户而言,这一层直接决定了AI能力能否安全、可靠地进入核心生产环节。
4、MaaS层:模型正在变成开放部署的“工业零部件”
在模型层,行业也发生了明显的变化。
过去,大模型公司普遍希望通过闭源模型建立技术壁垒;但随着开源模型快速成熟,行业开始意识到,模型本身正在逐渐变成一种标准化的能力。
商汤大装置的MaaS层,并非单纯提供自研模型,而是整合了“日日新”大模型与大量第三方开源模型,形成一个统一的调用平台,提供模型部署、模型推理、Agent开发等一站式能力。
企业面对琳琅满目的开源模型和商业模型,往往不知道如何选择、如何调优、如何部署。商汤的MaaS层整合了“日日新”大模型及第三方开源模型,提供一站式模型服务,让企业可以从海量选项中抽身,聚焦于自身的业务逻辑。
模型,正在从“明星产品”变成开放选项的“工业零部件”。
5、产业应用层:真正有价值的,是场景化Token
五层架构中,最接近业务价值的一层是应用层,也是客户获得感最强的层面。
代继认为,企业真正需要的不是“通用Token”,而是“场景化Token”。也就是说,这个Token必须具备行业理解能力,融合了AIGC、具身智能、AI4S(AI for Science)等场景的高浓度产业知识,从而成为真正理解业务流程、专业知识与安全边界的智能系统。
商汤过去十几年在产业中积累的大量经验,也开始在这一层形成复利效应。
例如,其与铁一院合作打造了铁路设计领域首个多模态大模型,贯通28个专业知识体系,测试准确率超过90%;与上海市规划资源局共建了6000亿参数的“云宇星空”大模型,构建“1+6”模型体系,精准支撑复杂的城市空间治理需求。
代继指出,相比纯SaaS层的后来者,商汤大装置拥有更深的物理层控制力,它是智能的“原始生产商”,因此交付成本更低、稳定性更强。而相比传统云厂商,商汤大装置又是AI原生的,没有历史技术架构的包袱。
三、OpenAI、Anthropic刚下场,中国厂商已提前卡位“场景化Token”
近期,Anthropic与黑石成立AI原生企业服务公司,OpenAI也设立新公司杀入企业级部署市场。当这些模型巨头们纷纷从线上走向线下,商汤大装置的护城河究竟在哪里?
答案的核心,依然在于“场景化Token”。
代继谈到,企业级AI与消费级AI存在较大区别。制造、能源、交通、城市治理等传统行业的客户,往往缺少完整的AI技术团队,或技术人才储备不足,难以直接将GPU和模型转化为生产力。从基础设施到业务价值之间,存在一条极长的落地鸿沟。而真正决定企业AI成败的,往往是行业Know-How、部署能力与场景理解深度。
这也是为什么,OpenAI和Anthropic开始大量招聘行业专家,并向FDE(前沿部署工程师)模式靠拢。但当这些巨头刚刚开始敲门时,商汤大装置早已在门内完成了布局。
过去十几年,商汤在智慧城市、医疗、交通、具身智能、AIGC等领域积累的大量行业知识,被重新萃取、嵌入到模型与服务体系之中。最终,客户调用的已经不是一个“裸模型”,而是一套具备深刻场景理解能力的智能解决方案。
这也正切中了当前企业市场最核心的变化。国内各行业客户的核心诉求尤为鲜明:强调全掌控、私有化、可控、安全、深度参与。
代继透露,目前国内增长最快的,仍然是私有化AI工厂。因为企业并不希望AI成为一个无法掌控的黑盒。“如果你用这套系统驱动核心业务,一旦失控,整个产线都可能挂掉。”他说。
因此,未来的企业AI大概率不会是完全自主的Agent,而会是“Agent + Workflow(工作流)”的混合架构。
在企业服务商业模式的探索上,美国数据巨头Palantir依靠FDE(前沿部署工程师)模式斩获的高速增长震动了业界。代继坦言,商汤大装置目前的进化逻辑与Palantir不谋而合,正重点推动FDE深度赋能模式,集中优势资源突破头部的关键客户(Key Account)。
这也从行业角度解释了,为什么AI工厂最终会越来越像工业系统,而非互联网产品。
从金融行业的碎片化算力整合,到与上海市规划资源局共建的6000亿参数政务大模型,再到企业核心业务中的可控Agent体系,商汤大装置正在通过一次次高复杂度项目的淬炼,把“原生AI云 + 深刻场景理解”的能力融入AI工厂,修筑起一道难以逾越的护城河。
结语:2030年的AI赢家,属于今天的“智能精炼师”
Omdia预测,到2030年,全球数据中心市场累计投资将接近1.6万亿美元。资本正从“买算力”转向“建工厂”,这场竞赛的终局,将是能源、算力、算法、场景与服务的系统性角力。
OpenAI与Anthropic的入场,印证了企业级AI市场的巨大引力。而商汤大装置凭借其前瞻布局的“AI数字工厂”五层架构,包括硬核的算电协同与异构混训能力,以及深入产业肌理的“智能精炼”范式,已在这场全球性的基础设施重构中,率先卡住了关键生态位。
正如黄仁勋所言,AI模型可以复制,但AI工厂不能。那些率先成为“智能精炼师”的先行者,有望定义下一个时代的产业格局。




