英特尔至强6 CPU深度评测:AI智能体时代首选处理器
2026年6月5日,在北京的英特尔至强6新品发布会暨数据中心创新日上,英特尔抛出的判断挺有意思:当AI这艘大船,从“炼大模型”的航道全面转向“用智能体”的深水区,数据中心对算力的诉求正在加速回归CPU。注意,这不是要唱衰GPU,而是对AI基础设施进行的一次系统性“体检”和重启。
英特尔市场营销集团副总裁兼中国区总经理郭威在会上点明了风向——AI基础设施的格局正被算力、数据、算法和网络这几个关键词重新定义。当AI往云端、边缘、终端更广泛地渗透,混合式AI成为主旋律时,CPU作为那个“中枢”的角色越来越突出。用他的话说,面向智能体时代,CPU、GPU、存储和网络的高效协同,才是真正释放AI规模化应用价值的关键。
支撑这个判断的,是一组耐人寻味的数据:2025年,中国AI推理数据量首次反超训练数据量;预计到2026至2027年,企业场景中活跃的智能体数量将同比增长超过200%。当工作负载的重心从“做大模型”转向“用智能体”,围绕“算力、存力、连接力、保障力”的新型智算中心底座之争,已经正式打响。
从1:8到1:1,智能体时代的CPU回归
回看大模型训练时代,一台GPU服务器配两颗CPU,1:8的配比很经典。那时CPU更像是“打下手”的,干干数据预处理和任务调度的活。但海量智能体跑起来后,游戏规则变了。
“过去几个月我们观察到,不管你养了多少个智能体,每个都会消耗CPU;当你要让它去调用数据库、执行一段脚本,这又会额外占用CPU算力。”英特尔数据中心集团副总裁兼中国区总经理陈葆立在媒体群访里透露了一个真实案例:国内某领先大模型厂商,从去年到今年,CPU需求直接翻了5倍。他判断,CPU与GPU的比例正从1:8慢慢走向1:1甚至更高。最根本的逻辑在于:“当你要给AI更多任务的时候,绝大多数任务的执行者是CPU。”
这个观点,产业链伙伴也深有同感。腾讯云计算产品运营总监周驰从业务体量的角度给出了另一种视角。他描述了一个“破圈”现象:腾讯第一次在线下推广智能体应用时,来体验的不光有开发者,更多的是律师、白领、工人、农民,甚至七八十岁的老人和十来岁的小朋友。“他们都能讲出来我想用智能体干什么,这个破圈现象非常强烈。”
破圈带来的结果是,大量过去因为ROI不合算而没被开发的琐碎、个性化需求,开始被AI自动化。这些高并发、需求多样但单点算力要求不高的任务,不需要昂贵的GPU,反而极其渴望高密度、高性价比、擅长调度和持续处理的CPU。周驰判断,从全球CPU装机量来看,这将是一个巨大的增量。
作为基础设施提供商,云尖信息副总裁张欢军从服务器架构角度观察到,token爆发式增长带来的数据入口、调度、路由,甚至token化处理,几乎全部在CPU集群上完成。“过去几年GPU发展快,是大家都在聚焦大模型。现在Agentic AI出现,这种主动的、目标驱动的AI,让业务负载主要转移到了CPU上。”他设想,未来企业级Agent大量涌现后,CPU的比重会越来越大。
至强6 :“四力”齐发,系统思维破解智算痛点
正是抓住了这个趋势,英特尔推出了全新的至强6处理器。作为首款基于Intel 18A制程的数据中心CPU,这可不是一次简单的产品升级,而是围绕Agentic AI时代智算中心的痛点,从四个维度进行了系统性革新。
算力上,至强6处理器最高有288个能效核心,能在单个液冷机架(32U空间)内提供36864个核心,用高密度来承载多智能体的并发运行。内置的AMX技术还能分担AI数据预处理,为向量数据库加速。简单说,就是为云端提供更高并发、更低时延、更优能效的算力服务。
存力方面,全新的至强6处理器不仅拥有576MB三级缓存,还支持12通道DDR5内存、96通道PCIe Gen 5。搭配英特尔QAT,可以解放CPU处理能力,加速压缩、重删、传输等存储工作负载。
陈葆立点出了一个行业痛点:当下大模型的上下文窗口动不动就百万token,未来可能到几百万,由此产生的KV Cache会迅速塞满昂贵的显存。行业趋势是把这些数据卸到内存或SSD里,结果高端SSD变得“奇货可居”。
“至强6处理器还有两个重要技术,是解决这个痛点的两把‘金钥匙’。”英特尔中国区技术部总经理高宇强调,QAT和IAA正是为此而生。QAT能在KV Cache存盘前进行硬件级压缩,压缩比至少达50%,直接省下一半存储成本。IAA则能对内存数据进行实时压缩和解压,在不影响加载速度的前提下,大幅节省宝贵的内存资源。高宇感慨:“以前大家觉得改软件来用这些功能挺麻烦,但今天能省下几千、几万块,大家都抢着用了。机会真是留给有准备的人的。”
连接力上,至强6处理器提供从200GbE到800GbE的持续迭代。最新推出的英特尔以太网E835控制器,支持从10GbE到200GbE吞吐量的灵活扩展,通过提高每核带宽,在高密度虚拟化环境中充分释放高核心数CPU平台的性能。
保障力上,至强6处理器通过6大类52项RAS功能(可靠性、可用性、可服务性),利用英特尔TDX构建端到端的机密计算环境,为AI服务器和集群的高可靠、高可用和高可维护提供硬核守护。
单颗处理器支持“1000个智能体部署”
发布会现场,“单颗至强6处理器支持上千智能体”的说法挺让人印象深刻。这个极限能力在随后的群访中得到了更细致的解构,也揭示了英特尔面向智能体时代极致的弹性。
陈葆立把智能体比喻成“数字员工”,认为能力有高低之分,硬件配置也得因地制宜。支持上千智能体的案例,是通过至强6的单核架构优化,把一颗物理核心的算力资源精细切分,同时“分身”运行3到4个智能体。不过他坦言,这种模式更适合处理市场调研、查询信息等相对简单的日常工作,单个智能体的绝对性能会有所取舍。在当前大量探索性、甚至免费的服务阶段,这能最大化固定资产的利用效率,承载海量用户。等未来高价值付费服务出现,单个智能体就需要更强的能力保障,资源配比自然会走向新的平衡。
这种技术上的“弹性”,不光体现在核心资源的切分上,更贯穿于处理器未来的宏观设计。面对“大核”还是“小核”的行业争论,陈葆立给出了明确的回答:两者都需要,并确认超线程技术将回归。根本目的是给客户提供选择自由度。如果业务需要海量并发线程,可以开启超线程让虚拟核数翻倍;如果追求极致的单核性能来处理数据库调用等重型任务,则可以关闭该功能。“我们会持续把产品迭代的弹性做进去,以支撑未来各种不同的变化。”
这种灵活应变的底层能力,正是为了承接云尖信息副总裁张欢军所观察到的产业需求:在GPU机头侧需要处理复杂调度的“大核”,而在承载海量轻量级智能体本体运行时,则需要高能效的“能效核”。英特尔同时拥有并能无缝兼容这两种架构,让基础设施厂商能针对不同业务场景灵活定制。
那么,这是否意味着,未来客户可能只需要直接提出对于智能体需求,说明自己需要什么样的智能体能力就行,而不是像现在这样,要提具体需要多大的内存、什么配置的CPU?然后云服务商通过提供智能体的这种服务能力,来形成一种全新的商业模式?
对于这个问题,腾讯云计算产品运营总监周驰回应道:“我觉得这已经不是未来了。” 他透露,腾讯云已推出to B的“ClawPro”平台,为企业搭建好一整套包含用户管理、安全审计等能力的智能体平台。员工只需一键认领一个智能体,不用关心背后是多少核、多大内存的服务器。而在to C领域,“LightVela”则将这一理念贯彻得更彻底,完全屏蔽了技术概念,让非技术背景的用户感觉只是在“养一只能帮自己打工的虾”,需要更强能力时再进行“升格”。这种将智能体作为一种服务直接交付的模式,正在模糊传统IaaS、PaaS的界限,不再售卖算力资源,而是直接交付生产力。
这或许就是Agentic AI时代最迷人的变革:当基础设施具备了高度的弹性,当底层芯片的复杂性被巧妙地封装和调度,最终用户触到的,将不再是冰冷的服务器和晦涩的参数,而是一个个活生生的、即取即用的“数字员工”。英特尔与它的生态伙伴们,正在为这幅图景铺设最底层的基石。
生态共振:加速落地
技术能力的释放,最终需要落地于场景。在此次发布会上,多家国内空间领军企业展示了基于英特尔至强6的合作成果,勾勒出Agentic AI落地的真实图景。
腾讯云基于全栈自研的星星海服务器,即将推出搭载至强6的新一代云实例。周驰透露,从上一代能效核开始,腾讯云就是其AP平台的全球独占伙伴,早期的合作已广泛应用于微信、腾讯广告、腾讯会议等业务。新一代实例将释放288核的并发优势,恰好匹配智能体场景“对单个处理要求不高,但需求量巨大”的特点。
针对KV Cache带来的存储焦虑,新华三展示的UniStor X20000 AI数据存储平台,借助至强的高性能存力进行I/O数据流优化,以提升推理效率。阿里云则带来了QAT的实践,其在加解密、压缩/解压缩场景下性能提升超4倍,实现了物理空间、系统带宽和能效的全面优化。而火山引擎发布的AICC机密计算平台,则利用英特尔TDX技术,为多租户环境下的AI大模型应用构建了可信执行环境。
“我们回归到底层的技术和架构设计,英特尔在连续迭代和架构一致性上非常出色。”云尖信息副总裁张欢军指出,对于硬件厂商而言,无需重新设计硬件、即插即用的兼容性,是快速响应市场需求的关键。
小结
从大模型到智能体,AI的竞争焦点正从单一的峰值算力,转向由系统级能力支撑的规模化、普惠化应用。在这场变革中,以英特尔至强为代表的x86 CPU,不仅是PC与服务器时代的开创者,更是新的智能体时代智算基础设施的关键底座。
尽管前景光明,但所有参与者都清醒地认识到,Agentic AI时代的大幕刚刚拉开。当被问及芯片缺货问题时,陈葆立坦言,从去年年底开始感受到了非常强劲的需求,紧张态势短期内可见。他的底气在于,英特尔是唯一拥有自己产能的CPU/GPU芯片公司,能够为供应提供保障。但他也谨慎地表示:“这个需求能否持续旺盛,最终取决于AI是否真正提升了生产力。现在还处在非常非常早期的阶段。”






