高通计算连续体:智能体新基建排行与Token暴涨应对

2026-06-20阅读 0热度 0
智能体

这几天,COMPUTEX的动静不小,全球科技圈的目光都聚过来了。昨天,大会正式拉开帷幕,英伟达和高通的重磅主题演讲,迅速点燃了行业的热议。黄仁勋再次强调AI Agent是未来的重头戏,专门为智能体打造的CPU也正式亮相;另一边,高通CEO安蒙在题为《智能体之年》的演讲中,释放了一个清晰信号:这家公司正在为已经开启的智能体AI时代,铺设底层的硬件和系统基建。

作为2026上半年AI领域绕不开的关键词,智能体再一次成为了科技巨头们叙事的中心。这次,这条主线进一步落到了AI硬件和基础设施层面。从AI PC、机器人到数据中心,各家围绕智能体算力、连接与终端部署,展开了一场竞逐。

眼下,智能体已经在手机和PC端率先落地。相比之下,机器人、可穿戴、XR设备、车载、边缘等硬件,虽然想象空间同样很大,但受限于硬件成本、场景复杂度以及生态成熟度,离真正大规模部署还有一段距离。如何让智能体进入更多终端,成了安蒙这次演讲的重点。

对于高通这样的硬件厂商,这早已不是单纯地把AI塞进更多设备的问题了。它更多考验的是,如何把芯片、连接、系统软件和生态能力组织起来,提供一套能支撑智能体长时间运行、低功耗响应、跨终端协同的“底座”。高通给出了它的选择,代号叫做“计算连续体”。这个概念的目标,是把可穿戴、手机、PC、汽车、机器人、边缘设备和数据中心等不同层级的计算节点全部连接起来,让智能体根据任务需求,灵活地运行在最适合的位置上。按照这个逻辑,未来实时交互和隐私敏感任务留在端侧,现场化、低延迟任务交给边缘设备,更复杂的大规模推理则由数据中心来承担。

通过这场演讲,安蒙真正想讲清楚的是,智能体走向更广阔的现实世界,究竟需要什么样的新型基础设施。从个性化体验到大规模推理,从端侧能效到云端算力,高通希望借助“计算连续体”,把所有必要的能力串起来。

为什么智能体AI时代需要“新基建”?

安蒙在演讲一开始就抛出了一个很关键的观点:今天的设备,本质上并不是为智能体体验设计的。手机、PC、操作系统和应用,长期以来都是围绕人类主动操作构建的。

但随着智能体成为大模型应用的主要形态,情况变了。它会持续运行、保留上下文、主动规划、多步执行,还可能在后台调用多个服务。这就带来了一系列全新的系统要求。

首先,设备需要常驻智能。

我们不妨回忆一下以前是怎么用AI的:打开对话框,提问,等待回答,最后关掉。人是发起者,AI是应答者,一切围绕单次交互进行。智能体的出现碘伏了这套逻辑,它们要在后台持续运行,理解日程、任务、环境、位置、设备状态等上下文,并针对实时指令做出反馈。这对本地传感器、低功耗计算和隐私保护,都提出了更高的要求。

其次,端云必须协同。

智能体执行任务时,不可能把所有计算都放在云端,也不可能全部塞进终端设备。安蒙想要的并不是非此即彼的选择,而是一种分布式部署逻辑:任务根据时延、功耗、隐私和成本,在设备、边缘和云之间动态路由。

最后,设备需要更强的异构计算能力。

智能体不是跑一次模型、给一个答案就结束了。它要持续理解用户意图,拆解任务,调用工具,处理上下文,还要判断哪些计算留在本地,哪些交给边缘或云端。任务越复杂,设备内部的计算分工也就越重要。这大概也是安蒙反复强调CPU、NPU和GPU需要协同配合的原因。CPU不仅要负责通用计算,还要承担任务编排和系统调度;NPU和GPU则负责在本地高效运行模型,处理语音、图像、感知和部分推理任务。

基于这些判断,安蒙认为,智能体走向下一阶段的关键,在于能否真正进入设备,并在真实任务中稳定高效地跑起来。高通的答案是:计算连续体。对于未来的智能体来说,一套串联起终端、边缘和云端的分布式部署体系,几乎是必选项。

用计算连续体,拼出新基建版图

用一句话来总结,计算连续体可以理解为“一套横跨个人终端、边缘设备和数据中心的AI计算体系”。更具体地说,高通的能力目前已经覆盖了从毫瓦级的个人音频设备,一直延伸到千瓦级的数据中心系统。

先来说说个人终端,这里是智能体最贴近用户的地方。安蒙反复强调一点:智能体正在取代传统的应用程序和操作系统,成为用户数字体验的新中心。换句话说,用户不一定总是主动打开某个应用,取而代之的是,智能体在不同设备之间理解场景、接手任务。手机、PC、AI眼镜、可穿戴设备,将从单独的硬件入口,变成智能体连接用户的端点。高通在这些领域的布局早已铺开:手机这边,第五代骁龙8至尊版强化了个性化端侧AI,承担更多本地推理、上下文感知和即时交互任务;PC这边,骁龙X2 Elite系列面向Windows AI PC,承接更长时间、多窗口、多工具的智能体任务;而AI眼镜和可穿戴设备,则将智能体推到了更贴近用户的位置,可穿戴平台骁龙Wear Elite支持最大20亿参数AI模型的端侧运行,为健康、运动、生活记录、语音交互和主动提醒等持续场景提供了更佳的体验。

接下来是边缘与物理世界。智能体不只存在于手机、PC等个人终端,汽车、机器人、工业设备同样是它进入物理世界的重要端点。比如在机器人方面,这次值得关注的是高通首次亮相的跃龙IQ10 RRD全栈机器人参考设计。参数很硬核:基于跃龙IQ10处理器,最高可提供700 TOPS的AI算力,配备了18个Oryon CPU核心、多核NPU和GPU,目标是在机器人本地完成感知、规划和推理。

不同于简单地给机器人厂商一颗芯片,高通的做法是把高性能计算、多传感器接入、网络连接、实时控制和机器人软件栈,打包到一套参考系统里。这样,厂商就省去了大量的底层适配和系统拼接工作,能把更多精力放在感知、导航、操作和任务执行本身。对于高通自身而言,这也是其把移动端AI积累迁移到物理世界的关键一步。

而数据中心,则补上了计算连续体的最后一块拼图。安蒙官宣了全新的数据中心业务品牌“高通飞龙”,并表示公司已经在与超大规模云服务商和全球合作伙伴推进实际部署。更多路线图会在本月底的投资者日上公布。随着它的推出,高通的分布式部署版图,终于从端侧补齐到了云端,“计算连续体”的叙事也变得更加完整了。

最后,还有一个容易被低估的协调层——连接。多数人讨论AI时,往往只看算力,而忽视了连接。但智能体的本质是协作,多个智能体之间需要低延迟、高可靠的通信来保持协调。在这方面,高通正在积极推进AI原生的6G。在安蒙看来,6G有三根支柱:连接、分布式计算和感知。这个表述很关键,它意味着6G不再只是把数据从一个地方传到另一个地方,它已经成为了未来分布式AI系统的一部分。在智能体AI时代,网络的角色发生了变化:它不仅要连接设备,也要帮助设备协同计算,甚至参与对物理世界的感知。智能体越普及,就越需要一套能把设备、边缘、云端和网络组织起来的基础设施。6G在其中承担的,除了“连得更快”,更重要的是“让计算被更合理地分配”。

以上这些,共同构成了高通计算连续体的完整版图。智能体越往后发展,竞争就越不会只停留在某一颗芯片、某一个终端上。端、边、云、网的配合会变得越来越重要。高通想讲清楚的,正是这一点:用一套横跨全场景的分布式部署体系,来承接智能体AI时代不断增长的感知、推理和执行需求。

TCO(总拥有成本),成为新的胜负手

智能体带来的变化,不只是交互方式的改变,背后的成本结构也在悄然变化。智能体的运行方式,意味着它消耗token的速度明显加快了。安蒙提到,从单轮对话,到多轮推理,再到多步骤的智能体任务,token消耗呈数量级上升。一个复杂的智能体工作流,可能就需要上百万token。“到2030年,token总消耗量将达到惊人的4.0148×10^18。”

这背后对应的是一个非常现实的问题:要是把所有任务都交给云端处理,成本、延迟、隐私和能耗都会变成巨大的压力。对个人用户来说,体验可能变慢;对企业来说,成本会变高;对于机器人、汽车和工业设备,很多任务根本等不起云端来回响应。所以,高通强调分布式部署,其实是在回答一个很实际的问题:什么任务留在设备本地,什么任务交给边缘节点,什么任务才值得送到云端。这正是计算连续体的商业价值所在:能在本地完成的,就减少云端调用;需要低延迟的,就靠近现场处理;真正复杂的大模型推理,才交给数据中心。

安蒙在演讲中举了两个例子。在Claude Code的一次真实任务中,规划器把部分计算留在本地,只把必要内容交给云端处理,最后在结果不变的情况下,少用了约140万token,成本下降了60%。

在另一个网页生成的demo里,任务同样在端侧和云端之间做了分配,token用量减少了30%,成本降到了原来的四分之一。

对于高通来说,过去在移动设备上长期解决的问题是同一个:如何在有限的电池、散热和体积里,尽可能释放更多的算力。到了智能体AI时代,每瓦特性能的提升,将直接转化为端边云协同的成本优势。

分布式部署,高通有哪些优势?

在Computex 2026的舞台上,谈智能体的不只是高通。英伟达、联发科、英特尔也都在围绕智能体做文章。问题就在于,同样押注智能体,为什么高通更强调计算连续体?它的优势到底在哪里?

我们可以总结为以下几点。

一是,覆盖海量终端的生态入口。智能体最终要落到用户每天用的手机、PC上,也要进入汽车、工业设备和更多边缘场景。高通的底子很明显,智能手机是其传统主场,PC是近年明显加速的方向,汽车业务已经有相当深的积累,机器人和工业设备是它向外拓展的新空间。所以,高通并不是突然开始讲智能体这个概念的。更准确地说,它是在把过去几年积累下来的移动计算、连接、汽车和边缘计算能力,重新放到“智能体”这个新框架里来审视。

二是,CPU、GPU、NPU、传感器和连接能力的系统集成。智能体落到真实设备里,不只看CPU、GPU、NPU够不够强,还要看这些计算单元能否与传感器、连接、系统软件很好地配合起来。这同样是高通长期积累的优势所在。它围绕SoC、通信、传感器接口、软件栈和生态伙伴,构建起了一整套面向不同终端设备的平台能力。安蒙在演讲中反复提到端边云协同,本质上也是在强调这种系统级的能力。

三是,多元化的业务护城河,从个人计算延伸到物理AI。智能体正在重新打开设备之间的边界。对高通来说,这意味着AI的机会不再只围绕个人计算设备展开,而是会依托计算连续体,延伸到更广阔的真实世界。汽车就是一个很典型的例子。过去几年,高通在智能座舱、辅助驾驶、车载连接和边缘计算上持续投入。这些能力放到智能体AI时代,正好可以转化为车内交互、道路感知和本地决策的一部分。机器人和工业设备也是类似的逻辑,它们都需要本地计算、传感器接入、稳定连接和长期运行能力,而这些恰恰是高通一直在补的拼图。本质上说,高通在汽车、机器人和工业领域的布局,是在提前占据智能体进入物理世界的更多关键入口。

从卖芯片,到铺智能体底座

把前面的线索串起来会发现,高通在Computex 2026上,并不只是在PC、机器人或数据中心方向分别寻找新增量。更深层的变化在于,它在用“计算连续体”这个叙事,把这些看似分散的业务,重新组织到了一起。过去外界理解高通,首先想到的是芯片和通信。它为手机、PC、汽车等硬件设备提供计算与连接平台,这是它最熟悉的位置。如今,智能体AI的出现改变了这一传统分工,它们的能力释放与运行模式,天然就需要跨设备协同。

这时,单颗芯片的性能已经不是唯一的问题了。企业、开发者和设备厂商开始关心更实际的目标,比如智能体在不同设备间的稳定运行,智能体在端侧、边缘和云端之间的顺畅接力。在这种变化下,高通自身的价值也必须向上走。领先的芯片能力仍是底座,但它需要和软件栈、参考设计、开发工具、连接能力以及端边云部署方案放在一起看。这种系统化的升级,要求高通重新定义自己,“计算连续体”的意义也正在于此。

在这个过程中,高通想要强调的优势变得更加清晰:低功耗计算、连接能力、终端生态,以及正在补齐的边缘和数据中心能力。高通想争取的,不仅仅是更大的芯片市场份额,它更想成为智能体AI落地进程中,底层计算和连接体系的关键支撑者。这对应了AI产业竞争重心的变化。未来的竞争不会只在模型参数上,也不会只围绕某一个入口展开。智能体要全面进入日常生活、企业生产和更广阔的物理世界,必须运行在一张更复杂的计算网络里。设备、边缘、云、连接、软件和生态,每一层都决定着它们能否真正落地。高通现在做的事情,不再只是在这张网络里扮演芯片供应商的老角色,而是要把自己升级成“系统级AI基础设施的提供者”。这不仅仅是简单的业务边界扩张,而是高通对自身在AI产业链中的位置,进行的一次深度重塑。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策