吴泳铭:AGI只是起点,超级人工智能ASI才是终极目标
在杭州云栖大会的主旨演讲中,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭,首次系统描绘了人工智能从当前阶段迈向终极形态的清晰路径。他指出,通用人工智能(AGI)的实现已是必然,但这并非技术演进的终点,而是一个通向更宏大目标的基石:发展出具备自我迭代能力、全面超越人类的超级人工智能(ASI)。
吴泳铭在演讲中,首次完整阐述了通向超级人工智能(ASI)的三个关键演进阶段:
- 第一阶段“智能涌现”:人工智能通过深度学习海量人类知识,形成泛化性的基础智能能力。
- 第二阶段“自主行动”:AI掌握工具使用与编程能力,从被动响应转向主动“辅助人”完成任务——这正是当前产业所处的核心阶段。
- 第三阶段“自我迭代”:AI通过连接物理世界并实现自主学习,最终达成“超越人”的智能水平。
为支撑这一技术愿景,阿里云明确了其作为“全栈人工智能服务商”的双重战略核心:一是坚定推进通义千问的开源开放路线,致力于构建“AI时代的Android”生态;二是打造作为“下一代计算机”的超级AI云,构建全球智能算力网络。为此,阿里巴巴启动了为期三年、总额3800亿元的AI基础设施投资计划,并承诺将持续追加投入。一个更具前瞻性的规划是:为迎接ASI时代的算力需求,预计到2032年,阿里云全球数据中心的能耗规模将比2022年——生成式AI的爆发元年——提升10倍。
演讲全文
首先,向所有驱动中国乃至全球科技创新的开发者们致敬。今年是云栖大会十周年,而它的源头正是阿里云开发者大会。过去十年云计算与人工智能的每一次跃进,都离不开开发者社区的创造力与推动力。
当前,我们正站在一场智能化革命的开端。工业革命放大了人类的体能,信息革命放大了人类的信息处理能力。而这场由AI驱动的智能化革命,其深度与广度将远超以往。通用人工智能(AGI)不仅将极大扩展人类的智力边界、释放创造潜能,更将为超级人工智能(ASI)的诞生奠定基础。
过去三年的进展已经证明了其颠覆性速度。AI的智力水平在极短时间内从“高中生”跃升至“博士生”级别,甚至能在国际顶级学术竞赛中夺魁。AI聊天机器人成为史上用户渗透最快的应用,其行业渗透速率也打破了所有历史记录。全球AI算力消耗(Tokens)每两到三个月翻一番。更关键的是,近一年全球AI产业投资已超4000亿美元,未来五年累计投入预计将突破4万亿美元。这种规模的资本与算力投入,必将催生更强大的模型,并加速AI应用渗透至每一个行业角落。
实现AGI——一个具备人类水平通用认知能力的系统——已是确定性趋势。然而,AGI并非人工智能的终极形态,而是一个全新纪元的起点。AI的发展不会在此止步,其下一站将是能够自我进化、全面超越人类智能的超级人工智能(ASI)。
如果说AGI旨在将人类从80%的常规工作中解放出来,让我们聚焦于创造与探索,那么ASI则将可能催生出“超级科学家”与“全栈超级工程师”。它将以前所未有的效率,攻克那些长期困扰人类的科学与工程难题,无论是绝症新药、新材料发现、可持续能源方案、气候变化,还是星际航行。ASI将以指数级速度推动科技飞跃,引领我们进入一个真正意义上的智能新纪元。
通往超级人工智能(ASI)的路径,可明确划分为三个递进阶段:
第一阶段:“智能涌现”,核心是“学习人”。
过去数十年的互联网发展为这一阶段铺平了道路。互联网近乎完整地数字化了人类知识,大模型通过理解这个知识全集,从而涌现出泛化的智能。它们不仅能对话、理解意图、解答问题,更逐步发展出复杂的多步推理能力。如今,AI在各学科基准测试中已逼近人类顶尖水平。这标志着AI开始具备进入真实世界、解决实际问题、创造实际价值的能力。这是过去几年AI发展的主线。
第二阶段:“自主行动”,核心是“辅助人”。
在此阶段,AI突破了纯语言交互的局限,开始在真实世界中行动。它能在人类设定目标后,自主拆解复杂任务,使用甚至创造工具,完成与数字及物理世界的交互,产生实质性影响。这正是我们当前所处的产业阶段。 实现这一跨越,首先依赖于大模型“工具使用”(Tool Use)能力的成熟,使其能够连接各类数字化工具来完成任务。人类文明的加速始于创造和使用工具,AI如今也迈出了这一步。通过Tool Use,AI能像人类一样调用软件、API接口乃至物理设备。 其次,大模型编程(Coding)能力的突破至关重要。当前的智能体(Agent)尚处早期,主要处理标准化、短周期任务。要让Agent应对更复杂、长周期的挑战,其自主编程能力是关键。因为一旦Agent能自主编写代码,理论上就能解决无限复杂度的问题。可以说,发展大模型的编程能力是通向AGI的核心路径。 未来,自然语言将成为AI时代的源代码。任何人只需用母语描述需求,AI就能自行编写逻辑、调用工具、构建系统,完成数字世界绝大部分工作,并通过数字化接口操控物理设备。届时,为人类协同工作的Agent和机器人数量可能超过全球人口,对现实世界产生深远影响。这个过程,也将使AI连接到绝大部分真实场景与数据,为下一阶段的进化创造条件。
第三阶段:“自我迭代”,核心是“超越人”。这一阶段依赖两个不可或缺的要素:
一、连接真实世界的全量原始数据
目前AI进步最快的领域集中在内容创作、数学和编程。观察这三个领域,其共同点是知识完全由人类定义和创造,并完整存在于文本中,因此AI能100%理解原始数据。但对于更广泛的物理世界领域,当前AI接触到的更多是人类归纳后的“二手知识”,缺乏通过与物理世界直接交互获得的海量、原始、实时数据。这些经过加工的信息存在固有局限。 例如,一家汽车公司的CEO规划明年产品,需要经过多轮用户调研和内部讨论。目前让AI执行此任务仍很困难,核心障碍在于它获取的数据全是调研报告这类“二手信息”。但如果AI能直接连接该汽车从设计、生产到用户使用的全量原始数据,它规划出的下一代产品,很可能远超人类头脑风暴的结果。这仅是商业世界的一个缩影,更复杂的物理世界规律,远非人类归纳的知识所能完全涵盖。 因此,AI要实现阶跃,必须直接从物理世界获取更全面、更原始的实时数据。这类似于自动驾驶的演进:早期基于人类规则的方案效果有限,而新一代端到端方案直接从原始车载传感器数据中学习,实现了质的飞跃。连相对简单的自动驾驶都无法仅靠人类规则解决,更何况整个复杂物理世界?只有让AI与真实世界持续互动,获取真实、实时、全面的数据,才能更准确地模拟世界,发现超越人类认知的深层规律,从而催生更强大的智能。
二、自主学习(Self-learning)
随着AI渗透更多物理场景、理解更多原始数据,其模型和Agent能力将不断增强。届时,AI将有机会为自己模型的升级迭代搭建训练基础设施、优化数据流程、革新模型架构,从而实现真正的“自主学习”。这将是AI发展的关键转折点。 未来的模型将通过持续与真实世界交互,获取新数据并接收实时反馈,借助强化学习等机制,自主优化、修正偏差、实现迭代升级。每一次交互都是一次微调,每一次反馈都是一次参数优化。当经历无数次“执行-反馈”循环后,AI将自我迭代出超越人类的智能,早期的超级人工智能(ASI)便由此诞生。 一旦跨越某个技术奇点,人类社会的发展将如同按下加速键,科技进步的速度将超乎想象,新的生产力爆发将推动社会进入崭新阶段。这条通往超级人工智能的道路正日益清晰。同时,AI技术的演进与各行业需求的爆发,也正在催生IT产业的根本性变革。
第一个核心判断:大模型将成为下一代的操作系统。
大模型所代表的技术平台,将取代现有操作系统的核心地位。未来,几乎所有连接真实世界的工具接口都将与大模型链接,所有用户需求和行业应用都将通过大模型相关的工具来执行任务。大语言模型将成为承载用户、软件与AI计算资源交互调度的中间层,成为AI时代的操作系统。可以这样类比:自然语言是AI时代的编程语言,Agent就是新的软件,上下文(Context)是新的内存,大模型通过MCP这类接口连接各类工具和Agent,类似于PC时代的总线;而Agent之间通过A2A等协议协作,则类似于软件之间的API调用。 大模型将会“重构”软件生态。作为下一代操作系统,它将允许任何人用自然语言创造无限多的应用。未来,几乎所有与计算世界交互的“软件”都可能由大模型生成的Agent来担任,而非今天的传统商业软件。潜在的开发者规模将从数千万激增至数亿。过去,由于开发成本高昂,只有少数高价值场景能被转化为商业化软件。未来,所有终端用户都可以直接通过大模型工具来满足个性化需求。 模型的部署方式也将呈现多样化,它将运行在所有计算设备上。目前主流的通过API调用模型的方式,其实非常初级,类似于大型主机时代的分时复用,每个用户只有一个终端连接主机。这种方式无法解决数据持久化、长期记忆、实时性、隐私和可塑性等问题。未来的模型将运行在所有计算设备中,具备持久记忆、端云协同的能力,甚至可以随时更新参数、自我迭代,就像今天的操作系统运行在各种环境中一样。 正是基于这一判断,阿里云做出了关键的战略选择:让通义千问坚定走开源开放路线,目标是打造“AI时代的Android”。在大模型时代,开源模型所能创造的价值和渗透的场景,将远远大于闭源模型。选择开源,就是为了全力赋能开发者生态,与全球开发者共同探索AI应用的无限可能。
第二个核心判断:超级AI云将是下一代的计算机。
大模型是运行于AI云之上的新操作系统。这个系统可以满足任何人的需求。想象一下,未来每个人可能拥有几十甚至上百个Agent,它们24小时不间断地工作和协同,这需要海量的计算资源来支撑。 数据中心内的计算范式正在发生根本性转变,从以CPU为核心的传统计算,加速转向以GPU为核心的AI计算。这种新的计算范式需要更稠密的算力、更高效的网络、更大规模的集群。 这一切,都依赖于充足的能源、全栈的技术、数百万计的GPU和CPU,以及协同运作的网络、芯片、存储和数据库系统,以7x24小时处理全球各地的需求。这需要超大规模的基础设施和全栈的技术积累,只有超级AI云才能承载如此海量的需求。未来,全世界可能只会剩下少数几个这样的超级云计算平台。
在这个新时代,AI将取代能源,成为驱动千行百业运转的最核心“商品”。绝大部分AI能力将以Token的形式,在云计算网络上产生和输送。Token就是未来的电力。在这个崭新的时代,阿里云的定位是成为全栈人工智能服务商,提供世界领先的智能能力和遍布全球的AI云计算网络,向全球输出对开发者生态友好的AI服务。 首先,我们拥有全球领先的大模型系列——通义千问。它已开源300多款模型,覆盖全模态、全尺寸,是全球最受开发者欢迎的开源模型之一。截至目前,通义千问全球下载量超6亿次,衍生模型超17万个,构成了全球领先的开源模型矩阵,可以说是渗透计算设备最广泛的大模型。 同时,阿里云提供一站式模型服务平台“百炼”,支持模型定制化与Agent快速开发,并提供“AgentBay”这样的Agent运行环境,以及“灵码”、“Qoder”等一系列开发者套件,让开发者能够便捷地使用模型能力并创建Agent。 其次,阿里云运营着中国第一、全球领先的AI基础设施和云计算网络,是全球少数能够实现软硬件垂直整合的超级AI云平台之一。在硬件和网络层面,自研的核心存储系统、网络架构和计算芯片,构成了阿里云超大规模计算集群的坚实底座。 目前,阿里云正在全力打造一台全新的AI超级计算机。它同时拥有最领先的AI基础设施和最领先的模型,能够在基础架构与模型架构上进行协同创新,从而确保在阿里云上调用和训练大模型时达到最高效率,使其成为开发者最好用的AI云。 AI行业的发展速度和对基础设施的需求,都远超预期。我们正在积极推进三年3800亿元的AI基础设施建设计划,并将持续追加投入。从行业远期发展和客户需求来看,为迎接ASI时代,到2032年,阿里云全球数据中心的能耗规模预计将比2022年提升10倍。这是我们的远期规划,我们相信通过这种饱和式的投入,能够有力推动AI行业发展,迎接ASI时代的到来。
那么,当超级人工智能到来后,人类与AI将如何协作?
未来的AI会越来越强大,甚至诞生超越人类智能的ASI。对此我们充满乐观,届时人类与AI将形成一种崭新的协同范式。程序员们可能已经感受到了雏形:我们只需下达一个指令,通过编程工具,AI就能在夜间用12个小时创造出我们需要的系统。这让我们看到了未来人机协同的早期形态。从“意向编程”(Vibe Coding)到“意向工作”(Vibe Working),未来每个家庭、工厂、公司都将有众多Agent和机器人24小时为我们服务。也许,未来每个人都需要调动上百张GPU芯片来为自己工作。 正如电力放大了人类的物理力量杠杆,ASI将指数级放大人类的智力杠杆。过去我们投入10小时,获得10小时的成果。未来,AI能让10小时的产出获得十倍、百倍的放大效应。回顾历史,每次技术革命在解锁新生产力后,都会创造出前所未有的新需求。人类将变得比历史上任何时候都更加强大。 最后,必须强调,一切才刚刚开始。AI将重构整个基础设施、软件和应用体系,成为真实世界的核心驱动力,掀起新一轮智能化革命。阿里巴巴将持续投入,与合作伙伴和客户一起,推动AI深入产业,共创未来。