图灵奖得主迪菲预测:机器智能2050年将统治世界

2026-06-15阅读 0热度 0
人工智能

图灵奖得主Whitfield Diffie在2026智源大会发表主旨演讲。

来源|智源社区

● ● ●

人工智能领域当前最受瞩目的研究方向,正从大模型驱动的语言理解、感知生成,迈向能够自主规划、调用外部工具、连续执行任务并直接影响真实世界的AI Agent。这一转向使核心问题变得尤为尖锐——智能体的行为边界究竟该如何设定。

2026年6月12日,北京智源大会上,图灵奖得主惠特菲尔德·迪菲(Whitfield Diffie)发表题为《护AI智能体之安|御AI智能体之险》的主旨演讲。他沿着现代密码学与信息安全的发展脉络,直击一个根本追问:一个具备自主行动能力的机器,其可信赖的边界在哪里?

迪菲是现代公钥密码学的奠基人。1976年,他与马丁·赫尔曼(Martin Hellman)共同发表《New Directions in Cryptography》,提出公钥密码与数字签名的基础思想,为开放网络下的安全通信、身份验证与数字信任奠定了基石。2015年,二人因此获图灵奖。此后,迪菲先后在Sun Microsystems、ICANN等机构从事安全与密码学相关工作,并长期参与密码学公共政策讨论。

“今天我想从两个关键词切入:AI,以及Agent。”迪菲并未急于抛出技术方案,而是先对“人工智能”“Agent”“信息安全”等概念进行细致拆解。人工智能一词自诞生便伴随争议。我们可以探讨人类智能、动物智能、机器智能,甚至更具想象力的智能形态;但真正的难点在于,“智能”本身极难定义。它与意识、自主性、创造力、表达能力、主动性、学习能力乃至“心智”等概念纠缠在一起,而这些词汇听起来都“有些像我们自己”。

“我们究竟在追求什么?”AI的传统领域涵盖问题求解、语言处理、博弈、机器控制、数学、视觉等。这些看似与人类智能相关,但计算机通常并非以人类方式完成这些任务。换言之,AI并非简单复制人脑到机器中,而是让机器以自有方式完成复杂且有用的工作。

迪菲将实践中的AI概括为“使计算机执行复杂、有用、且看似人类行为的事务”

“计算机完成这些任务的方式,往往与人类不同。”AI的目标未必是复制大脑,而是创造具备未知能力的机器。沿此思路,他区分了两个方向:一是让机器做复杂且有用的事,不要求模仿人类;二是反向工程人脑,试图理解人类如何完成认知任务。今天大会聚焦的AI Agent浪潮,明显偏向前者——我们正赋予机器越来越多的外部工具、上下文和执行接口,让它们在真实环境中完成任务。

随之而来的问题也发生了转变。当机器能力不断扩展,我们不能再只问它“够不够聪明”,还必须追问它是否具备主动性,以及这种主动性是否被清晰地约束。

“Agent与普通程序或聊天机器人不同。普通聊天机器人更多是回应提问,而Agent具有主动性,会依据自身目标采取行动。”

迪菲对Agent的定义:具备主动性,能够采取行动,而非仅回应提示。

在人工智能领域,AI Agent并非全新概念,反而是一个古老话题。人类对“会行动的机器”的想象可追溯至数百年前。1770年的“机械土耳其人”国际象棋机器,后来被证实并不真正自主——内部隐藏着真人棋手。但这个故事恰好说明,人们很早就在渴望制造一种看似具备判断力与行动能力的机器。

今天情况已截然不同。这种想象正通过大模型、工具调用、自动化系统与联网软件,转变为工程现实。过去的“会行动的机器”可能只是机械表演,而当代AI Agent能够读写文件、检索信息、调用API、运行代码,甚至在复杂工作流中连续规划与执行。它越有用,就越需要权限;越接近真实工作,就越可能影响现实世界。

“因此,我们必须重新审视安全。”迪菲将当前软件安全概括为一种“反馈式”路径:先编写程序,程序出问题后再修补。这种方式类似控制论中的反馈循环——依靠故障、攻击、补丁、再部署来逐步优化系统。他说,时至今日,这仍是计算机安全的主流现实,但很难提供足够高的安全保证。尤其当AI Agent以机器速度采取行动时,“先失败、再修补”的成本将急剧上升。

面向AI Agent,真正值得追求的是更形式化的安全方法——在程序发布和运行之前,就对其行为边界获得更强确信。换言之,安全不应是事故后的补丁,而应在系统设计阶段就明确:Agent能看到什么?能调用什么?能修改什么?出现异常时如何被限制?它与其他程序、用户、数据之间的边界在哪里?

迪菲对比两种安全路径:反馈式修补与更高保证的形式化方法。

密码学是信息安全中“最成熟”的部分之一。无论是美国的AES还是中国的SM4,优秀密码系统通常能稳定运行多年。原因之一在于密码算法相对小巧,可被深入研究、分析与验证。一个对称加密算法,几行代码即可实现,其安全性虽依赖数学假设与工程细节,但至少能接受社区反复审查。

但现实世界的软件并非如此。编译器、操作系统、应用程序,以及未来大量运行的AI Agent,规模远超传统密码算法,也远超人类逐行验证的能力。安全难题不再只是证明一个小算法是否稳固,而是要理解庞大软件系统在无数状态、权限、输入和交互中的行为。

迪菲因而提出一个重要判断:我们期待AI自身能完成这类复杂验证与测试工作。AI可在发布前更充分地发现漏洞、生成测试、探索边界条件,甚至辅助形式化验证。换言之,AI不仅是安全的新挑战,也可能成为安全工程的新工具。

迪菲认为AI能显著改善发布前测试,但发布后的补丁窗口仍然危险。

但他也提醒,AI能改善发布前的测试,却无法完全解决发布后的安全问题。在软件更新世界里,攻击者会逆向分析补丁,用户往往需要数天、数周甚至数月才能完成安装,未打补丁的系统便成为攻击窗口。这一问题并不新鲜,至少可追溯至20世纪40年代;AI Agent只是将其放大到了更高速度、更高权限、更高复杂度的环境。

AI Agent的风险并不神秘。它首先继承了所有传统软件的风险。它们依然是进程,依然运行在操作系统中,依然访问文件、网络、内存、凭证和外部服务。不同之处在于,其行为更难以预测,任务链条更长,可能接触的资源更多,也更容易被人类赋予“替我完成事情”的授权。

“AI Agent本质上仍是计算过程。保护它们,需要我们保护所有计算过程所需的机制。”

那么,具体如何防范AI Agent本身可能带来的风险?迪菲特别强调Confinement,即约束与隔离。我们必须保证Agent只能访问被允许的资源,只能在授权边界内读取、调用和修改。这一点在当前编程实践中远远不够。

如果说传统软件安全关注的是“不要被外部攻击者攻破”,那么AI Agent安全还必须追问另一个问题:当Agent被赋予目标、工具和权限后,它是否会以我们不希望的方式完成任务?是否会读到不该读的数据?是否会调用不该调的接口?是否会将局部目标推进到越界的行动?因此,约束不应是事后补救,而应成为智能体系统的基础设计。迪菲借用机器人伦理中的经典想象提醒大家:机器可以服从人类命令,也可以保护自身运行,但前提是不能越过更高层级的法律、规则和安全边界。

面向AI Agent的安全核心之一,是确保其仅能访问被授权的资源。

计算与思考未必是同一回事,但在我们已知的事物中,计算比任何东西都更接近思考。这一判断并非将机器简单等同于人,而是提醒我们,计算系统正越来越深地进入那些过去只属于人类判断和行动的领域。

因此,迪菲将21世纪最重要的问题之一,指向人类与机器及其他非人类“智能”之间的互动。我们应如何向机器分配任务?在多大程度上信任机器的输出?如何限制机器的行动?如何在人类便利与系统安全之间建立制度化的平衡?这些问题不只是AI的技术问题,更是重要的社会问题。

迪菲将人类与机器、非人类智能的互动视为21世纪最重要的问题之一。

面对“机器智能是否会统治世界”的问题,迪菲没有给出简单的“是”或“否”。他提醒,机器未必以战争或冲突的形式与人类对立;更现实的情形是,人们会不断将事务交给更高效的系统处理,并逐渐接受机器在越来越多的社会与技术系统中承担运行角色。到大约2050年,机器智能可能包办大量事务。真正需要思考的是,在这一过程发生之前,我们是否已建立足够可靠的边界、规则与安全机制。

报告结尾,迪菲以犀利方式提醒听众思考机器智能扩展后的治理问题。

迪菲:“机器智能会统治世界吗?当然!人类喜欢让别人代劳,到2050年前后,机器智能将包办一切,并成为真正掌控世界运行的主角。”

现场对话

Q:密码学与现代AI系统之间的相似点和区别是什么?

A:密码学是一门严谨学科,需要明确的威胁模型与形式化证明。我们如今达到的形式化研究其实在上世纪就已开始。许多数学家对密码学感兴趣,希望构建安全的密码系统,这正是我们当时的兴趣所在。Cook与Karp等人也获得过图灵奖,当时主要问题在于复杂性原理绝非易事。一般说来,对于简单工作——比如计算机中的加法器已相当完善——我们也在考虑建立一些函数系统,递归函数理论也非常成功,如今还有NP复杂性等。可验证的密码学理论非常困难,需要完备的密码系统与解密系统。

Q:对于现代AI系统,我们是否有非常严谨的理论基础来验证其操作模式?

A:从某种程度上说,我们希望通用人工智能能胜任任何任务。因此我们需要写下关于它的规格,看它是否能符合未来的规格。先写出规格,这是非常务实的第一步。有时我们会觉得大语言模型和AI容易出现幻觉,我们希望解决幻觉问题。当前AI系统基于概率程序,但安全规则非常严格。我们一直在竭尽全力做密码学,希望让一些系统具备一定灵活度,但有时也并非面面俱到。

Q:公钥密码学的成功不仅依赖数学,还涉及协议、部署实践及标准制定等。您认为我们应如何建立大模型安全的基础设施?

A:我们花了几十年建立密码系统,制定相关协议,并在互联网上交付密码技术。如果现在重新做,未来几年内密码学也会面临新的革新——比如量子计算可能威胁现有密码系统。70年代我们就已建立早期密码系统,若要实现重大变革,必须做出非常大的调整,因此会出现密码学领域的新标准等。同样,在未来几年里我们将面对AI系统,需要逐渐理解它们,我相信它们也会不断理解我们,相互加深彼此理解。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策