图灵奖得主迪菲预测:2050年机器智能主宰人类未来

2026-06-16阅读 0热度 0
人工智能

(来源:财经ThinkTank)

图灵奖得主Whitfield Diffie在智源大会发表演讲。

来源|智源社区

人工智能领域当前最受瞩目的方向,已不再局限于大模型驱动的语言理解、感知生成与内容创作——技术演进正迈向更深层的突破:让机器具备自主规划、调用外部工具、执行多步骤任务链,并对真实世界产生实质性影响。这一转向将若干原本模糊的议题推至前台:例如,智能体的行为边界究竟该如何划定?

2026年6月12日,北京智源大会上,图灵奖得主惠特菲尔德·迪菲(Whitfield Diffie)发表了题为《护AI智能体之安|御AI智能体之险》的主旨演讲。作为公钥密码学的奠基人,他并未急于抛出技术解决方案,而是沿着现代密码学与信息安全的演进脉络,追问一个根本性问题:能够自主行动的机器,如何构建可信的行动边界?

先简要回溯迪菲的学术历程。1976年,他与马丁·赫尔曼共同发表《密码学的新方向》,首次提出公钥密码与数字签名概念,为开放网络环境下的安全通信、身份认证与数字信任体系奠定了理论基础。2015年,二人因此荣获图灵奖。此后,迪菲先后在Sun Microsystems、ICANN等机构从事安全与密码学相关研究,并长期参与密码学公共政策研讨。可以说,他对“信任”与“边界”的洞察,凝聚了跨越半个世纪的深度思考。

迪菲将实践中的AI概括为“让计算机完成复杂、有用、看起来像人类行为的事情”。

演讲开篇,迪菲从两个核心概念切入:“AI”与“Agent”。他强调,“人工智能”这一术语自诞生起便饱含争议。我们可以谈论人类智能、动物智能、机器智能,甚至构想更抽象的智能形态;但真正的难点在于,“智能”本身并非一个能被轻易界定的事物。它与意识、自主性、创造性、表达能力、主动性、学习能力乃至“心智”等概念深度交织——而这些词汇,听起来都颇为“类人”。

“我们真正追求的是什么?”迪菲抛出一个根本性问题。AI的经典研究领域涵盖问题求解、自然语言处理、博弈决策、机器人控制、数学推理、计算机视觉等,表面上都与人类智能相关,但计算机往往并非以人类方式完成这些任务。换言之,AI不是简单复制人脑,而是让机器以自身方式执行复杂且有用的工作。

沿着这一思路,他区分了两个技术路径:其一,让机器完成复杂而实用的任务,至于实现方式是否模仿人类并不重要;其二,逆向解析人脑机制,试图理解人类如何执行认知任务。当前汹涌的AI Agent浪潮明显属于前者——我们正赋予机器越来越多的外部工具、交互上下文和执行接口,使其在真实环境中自主完成任务。

问题随之转移:当机器能力持续扩展,我们不能再仅仅追问它是否“聪明”,还必须审视它是否具备主动性,以及这种主动性是否受到清晰约束。

“Agent与普通程序或聊天机器人有本质区别。普通聊天机器人更多是被动回应提问,而Agent具备主动性,会根据目标主动采取行动。”迪菲一针见血地指出了两者的核心差异。

Agent的界定:具有主动性,并能采取行动,而不仅仅是回应提示。

在人工智能领域,AI Agent并非新鲜概念,反而是一个相当古老的话题。人类对“会行动的机器”的想象可追溯至数百年前。1770年问世的“机械土耳其人”国际象棋机器,后来被证实并不真正具备自主判断能力——内部藏匿着真人棋手。但这个案例恰恰说明,人类很早便渴望制造出能展现判断力与行动力的机器。

如今,不同之处在于,这一想象正通过大语言模型、工具调用框架、自动化系统及联网软件转化为工程现实。过去的“会行动的机器”或许只是机械表演,而今天的AI Agent却能够读写文件、检索信息、调用API、运行代码,甚至在复杂工作流程中连续规划并执行任务。它越有用,就越需要权限;它越接近真实业务场景,就越可能对真实世界产生影响。

“因此,我们必须重新审视安全这一概念。”迪菲的语气变得严肃。

他将当前软件安全实践概括为一种“反馈式”路径:先编写程序,程序出现故障后打补丁修复。这种方式很像控制论中的反馈循环,依赖故障、攻击、补丁和重新部署来逐步改善系统。这仍是当今计算机安全领域的主流现实,但难以提供足够高的安全保障。尤其当AI Agent开始以机器速度采取行动时,“先失败、再修补”的代价将急剧攀升。

面向AI Agent,真正值得追求的是更形式化的安全方法论——让我们能够在程序发布和实际运行之前,对其行为边界获得更强的确定性保障。安全不应只是在事故发生后添加一层补丁,而应在系统设计阶段就明确回答:这个Agent能访问哪些数据?能调用哪些接口?能修改哪些系统状态?出现异常时如何被限制?它与其他程序、用户和数据之间的边界在哪里?

密码学是信息安全领域“最成熟”的组成部分之一。无论是美国的AES,还是中国的SM4,优秀的密码系统往往可以稳定运行多年。原因在于,密码算法通常规模较小,能够被深入分析、研究并验证。一个对称加密算法可能只需寥寥几行代码即可实现,尽管安全性仍依赖数学假设和工程实现细节,但可以被社区反复审查。

然而,现实世界中的软件系统远非如此。编译器、操作系统、应用程序,以及未来大规模部署的AI Agent,其规模远超传统密码算法,也超出了人类逐行验证的能力范围。安全难题不再仅仅是证明一个小型算法是否稳固,而是理解庞大软件系统在无数状态、权限、输入和交互条件下的行为表现。

迪菲因此提出了一个关键判断:我们希望AI自身能够承担这类复杂的验证与测试工作。AI可以在发布前更充分地挖掘漏洞、生成测试用例、探索边界条件,甚至辅助形式化验证。换句话说,AI不仅是安全领域的新挑战,也可能成为安全工程的新工具。

迪菲认为AI能显著改善发布前测试,但发布后补丁窗口期仍然危险。

然而,迪菲也提醒道:AI能改善发布前的测试,却无法彻底解决发布后的安全问题。在软件更新生态中,攻击者会逆向分析补丁内容,而用户往往需要数天、数周甚至数月才能完成安装,未打补丁的系统便成为攻击窗口。这个问题并不新鲜,至少可追溯至20世纪40年代;AI Agent只是将其放大到了更高速度、更高权限、更高复杂度的环境之中。

AI Agent的风险并不神秘,它首先继承了所有传统软件的风险。它们依然是进程,依然运行在操作系统中,依然访问文件、网络、内存、凭证和外部服务。不同之处在于,它们的行为更难以预测,任务链条更长,可能接触的资源更多,也更容易被人类赋予“替我完成事情”的授权。

“AI Agent本质上仍然是计算过程。保护它们,需要保护所有计算过程所需的机制。”

那么,应该如何防范AI Agent自身带来的风险?迪菲特别强调了Confinement——约束与隔离。我们必须确保Agent只能访问被授权的资源,只能在许可边界内读取、调用和修改系统状态。这一点在现有编程实践中仍然远远不够。如果说传统软件安全关注的是“不要被外部攻击者攻破”,那么AI Agent安全还必须追问另一个问题:当Agent被赋予目标、工具和权限后,它是否可能以我们不希望的方式完成任务?它是否会读取不应访问的数据?是否会调用不该使用的接口?是否会将局部目标推进到越界行动?因此,约束不是事后的补救措施,而应成为智能体系统的基础设计原则。迪菲借机器人伦理领域的经典想象提醒听众:机器可以服从人类命令,也可以保护自身运行,但前提是不越过更高层级的法律、规则与安全边界。

AI Agent安全的核心之一,是保证其只能访问被授权的资源。

计算与思考未必是同一回事,但在我们已知的事物中,计算比任何其他东西都更接近思考。这个判断并非要将机器简单等同于人类,而是提醒我们,计算系统正越来越深地进入那些过去只属于人类判断和行动的领域。

因此,迪菲将21世纪最重要的问题之一,指向人类与机器以及其他非人类“智能”之间的互动关系。我们应该如何向机器分配任务?在多大程度上信任机器的输出?如何限制机器的行动?如何在人类便利与系统安全之间建立制度化的平衡?这些问题不仅是AI技术问题,更是重要的社会议题。

21世纪最重要的问题之一。

面对“机器智能会不会统治世界”这一命题,迪菲没有给出简单的“是”或“否”。他提醒说,机器未必会以战争或冲突的形式与人类对立;更现实的情形是,人们会不断把事务交给更高效的系统处理,并逐渐接受机器在越来越多社会与技术系统中承担运行角色。到大约2050年,机器智能可能包办大量事务。真正需要思考的是,在这一进程发生之前,我们是否已经建立了足够可靠的边界、规则和安全机制。

报告结尾处,迪菲以犀利方式提醒听众思考机器智能扩展后的治理问题。

迪菲直言:“机器智能会统治世界吗?当然!人类喜欢让别人代劳,到2050年前后,机器智能将包办一切,并成为真正掌控世界运行的主角。”

现场对话

Q:密码学和现代AI系统之间的相似点和区别是什么?

A:密码学是一门严谨的学科,需要明确的威胁模型和形式化证明。我们如今达到的形式化研究其实在上个世纪就已经开始。许多数学家都对密码学感兴趣,希望有安全的密码学系统,这是我们当时的兴趣。Cook和Karp他们也获得了图灵奖,当时主要的问题是复杂性的原理绝非易事。一般来说,对于简单的工作,比如计算机领域的加法器已经相当完善了,我们也在思考建立一些函数系统,以及递归函数理论也都非常成功,我们现在也有NP复杂性等等,可以验证的是密码学理论非常难,需要有非常完善的密码系统和解密系统。

Q:对于现代的AI系统,我们是否有非常严谨的理论基础来验证其操作模式?

A:从某种程度上说,我们希望通用人工智能能够胜任任何事情。所以我们需要写下关于它的规格以及看它是否能够符合未来的规格,我们要先写出一个规格,这是非常务实的第一步。有些时候,我们觉得对于大语言模型和AI容易出现幻觉,我们希望解决幻觉的问题。现在的AI系统是基于概率的程序,但是安全规则是非常严格的。我们一直在竭尽全力来做密码学,希望让一些系统能够具有一定灵活度,但有些时候也并不是面面俱到。

Q:公钥密码学的成功不仅仅因为数学,还因为协议、部署实践以及标准制定等工作,您觉得我们应该如何建立大模型安全的基础设施?

A:我们花了几十年时间建立密码系统,并且制定了相关的协议,并且可以在互联网上交付这种密码技术。如果现在重新做,在未来的几年里,对密码学也会有新的革新,比如通过量子计算会威胁到密码系统,在70年代我们就已经建立了这些早先的密码系统,我们要作出非常大的变革才可以进行大的革新,所以会有密码学领域新的标准等等。同样,我们在未来几年里会面对AI系统,我们需要逐渐理解它们,我相信它们也会不断理解我们,相互加深彼此的理解。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策