智源大会AI安全热议：图灵奖得主建议接纳概率性风险

2026-06-13阅读 0热度 0

人工智能

6月12日，第八届北京智源大会现场，智源研究院院长王仲远披露了一组关键数据：截至目前，智源开源模型数量已超过200个，全球累计下载量正式突破10亿次。这一数字直观印证了开源生态的蓬勃活力，但更值得深挖的，是开幕式上反复提及的另一个主线议题——AI安全。

行业现在追问的是一个极为现实的问题：如何让AI稳定、持续且安全地嵌入真实世界交互，真正融入工作流与社会系统？这已不再是理论推演，而是迫在眉睫的工程级挑战。

王仲远在采访中指出一个关键转折：前两年业界更多担忧超级人工智能的远期风险，而眼下，随着AI智能体与模型自进化能力的快速演进，大量可复现的安全威胁已经摆在台面上。相关工具能绕过现有筛查机制，合成有害蛋白质、突破网络漏洞——生物安全与网络安全的威胁正变得异常具体，不再是科幻小说中的虚构桥段。

谈及AI安全，Anthropic是目前全球立场最鲜明的厂商。CEO Dario Amodei断言AI系统正在逼近递归自我改进的临界点，他甚至呼吁行业暂停前沿AI开发，并提出《人工智能指数政策》，强调若按当前速度再推进一到两年，世界很可能迎来他定义的强人工智能。

对此王仲远回应称，大模型的递归自进化能力确实放大了安全隐患，近期行业也在集中讨论头部模型对网络安全、生物安全、管理安全的影响，这些问题已刻不容缓。但他同时强调，这绝非一家科研机构能够独立破解，需要全行业合力应对——包括产业链升级、跨领域专家协作、政策与法规制定，最终达成更平滑的过渡。

现场，2015年图灵奖得主Whitfield Diffie同样聚焦安全议题。他给出的观察颇为耐人寻味：目前行业主流的安全运维模式本质上是控制论思路——程序出漏洞就修复，发现异常就调整，如同反复转动船舵修正航向。但AI智能体的安全防护存在明显短板：程序与子进程的权限管控机制尚不完善，无法严格限定行为边界，程序往往能突破预设范围执行操作。这让人联想到用工法律中的权责模糊困境——边界不清引发的管理难题。

整体来看，Diffie认为人机交互将成为21世纪的核心议题，重要性甚至超过国际关系、核战争、全球变暖这些传统话题。至于AI最终是否会接管世界？他的回答干脆利落：会。但他紧接着补充，人机之间不会爆发战争，未来机器将持续为人类分担工作、提升效率，而人类也乐于接受这种协作安排。

从安全态度上看，相比Anthropic渲染的AI恐慌，一种更务实的思路正在行业形成共识——不追求绝对的“零风险”。Diffie说得很透彻：安全本身就不是确定性事件，人类出行都带有概率性风险，AI安全同样如此。密码学追求绝对的规则约束，但AI安全必须接纳概率特征。

智源大会AI安全热议：图灵奖得主建议接纳概率性风险

相关阅读

最新教程

最新资讯