智源大会AI安全热议:图灵奖得主建议接纳概率性风险

2026-06-13阅读 0热度 0
人工智能

6月12日,第八届北京智源大会现场,智源研究院院长王仲远披露了一组关键数据:截至目前,智源开源模型数量已超过200个,全球累计下载量正式突破10亿次。这一数字直观印证了开源生态的蓬勃活力,但更值得深挖的,是开幕式上反复提及的另一个主线议题——AI安全。

行业现在追问的是一个极为现实的问题:如何让AI稳定、持续且安全地嵌入真实世界交互,真正融入工作流与社会系统?这已不再是理论推演,而是迫在眉睫的工程级挑战。

王仲远在采访中指出一个关键转折:前两年业界更多担忧超级人工智能的远期风险,而眼下,随着AI智能体与模型自进化能力的快速演进,大量可复现的安全威胁已经摆在台面上。相关工具能绕过现有筛查机制,合成有害蛋白质、突破网络漏洞——生物安全与网络安全的威胁正变得异常具体,不再是科幻小说中的虚构桥段。

谈及AI安全,Anthropic是目前全球立场最鲜明的厂商。CEO Dario Amodei断言AI系统正在逼近递归自我改进的临界点,他甚至呼吁行业暂停前沿AI开发,并提出《人工智能指数政策》,强调若按当前速度再推进一到两年,世界很可能迎来他定义的强人工智能。

对此王仲远回应称,大模型的递归自进化能力确实放大了安全隐患,近期行业也在集中讨论头部模型对网络安全、生物安全、管理安全的影响,这些问题已刻不容缓。但他同时强调,这绝非一家科研机构能够独立破解,需要全行业合力应对——包括产业链升级、跨领域专家协作、政策与法规制定,最终达成更平滑的过渡。

现场,2015年图灵奖得主Whitfield Diffie同样聚焦安全议题。他给出的观察颇为耐人寻味:目前行业主流的安全运维模式本质上是控制论思路——程序出漏洞就修复,发现异常就调整,如同反复转动船舵修正航向。但AI智能体的安全防护存在明显短板:程序与子进程的权限管控机制尚不完善,无法严格限定行为边界,程序往往能突破预设范围执行操作。这让人联想到用工法律中的权责模糊困境——边界不清引发的管理难题。

整体来看,Diffie认为人机交互将成为21世纪的核心议题,重要性甚至超过国际关系、核战争、全球变暖这些传统话题。至于AI最终是否会接管世界?他的回答干脆利落:会。但他紧接着补充,人机之间不会爆发战争,未来机器将持续为人类分担工作、提升效率,而人类也乐于接受这种协作安排。

从安全态度上看,相比Anthropic渲染的AI恐慌,一种更务实的思路正在行业形成共识——不追求绝对的“零风险”。Diffie说得很透彻:安全本身就不是确定性事件,人类出行都带有概率性风险,AI安全同样如此。密码学追求绝对的规则约束,但AI安全必须接纳概率特征。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策