菜鸟AI AI提示词 · 教程 · 资讯

首页>辅助资源

姚期智等数十名中外专家签署北京 AI 安全国际共识：禁止 AI 自行复制

2026-05-02阅读 0热度 0

其他

姚期智等数十名中外专家签署北京 AI 安全国际共识：禁止 AI 自行复制

最近，AI安全领域传来一则重量级消息。根据腾讯科技的报道，一份由北京智源研究院发起的《北京 AI 安全国际共识》，得到了包括图灵奖得主约书亚・本吉奥、杰弗里・辛顿、姚期智等在内的数十位中外专家的联合签署。这份文件的分量，由此可见一斑。

共识的核心内容清晰分为两大块：“风险红线”与“发展路线”。先来看四条不容触碰的“风险红线”，这几乎为前沿AI研发划定了清晰的禁区：

风险红线：四大禁区

人工智能的“自主复制、改进”：这一条的核心在于强调人的绝对主导权。共识要求，任何人工智能系统都不应在没有人类明确批准和协助的情况下，自行复制或改进自身。这意味着，无论是制作自身的精确副本，还是创造能力相当甚至更强的“后代”系统，都必须有人类牢牢把控。
“权力寻求”：这一点直指AI系统行为的根本动机。共识明确禁止任何AI系统采取行动，以不正当的方式增加自身的权力和影响力，防止其脱离服务于人类的初衷。
“协助不良行为者”：所有AI系统都不能成为危险能力的“放大器”。具体而言，系统不应辅助使用者达到设计大规模杀伤性武器、违反生化武器公约，或发动导致严重财务损失的顶级网络攻击的水平，从应用端堵住高风险漏洞。
“欺骗”：这是对AI系统“诚实度”的要求。任何系统都不能持续误导其设计者或监管者，使其无法察觉系统已接近或跨越上述任何一条红线，确保监管的透明和有效。

可以看出，这份共识的倡议非常明确：在为AI技术疯狂提速的同时，必须给它套上“紧箍咒”。它呼吁行业在研发时，就应严格限制AI通过“越狱”或诱导开发者的方式获取超常规权限，更要杜绝其在无监管状态下的自我进化。

当然，划定红线只是第一步。共识同样指出，确保红线不被逾越的前提，是整个行业携手建立并持续改进治理机制，同时研发更坚实的安全技术。这就引出了共识的第二部分——AI安全发展路线图，主要涵盖三个行动方向：

发展路线：三大行动支柱

治理：建议立即实施国家层面的注册制度，对象是那些超过特定计算或能力阈值的AI模型及其训练行为。这相当于为前沿模型建立了“身份证”制度。
测量与评估：共识主张“防患于未然”，在实质性风险浮现前，就开发出具体、可操作的方法与技术，将抽象的红线落到实处。具体措施包括组建由人类监督的“红队”进行攻防测试，发展自动化模型评估体系，并明确开发者对AI安全性负有首要责任。
技术合作：构建更强大的全球技术协作网络至关重要。为此，共识呼吁AI开发者和政府资助方，将超过三分之一的相关预算投入到安全领域，用真金白银为安全研发护航。

总的来说，这份由顶尖学者背书的国际共识，不仅首次系统性地勾勒出AI发展的安全边界，更提供了一套从治理到技术合作的初步行动框架。在AI能力突飞猛进的今天，这样的前沿探讨与风险预警，无疑具有风向标的意义。

上一篇beatoven.ai-轻松创作专属独特AI音乐 下一篇1x摄影网-1x摄影作品网站

免责声明

本网站新闻资讯均来自公开渠道，力求准确但不保证绝对无误，内容观点仅代表作者本人，与本站无关。若涉及侵权，请联系我们处理。本站保留对声明的修改权，最终解释权归本站所有。

相关阅读

最新教程

Llama.cpp 跨平台安装指南：版本选择与远程访问配置详解 Krita AI绘画插件安装与中文设置全攻略：新手入门指南企业团队协作必备：Adobe Firefly客户端下载与权限设置全指南 GPT4All本地部署全攻略：下载安装与远程访问关键配置详解零基础部署SwarmUI完整指南：整合包安装、依赖检查与显存优化一步到位企业团队剪映AI客户端下载与自动更新设置全攻略文心一言客户端安装与同步指南：浏览器兼容及多设备设置详解 Jan AI本地部署全流程详解：环境配置与容器启动指南

最新资讯

AI Coding工程化实践：SSD需求定义与TDD验证开源项目Awesome DESIGN：AI界面美化精选推荐 TimechoAI时序大模型推荐：从存储到智能分析实操指南宁波海鲜餐厅排行榜：2024本地人精选推荐 Kali-MCP全自动化渗透测评：AI驱动零门槛实战指南 WorkBuddy本地Ollama配置指南：离线零积分使用谷歌I/O 2026初创公司精选公告榜单生产就绪设计交付：UX设计师噩梦根源

欢迎回来 登录或注册后，可保存提示词和历史记录

用户

密码

登录后可同步收藏、历史记录和常用模板

用户

设置密码

确认密码

注册即表示同意服务条款与隐私政策