AI不扩散条约解读:Anthropic为何发起

2026-06-07阅读 0热度 0
Anthropic

Anthropic 突然公开呼吁全球 AI 开发按下暂停键,这一举动让不少人感到错愕。

就在昨天,这家公司发布了一篇长文,警告业界警惕 AI 的风险——按照他们的预测,未来 AI 将具备自主开发能力,人类可能被彻底排除在研发链条之外。

消息一出,许多从业者直言“心头一紧”,仿佛看到了某种不可控的临界点正在逼近。

文章末尾,Anthropic 进一步呼吁停止内卷,转而建立一套跨机构的监督机制。

这套机制的核心理念是:让所有头部企业相互核实,确保没有人暗中加速推进 AI 研究,从而达成事实上的“全面暂停”。

这番表态迅速引爆讨论,帖子发布不到半天,浏览量便突破 1000 万。

为了深挖细节,我专门去 Anthropic 官网通读了这份报告,读完之后却发现,事情并没有表面上那么简单。

简而言之,他们确实号召放缓开发速度,但要真正让全行业同步减速,几乎不可能实现。

接下来,我们从头梳理一下整件事的逻辑。

这份报告标题为“When AI builds itself”——当 AI 开始自我迭代时。

核心论点是:当前 AI 的能力已经强到足以自我修正、自我开发。

2025 年 2 月,Anthropic 的代码库中超过 90% 仍由工程师手写。而 Claude Code 发布后,到今年 5 月,这一比例已骤降至 20%。

甚至有 Anhtropic 员工坦然承认,自己已近五个月没有写过一行代码。

AI 生成的代码不仅数量激增,质量也在稳步攀升。

下图展示了 Claude 面对四种难度任务时的完成率:过去几个月里,随着模型能力持续提升,AI 在不同难度任务上的成功率均显著上升。

即使是最困难的、没有标准答案的开放式问题,Claude 也有约 70% 的完成概率。

而这一概率在去年 9 月时,还不到 20%。

黄色至蓝色的任务层级依次为:简单任务、常规任务、实质性任务、开放式问题。

此外,Anthropic 内部多位成员表示,目前人类与 Claude 的代码质量仍处于五五开的水平。但只需要一年,这一局面就会被彻底颠覆——Claude 写出的代码质量将全面超越人类工程师。

难道人类真的要迎来“失业”时刻?

对此,Anthropic 表示他们也拿不准,干脆为人类描绘了三种可能的结局。

第一种结局:一切照旧。假设由于缺算力、缺能源、缺数据、缺算法等现实瓶颈,当前 AI 的发展已经触顶,未来再无突破空间。

不过,Anthropic 认为这种可能性极低。

第二种结局:AI 继续量变但无法质变,人与 AI 协作构建出安全可信的系统。

AI 负责绝大部分重复性工作,但审查与决策权仍掌握在人类手中——本质上只是角色转换。这看起来是一个没有重大弊端的“好结局”。

第三种结局,就是开头引发担忧的那个版本:AI 获得足够强的创造力,实现完全自主的迭代循环。

模型能力提升的唯一制约变为算力,人类可能彻底边缘化。

在此过程中,AI 可能始终保持服从,高效辅助人类;也可能彻底摆脱人类限制,走向失控。再往后,无人能预测。

正因如此,他们才发出呼吁:建立一套互相监督、全员“躺平”的探索机制,让全球各方参与进来,确保随时可以为 AI 研究踩下刹车。

说实话,刚读完这些内容时,感觉逻辑似乎站得住脚。但转念一想,问题就暴露出来了。

Anthropic 虽然列出了三种未来,但仔细分析会发现:第一种是被他们否定的“过去式”,第二种是我们正在经历的“现在式”,而第三种才是他们真正担忧的“将来式”。与其说是三种可能,不如说是层层铺垫的叙事策略。

而且整篇报告看下来,大量数据都是 Anthropic 自己定义、自己采集、自己解释、自己评价的。身兼“考生与考官”双重角色,其信服力自然要打折扣。

更何况,AI 研发是说停就能停的吗?这并非像核能那样可以靠一个“不扩散条约”来全球监管。

AI 开发只需一个数据中心就能暗地进行,监管手段根本无从谈起。

难道要让每家公司相互开放全部数据区,彼此实时监控各自 GPU 的用途?

真要追求这种程度的透明,建议 Anthropic 先带头全面开源自己的模型。

否则,这番呼吁的说服力实在有限。

而且,Anthropic 这次发声的时间节点也颇为微妙。这家公司在业界一直以“安全至上”的作风著称,但也争议不断。

做出优秀模型的企业很多,但能在“安全”人设上保持如此一致风格的,恐怕只有 A 社一家。

打开 Anthropic 官网,翻阅公司介绍,几乎每个字都在强调安全。

页面中展示着从产品到应用的全套安全管理措施,甚至为 Claude 单独撰写了“安全宪法”。

但这些安全措施真能落地吗?现实远比理想复杂。

几年前,A 社曾公开承诺:除非提前确保安全措施准备妥当,否则不会开始训练新模型。

但很快,他们撤回了这一承诺。

2025 年 2 月,面对《时代》周刊采访时,其首席科学家表示,这种单方面承诺并不合理,公司可能选择放弃。

说白了,“安全”和“发展”这两个词在硅谷就像万能箩筐,哪里需要就往哪里装。

当理想主义撞上商业竞争的白刃战,所谓的“安全”往往必须为季度财报和市场份额让步。

例如,之前大肆渲染 AI 焦虑的 OpenAI 奥特曼,最近悄然改口。他原先声称 AI 会取代大部分工作,如今却承认自己之前的判断过于草率。

英伟达的黄仁勋则更为激进。他在采访中直言:当前许多言论过于科幻、戏剧化且毫无帮助,不知道为何有些 CEO 喜欢扮演上帝,用夸大威胁来吓唬公众。

虽然不清楚他在暗指谁,但可以明显看出,即使是 AI 最前沿的玩家,观点也大相径庭。

所谓“屁股决定脑袋”,解读他们的立场必须结合其自身处境。

事实上,最近一两个月,Anthropic 的日子并不好过。

他们 3 号刚刚推出的 Claude 4.8 表现平平,昔日断档领先的优势已不复存在。

而隔壁的 OpenAI 则全面出击,在编程和图像生成领域双双开花。奥特曼更是天天在网上找各种理由重置 Codex 额度,被众多开发者视为“超级大善人”。

反观 Anthropic,为了获取更多显卡和算力来训练更强模型,他们已经提交 IPO 申请,启动融资上市准备。

一来一回,各种因素叠加,让这份“暂停”号召听起来也就不那么有分量了。

写到这里,想起今年 Google I/O 大会上 DeepMind CEO 哈萨比斯的一番话:

“我们现在正站在 AI 奇点时代的山麓。”

结果还没往上爬两步,A 社就扭过头来警告你:山上有危险,攀登需谨慎,为了大家的安全,我们一块儿别爬了。

这话有一定道理——毕竟这些大厂顶尖研究员能看到更多信息。

但多少有些像“美丽而无用的废话”。

因为,只要山在那里,人就一定会去攀登。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策