Anthropic Fable 5被禁真相:GPT 5.5同款漏洞曝光

2026-06-16阅读 0热度 0
Anthropic
Anthropic 迄今为止面向公众推出的最强 AI 模型 Fable 5,从上线到下架仅仅维持了三天。在这短暂的三天里,它登顶聊天机器人竞技场榜首,编程基准测试以两位数百分比碾压 OpenAI 的 GPT 5.5,并首次向付费订阅用户开放 Mythos 级推理能力。然而,6 月 12 日特朗普政府的一纸行政指令,直接迫使这款模型下架。 Anthropic 立场清晰——政府的理由站不住脚。他们公开声明,白宫援引的漏洞根本不足以支撑整款模型下架。目前 Fable 5 能否恢复上线,完全取决于 Anthropic 与政府在出口管制分类上的谈判进展。 ## 最新进展:Anthropic 高管赴华盛顿谈判 外媒援引知情人士称,在白宫指令导致旗舰模型“断线”后,Anthropic 高级管理层正在华盛顿特区与特朗普政府紧急协商。报道进一步指出,特朗普政府不满 Anthropic 处理“越狱”投诉的方式,批评其“沟通缺乏严肃性”。 不过知情人士透露,自上周五白宫首次主动接洽以来,Anthropic 的工程师已与白宫官员进行了多轮线上会议。双方消息人士均表示,希望尽快解决这一争端。 关于下架原因,各方说法不一。有消息称,亚马逊是向白宫报告 Fable 5 和 Mythos 5 存在潜在安全漏洞的公司之一。报道显示,上周四晚间至周五上午,亚马逊与其他五家公司通知白宫,已成功演示了令人担忧的越狱操作,亚马逊 CEO 安迪·贾西亲自与特朗普政府成员进行了沟通。 与此同时,Semafor 援引匿名消息源报道称,白宫还担心“一个与中国关联的组织”已获得 Mythos 级别模型的访问权限。Semafor 指出,Anthropic 本身禁止中国用户访问其 AI 模型。 针对上述消息,亚马逊发言人回应称:“政府就潜在安全风险咨询我们并不罕见,我们不会透露具体讨论细节。” Anthropic 发言人则表示,在白宫关于越狱和出口管制的对话中,从未提及中国访问 Mythos 一事。该公司确实禁止中国境内用户访问其产品。 ## 白宫公开立场:修复安全漏洞后 Fable 可重新面向公众发布 需要澄清一点,Fable 5 和 Mythos 5 均属于“Mythos 级”模型,基于 Claude Mythos Preview 相同核心技术,面向付费 Claude 账户开放。Fable 5 于 6 月 9 日发布,是 Anthropic 首款面向公众的 Mythos 级模型,提供 100 万 token 上下文窗口和 12.8 万输出 token。Anthropic 原计划向 Pro、Max、Team 及 Enterprise 订阅者免费开放至 6 月 22 日,但政府指令使该促销窗口仅三天便关闭。 Mythos Preview 是 Anthropic 于 4 月发布的模型,公司当时声称其能力过强、易被滥用,可能危及全球网络安全,因此采取极严格的发布管控,仅限少数特定公司使用,未做公开部署。而被下架的 Fable 5 和 Mythos 5 本是 Mythos Preview 的“驯化版本”——通过大量显性安全护栏使其变得安全可控。 随后上周五下午,Anthropic 接到白宫电话,被告知 Fable 5 和 Mythos 5 继续在线构成“国家安全威胁”,要求在 90 分钟内下架。后续具体细节尚不明确,但不久后 Anthropic 收到出口管制令:公司不得允许非美国公民使用其最先进的 AI 模型产品。 这意味着就连 Anthropic 自身的外籍员工也被禁止使用这些模型。特朗普政府援引一个越狱漏洞作为下架 Fable 5 及整个 Mythos 5 模型系列的理由。几小时后,这些模型彻底下线。 6 月 14 日,特朗普顾问 David Sacks 在 X 平台发文,透露白宫出口管制决定的来龙去脉。Sacks 指控称,一个同时与 Anthropic 和白宫合作的高度可信伙伴在测试 Fable 时发现了越狱方法。政府将此事告知 Anthropic 后,公司联合创始人兼 CEO Dario Amodei 表示该越狱不构成严重风险,并拒绝修复。 帖子继续写道:“过去,Anthropic 一直强调安全优先,对待安全极为认真。但这次,他们将消费模型的持续供应置于安全之上。白宫目前的期望是:Anthropic 解决安全问题,出口管制令解除,Fable 重新面向公众发布。” 这并非 Anthropic 首次与白宫发生冲突。此前他们曾游说反对特朗普政府抢先制定州级 AI 监管法规,还因模型在自主武器上的应用问题陷入僵局,目前正在起诉五角大楼。但 Sacks 表示,这些过往冲突并未影响政府对 Mythos 的决定。“那些试图转移话题、将此事与历史矛盾挂钩的人搞错了。白宫重视 Anthropic 的技术能力,并认为该问题虽然严重,但应能轻松解决。” ## 被“全面碾压”的 GPT 5.5 是否也存在相同漏洞? 对于白宫调查结果的严重性,Anthropic 此前已明确提出异议,称所识别的漏洞极为微小且公开已知,而 GPT 5.5 无需任何越狱技术就能达到同样效果。 “我们审查了该特定技术的演示,它被用于识别少量此前已知的微小漏洞。这些漏洞看似简单,我们发现其他公开模型也能在没有越狱的情况下发现它们。”Anthropic 在 6 月 12 日的声明中如此表示。他们强调,公司为 Fable 构建了强大的安全护栏,大幅降低其被用于网络安全相关任务及其他用途的可能性,以至于许多用户抱怨护栏过于严格。 Anthropic 进一步指出,特朗普政府仅提供了口头证据,证明存在一种潜在的、非通用的窄域越狱,本质上是要求模型读取特定代码库并修复软件缺陷。他们审查了一份可能作为政府指令依据的报告,证实其中展示的能力水平在其他模型(包括 OpenAI 的 GPT-5.5)中同样广泛存在,且每天都被安全防护人员用于系统维护。 这场风波的直接后果之一是,原本评估 Fable 5 并计划用于生产环境的开发者,如今只能退而选择 GPT 5.5 或 Anthropic 早期 Opus 模型。 要知道,Fable 5 与 GPT 5.5 的基准差距相当显著。在衡量模型解决开源代码库真实软件工程问题的 SWE-Bench Pro 上,Fable 5 得分 80.3%,而 GPT 5.5 仅为 58.6%,相差 22 个百分点。在相同基准的精调子集 SWE-Bench Verified 上,Fable 5 更达到 95.0%。对于编码密集型工作流,这种降级影响切实存在——SWE-Bench Pro 上 22 个百分点的差异,意味着能解决五分之四真实软件问题的模型与仅能处理大约五分之三问题的模型之间的鸿沟。 编程基准测试同样反映出类似差距。Fable 5 在 Code Arena 上领先 98 个 Elo 分,得分 1665,GPT 5.5 仅 1501。在专门测试最复杂编程任务的 FrontierCode Diamond 基准上,Fable 5 得分 29.3%,GPT 5.5 仅为 5.7%。范围更广的聊天机器人竞技场排行榜中,Fable 5 位居第一,GPT 5.5 排名第四。 当然,GPT 5.5 也有自身优势。在评估交互式终端编码任务(非代码库级别问题解决)的 Terminal-Bench 2.0 上,GPT 5.5 得分 82.7%,Fable 5 约为 88.0%。差距相对较小,且该基准侧重实时命令执行和调试,而非阅读和修补大型代码库。此外,GPT 5.5 定价为每百万输入 token 5 美元、每百万输出 token 30 美元,仅为 Fable 5 定价(10 美元和 50 美元)的一半。对于运行高容量应用、且性能差异不如成本敏感的开发者而言,即便两个模型均可用,GPT 5.5 也是更务实的选择。 ### **参考来源:** The Next Web: Anthropic Fable 5 vs OpenAI GPT 5.5 基准测试对比 Semafor: 白宫限制 Anthropic 与中国访问 Mythos 相关报道
免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策