Anthropic Fable 5被禁真相:GPT 5.5同款漏洞曝光
## 被“全面碾压”的 GPT 5.5 是否也存在相同漏洞?
对于白宫调查结果的严重性,Anthropic 此前已明确提出异议,称所识别的漏洞极为微小且公开已知,而 GPT 5.5 无需任何越狱技术就能达到同样效果。
“我们审查了该特定技术的演示,它被用于识别少量此前已知的微小漏洞。这些漏洞看似简单,我们发现其他公开模型也能在没有越狱的情况下发现它们。”Anthropic 在 6 月 12 日的声明中如此表示。他们强调,公司为 Fable 构建了强大的安全护栏,大幅降低其被用于网络安全相关任务及其他用途的可能性,以至于许多用户抱怨护栏过于严格。
Anthropic 进一步指出,特朗普政府仅提供了口头证据,证明存在一种潜在的、非通用的窄域越狱,本质上是要求模型读取特定代码库并修复软件缺陷。他们审查了一份可能作为政府指令依据的报告,证实其中展示的能力水平在其他模型(包括 OpenAI 的 GPT-5.5)中同样广泛存在,且每天都被安全防护人员用于系统维护。
这场风波的直接后果之一是,原本评估 Fable 5 并计划用于生产环境的开发者,如今只能退而选择 GPT 5.5 或 Anthropic 早期 Opus 模型。
要知道,Fable 5 与 GPT 5.5 的基准差距相当显著。在衡量模型解决开源代码库真实软件工程问题的 SWE-Bench Pro 上,Fable 5 得分 80.3%,而 GPT 5.5 仅为 58.6%,相差 22 个百分点。在相同基准的精调子集 SWE-Bench Verified 上,Fable 5 更达到 95.0%。对于编码密集型工作流,这种降级影响切实存在——SWE-Bench Pro 上 22 个百分点的差异,意味着能解决五分之四真实软件问题的模型与仅能处理大约五分之三问题的模型之间的鸿沟。
编程基准测试同样反映出类似差距。Fable 5 在 Code Arena 上领先 98 个 Elo 分,得分 1665,GPT 5.5 仅 1501。在专门测试最复杂编程任务的 FrontierCode Diamond 基准上,Fable 5 得分 29.3%,GPT 5.5 仅为 5.7%。范围更广的聊天机器人竞技场排行榜中,Fable 5 位居第一,GPT 5.5 排名第四。
当然,GPT 5.5 也有自身优势。在评估交互式终端编码任务(非代码库级别问题解决)的 Terminal-Bench 2.0 上,GPT 5.5 得分 82.7%,Fable 5 约为 88.0%。差距相对较小,且该基准侧重实时命令执行和调试,而非阅读和修补大型代码库。此外,GPT 5.5 定价为每百万输入 token 5 美元、每百万输出 token 30 美元,仅为 Fable 5 定价(10 美元和 50 美元)的一半。对于运行高容量应用、且性能差异不如成本敏感的开发者而言,即便两个模型均可用,GPT 5.5 也是更务实的选择。
### **参考来源:**
The Next Web: Anthropic Fable 5 vs OpenAI GPT 5.5 基准测试对比
Semafor: 白宫限制 Anthropic 与中国访问 Mythos 相关报道