Claude Fable 5 对比 Opus:新模型是否值得升级?
6月9日,Anthropic正式发布Claude Fable 5,首次将「Mythos级」模型开放给公众。官方明确表态,该档位能力定位于Opus之上。
一句话概括:Claude API与Claude Code现已支持比Opus 4.8更强的模型,代价是价格翻倍,并附带一项独特的安全设计。以下细节均源自官方公告及公开报道,已标注出处。
Fable 5定位:Opus之上的新层级
先厘清命名逻辑。Anthropic同日发布两个实体:Claude Fable 5与Claude Mythos 5。官方称二者共享同一底层模型,均属「Mythos级」,该级别「高于我们的Opus类」。
Mythos模型曾于今年4月以预览形式露面,但因网络安全顾虑仅限少数合作伙伴。6月9日是首次以公开可用形态落地,公开版即命名为Fable。
命名暗含深意:Fable源自拉丁语fabula,意为「被讲述之物」,与希腊语mythos同源。官方明确表示,Fable与Mythos的真正差异不在于模型本身,而在于安全阀门。
Fable与Mythos:同一模型,安全策略不同
这是本次发布最值得关注的核心点。
- Fable 5面向大众,内置安全机制:在高风险领域不直接作答,而是将请求转交给Opus 4.8处理。
- Mythos 5为同一模型,解除特定领域限制,仅对审核通过的对象开放——首先面向Project Glasswing中的网络防御方与基础设施提供商,后续计划扩展至生物学研究者。
简言之,Anthropic此次并非售卖两个模型,而是同一模型配备两套安全策略。能力天花板完全相同,区别仅在于「哪些问题允许模型自由回答」。这种将安全融入产品分层的思路,值得工程团队深入研读。
安全设计的精妙之处:关键时刻自动降级到Opus
Fable的安全机制并非简单拒答,而是「换模型作答」。
官方列出三个触发回退的领域:网络安全、生物与化学、蒸馏。在这些话题上,按官方原话,回答将「由我们次强的模型Claude Opus 4.8给出」。
这意味着,用户可能以为自己全程使用Fable,但部分回答实际来自Opus 4.8,且切换由模型自动执行。好在比例不高:官方称安全阀「平均在不到5%的会话中触发」,「超过95%的Fable会话完全无回退」。
对工程人员而言,这既是便利也是隐患。大多数场景下你能获取满血能力;但若任务恰好触及这三条边界,你收到的回答可能并非Fable水准,而是Opus 4.8级别,且你未必即时察觉。
安全方面还有两个数据点:外部赏金计划运行1000多小时,未发现通用越狱手段;Mythos级流量启用30天保留策略,数据不用于训练,所有人工访问均记录日志。
编程能力的真实提升点
官方提供的能力证据主要来自合作方评测,以下如实转述并标注来源。
软件工程领域:Stripe反馈Fable 5将「数月的工程压缩至几天」——一个5000万行的Ruby代码库迁移,人工需两个月,该模型一天完成。在Cognition的FrontierCode评测中,官方称Fable 5「在前沿模型中得分最高,即便仅使用中等effort」。
知识工作领域:在Hebbia金融基准上获「所有模型最高分」;IMC表示其「几乎全面赢得交易分析评测」。
还有两个非典型案例值得关注。视觉:官方称其为视觉任务SOTA,能「仅靠视觉」通关宝可梦火红版,无需地图或工具。长上下文与记忆:在玩《杀戮尖塔》时,持久记忆带来的提升「是Opus 4.8的三倍」,通关最终章频率也为三倍。
如何解读这些数字?合作方评测天然偏向正面,但即便打折扣,方向明确:该层级在复杂工程任务上确实再上一个台阶。尤其「中等effort即高分」这一点,对经常权衡成本与效果的团队是重要信号。
使用方式:API、Claude Code与订阅时间窗口
具体上手路径如下。
- API:6月9日起全面可用,通过Claude API及按量计费的Enterprise计划,模型ID为
claude-fable-5。 - Claude Code:支持使用。CC的
--model已将fable列为模型别名,即claude --model fable,或在会话内通过/model切换。 - 订阅:注意时间窗口。6月9日至22日,Fable 5免费包含在Pro、Max、Team及按席位Enterprise计划中;6月23日起需消耗usage credits,官方称将「尽快」恢复为标准计划。想免费体验者请抓紧这两周。
价格:每百万输入token 10美元,每百万输出token 50美元,官方表示「不到Mythos预览版的一半」。据CNBC、TechCrunch等报道,该价格约为Opus 4.8的两倍。
是否迁移:实践者的决策框架
分场景判断,切勿无脑切换。
适合使用Fable的场景:任务难度高、价值大、且愿意为效果支付溢价,例如大规模重构、复杂迁移、长期未解的架构瓶颈。该模型「中等effort即高分」的特性,意味着你不必拉满effort浪费预算,性价比反而可能突出。
不适合的场景:日常任务中Sonnet、Opus 4.8已能稳定完成的场景。Fable价格翻倍,日常任务投入的额外成本难以换回对等的体验提升。此外需留意:若任务触及安全三条线,你可能在不知情中被降级到Opus 4.8。
还有一个朴素建议:新模型刚发布,社区真实手感、踩坑经验、各harness适配方案尚未沉淀。若模型已投入生产流程,建议先在非关键任务上运行两天,观察在你自己的代码库中的实际表现,再决定是否切换默认模型。官方评测归官方,你的代码库才是最终基准。
来源:Anthropic官方公告、TechCrunch、CNBC报道。模型能力数据为Anthropic及其合作方口径,本文如实转述并标注,不代表独立测评结论。