Fable 5解耦版评测:Anthropic限制网络安全能力模型
Anthropic最新发布了名为Fable 5的模型,不过这次走的是“受控版本”路线。策略很清晰:在网络安全和生物风险等高敏感领域设置了极其严格的安全护栏,直接拒绝回应任何相关查询。但在编程与核心任务上,Fable 5的性能实现了跃升,尤其擅长处理长期、极其复杂的系统性难题。简单说,你让它写代码、解复杂工程问题,它的表现可能远超预期——但别指望用它教你渗透某个系统。
当然,Anthropic并未完全封堵这条路。他们同步推出了保留完整网络安全能力的完全体新模型Mythos 5,但这个版本不对外公开,而是通过一项名为“翼蝶计划”(Project Glasswing)的专项倡议,仅面向少数经过严格审核的特定信任群体开放。这就像实验室里的一件顶级工具,只有拿到特殊通行证的人才有资格使用。
整体来看,这种“解耦”策略相当明智:既满足了对安全要求极高的场景,又不牺牲通用任务的性能。值得关注的是,这种“能力分层”模式未来可能成为大模型部署的常态——毕竟,谁也不希望一个能编写病毒、设计生物恐怖方案的模型随意在互联网上运行。
