Anthropic道歉事件深度解读与影响分析
就在《连线》这篇文章在 X 平台引爆讨论的同时,Anthropic 通过官方账号 Claude Devs 发布了一份正式声明。
声明全文如下:
> 我们正在推出一系列变更,让 Fable 5 针对前沿大语言模型开发的安全限制变得完全透明。
>
> 从本周开始,被标记的请求会明显回退至 Opus 4.8,这与我们在网络与生物安全领域的限制机制一致。每次发生这种情况你都会收到提示。在 API 层面,任何被标记的请求都将返回明确的拒绝原因(服务器端的回退功能将在未来几天内上线)。
>
> 我们希望尽快且安全地将 Fable 5 部署给用户。可见的安全限制容易被探测,因此必须足够鲁棒,而这需要时间打磨。不可见的安全限制可以更精准地针对特定目标,让我们能够快速发布,且误报率极低。正是出于这一考虑,我们最初选择了不可见方案——但这不是正确的决策。你有权知道我们设置了哪些安全限制以及背后的理由。对于未能把握好平衡,我们深表歉意。
>
> 使安全限制可见会增加被绕过的风险。为了维持对越狱攻击的防御能力,在我们改进分类器期间,误报率不可避免地会上升。同时我们也在调整生物与网络分类器,以减少对无害请求的误触发。我们理解这会带来困扰,并将尽最大努力缩短这一过渡期。
>
> 如果你认为某个请求被错误标记:请在 Claude Code 中运行 /feedback,在 http://Claude.ai 或 Cowork 的回退提示上点击向下的大拇指图标,或者针对 API 请求填写安全限制申诉表单。你的反馈将帮助我们优化这些分类器,感谢你的参与。
然而,用户信任已经遭受冲击。尽管 Anthropic 公开道歉并承诺撤销政策,社交网络上仍有大量用户表达了不信任。
部分观点认为,Anthropic 仍有可能暗中继续执行这一策略,毕竟外部难以有效监测。
与此同时,竞争对手 OpenAI 选择了另一条路径:计划大幅降低 token 价格,以此与 Anthropic 争夺客户。
Anthropic 近期在收入、估值以及部分领域(如编码工具)上已超越 OpenAI,双方都在为 IPO 做准备,而高昂的计算成本是共同的痛点。
此外,昨日 OpenAI 的 Codex 邀请好友功能已开始灰度测试,有消息称邀请好友可重置额度。
两家公司相互施加竞争压力,或许最终能为用户带来一些意想不到的实惠。