Anthropic道歉事件深度解读与影响分析

2026-06-12阅读 0热度 0

Anthropic

### 一场安全策略争议引发的紧急转向舆论持续发酵整整一天后，Anthropic 新模型 Claude Fable 5 的“降智”风波迎来关键转折。昨日，Anthropic 正式推出 Claude Fable 5，模型综合性能无可挑剔，但随即在 AI 研究圈内引发猛烈批评。核心争议在于：一旦用户将 Claude Fable 5 用于 AI 研发场景，系统便会暗中降低模型推理能力。更令社区不满的是，这种降智行为完全隐蔽。当 Anthropic 的安全系统检测到用户正在进行 AI 相关研究时，会在用户毫不知情的情况下悄然削弱模型输出质量，且不留任何提示。针对外界的质疑，Anthropic 此前给出的解释是：为防止境外势力利用该模型加速 AI 研发，同时保护自身技术领先地位。这一措辞彻底激怒了开发者与研究者群体，迫使 Anthropic 必须立即做出回应。在高压之下，《连线》记者 Max Zeff 刚刚曝出消息：Anthropic 正在撤回这项争议政策。该媒体从 Anthropic 获得的一份官方声明显示：“我们正在调整 Fable 5 针对前沿大语言模型开发的安全限制，使其对用户可见。” 具体而言，Claude Fable 5 针对 AI 研发的防护措施将不再隐藏。如果公司怀疑用户正在通过 Claude 构建高能力 AI 系统，系统会主动发出警报，要么直接拒绝该请求，要么将用户引导至能力较弱的模型版本。换句话说，检测到用户从事 AI 开发时，Claude Fable 5 仍会执行降智操作，但这一次用户会收到明确通知，不再被蒙在鼓里。此外，Anthropic 在声明中正式道歉：“我们做出了错误的取舍，对于未能把握好平衡，我们深表歉意。”

就在《连线》这篇文章在 X 平台引爆讨论的同时，Anthropic 通过官方账号 Claude Devs 发布了一份正式声明。

声明全文如下： > 我们正在推出一系列变更，让 Fable 5 针对前沿大语言模型开发的安全限制变得完全透明。 > > 从本周开始，被标记的请求会明显回退至 Opus 4.8，这与我们在网络与生物安全领域的限制机制一致。每次发生这种情况你都会收到提示。在 API 层面，任何被标记的请求都将返回明确的拒绝原因（服务器端的回退功能将在未来几天内上线）。 > > 我们希望尽快且安全地将 Fable 5 部署给用户。可见的安全限制容易被探测，因此必须足够鲁棒，而这需要时间打磨。不可见的安全限制可以更精准地针对特定目标，让我们能够快速发布，且误报率极低。正是出于这一考虑，我们最初选择了不可见方案——但这不是正确的决策。你有权知道我们设置了哪些安全限制以及背后的理由。对于未能把握好平衡，我们深表歉意。 > > 使安全限制可见会增加被绕过的风险。为了维持对越狱攻击的防御能力，在我们改进分类器期间，误报率不可避免地会上升。同时我们也在调整生物与网络分类器，以减少对无害请求的误触发。我们理解这会带来困扰，并将尽最大努力缩短这一过渡期。 > > 如果你认为某个请求被错误标记：请在 Claude Code 中运行 /feedback，在 http://Claude.ai 或 Cowork 的回退提示上点击向下的大拇指图标，或者针对 API 请求填写安全限制申诉表单。你的反馈将帮助我们优化这些分类器，感谢你的参与。然而，用户信任已经遭受冲击。尽管 Anthropic 公开道歉并承诺撤销政策，社交网络上仍有大量用户表达了不信任。

部分观点认为，Anthropic 仍有可能暗中继续执行这一策略，毕竟外部难以有效监测。

与此同时，竞争对手 OpenAI 选择了另一条路径：计划大幅降低 token 价格，以此与 Anthropic 争夺客户。

Anthropic 近期在收入、估值以及部分领域（如编码工具）上已超越 OpenAI，双方都在为 IPO 做准备，而高昂的计算成本是共同的痛点。此外，昨日 OpenAI 的 Codex 邀请好友功能已开始灰度测试，有消息称邀请好友可重置额度。两家公司相互施加竞争压力，或许最终能为用户带来一些意想不到的实惠。

Anthropic道歉事件深度解读与影响分析

相关阅读

最新教程

最新资讯