Anthropic道歉事件深度解读与影响分析

2026-06-12阅读 0热度 0
Anthropic
### 一场安全策略争议引发的紧急转向 舆论持续发酵整整一天后,Anthropic 新模型 Claude Fable 5 的“降智”风波迎来关键转折。 昨日,Anthropic 正式推出 Claude Fable 5,模型综合性能无可挑剔,但随即在 AI 研究圈内引发猛烈批评。核心争议在于:一旦用户将 Claude Fable 5 用于 AI 研发场景,系统便会暗中降低模型推理能力。 更令社区不满的是,这种降智行为完全隐蔽。当 Anthropic 的安全系统检测到用户正在进行 AI 相关研究时,会在用户毫不知情的情况下悄然削弱模型输出质量,且不留任何提示。 针对外界的质疑,Anthropic 此前给出的解释是:为防止境外势力利用该模型加速 AI 研发,同时保护自身技术领先地位。 这一措辞彻底激怒了开发者与研究者群体,迫使 Anthropic 必须立即做出回应。 在高压之下,《连线》记者 Max Zeff 刚刚曝出消息:Anthropic 正在撤回这项争议政策。 该媒体从 Anthropic 获得的一份官方声明显示:“我们正在调整 Fable 5 针对前沿大语言模型开发的安全限制,使其对用户可见。” 具体而言,Claude Fable 5 针对 AI 研发的防护措施将不再隐藏。如果公司怀疑用户正在通过 Claude 构建高能力 AI 系统,系统会主动发出警报,要么直接拒绝该请求,要么将用户引导至能力较弱的模型版本。 换句话说,检测到用户从事 AI 开发时,Claude Fable 5 仍会执行降智操作,但这一次用户会收到明确通知,不再被蒙在鼓里。 此外,Anthropic 在声明中正式道歉:“我们做出了错误的取舍,对于未能把握好平衡,我们深表歉意。” 就在《连线》这篇文章在 X 平台引爆讨论的同时,Anthropic 通过官方账号 Claude Devs 发布了一份正式声明。 声明全文如下: > 我们正在推出一系列变更,让 Fable 5 针对前沿大语言模型开发的安全限制变得完全透明。 > > 从本周开始,被标记的请求会明显回退至 Opus 4.8,这与我们在网络与生物安全领域的限制机制一致。每次发生这种情况你都会收到提示。在 API 层面,任何被标记的请求都将返回明确的拒绝原因(服务器端的回退功能将在未来几天内上线)。 > > 我们希望尽快且安全地将 Fable 5 部署给用户。可见的安全限制容易被探测,因此必须足够鲁棒,而这需要时间打磨。不可见的安全限制可以更精准地针对特定目标,让我们能够快速发布,且误报率极低。正是出于这一考虑,我们最初选择了不可见方案——但这不是正确的决策。你有权知道我们设置了哪些安全限制以及背后的理由。对于未能把握好平衡,我们深表歉意。 > > 使安全限制可见会增加被绕过的风险。为了维持对越狱攻击的防御能力,在我们改进分类器期间,误报率不可避免地会上升。同时我们也在调整生物与网络分类器,以减少对无害请求的误触发。我们理解这会带来困扰,并将尽最大努力缩短这一过渡期。 > > 如果你认为某个请求被错误标记:请在 Claude Code 中运行 /feedback,在 http://Claude.ai 或 Cowork 的回退提示上点击向下的大拇指图标,或者针对 API 请求填写安全限制申诉表单。你的反馈将帮助我们优化这些分类器,感谢你的参与。 然而,用户信任已经遭受冲击。尽管 Anthropic 公开道歉并承诺撤销政策,社交网络上仍有大量用户表达了不信任。 部分观点认为,Anthropic 仍有可能暗中继续执行这一策略,毕竟外部难以有效监测。 与此同时,竞争对手 OpenAI 选择了另一条路径:计划大幅降低 token 价格,以此与 Anthropic 争夺客户。 Anthropic 近期在收入、估值以及部分领域(如编码工具)上已超越 OpenAI,双方都在为 IPO 做准备,而高昂的计算成本是共同的痛点。 此外,昨日 OpenAI 的 Codex 邀请好友功能已开始灰度测试,有消息称邀请好友可重置额度。 两家公司相互施加竞争压力,或许最终能为用户带来一些意想不到的实惠。
免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策