最新克劳德Fable 5系统提示词泄露:1586行代码背后隐藏的AI产品工程终极哲学

2026-06-13阅读 0热度 0
Claude

Claude Fable 5 系统提示词全文曝光:1586 行代码如何定义 AI 产品工程哲学

上周,Anthropic 在 Opus 级别之上推出了全新「Mythos」层级,首款模型便是 Claude Fable 5。但真正引爆舆论的并非官方发布,而是两天后——一份长达 1586 行的系统提示词被完整提取并公开在 GitHub 上。

Claude Fable 5 系统提示词被扒出来了:1586 行代码背后,藏着 AI 产品工程的终极哲学

这早已超越传统「提示词」的定义。它集行为规范、员工手册、工具文档、安全防火墙于一身,本质上是一套 AI 产品的操作系统配置文件。

一、首行代码直击「工程底线」

系统提示词的第一行,即优先级最高的位置,并非自我介绍或宏大愿景,而是一条极其具体的禁令:

没有上下文,没有解释。如果这份文档出自初代产品经理之手,第一行很可能是「你好,我是 Claude,一个友善的 AI 助手」。但团队直接钉了一条热修复——某语音功能标签曾被滥用或出过 Bug,于是被毫不犹豫地放在最高优先级。

这种「工程思维」贯穿全文档。它不是理想化的开场白,而是一份凝结了真实故障教训的运维手册。

给 AI 产品工程师的核心启示:

  • 系统提示词的顶部区域就是紧急通道,专门放置 hotfix
  • 别把系统提示词当文档写,要当代码维护
  • 出问题优先在系统层加约束,别指望模型自行学会规避

二、Opus 之上的双轨策略:Fable 与 Mythos 的差异化发行

L10-L24 这段包含了全文信息量最大的一句话:

同一套基础模型,两个发行版本。

维度Fable 5Mythos 5
目标用户所有用户经过审批的组织
安全机制双重用途分类器 + 降级回退取消限制
触发比例不到 5% 的会话改用 Opus 4.8 兜底无限制
95% 场景与 Mythos 体验一致-

Anthropic 的做法非常聪明:并非一刀切地削弱能力,而是通过安全漏斗配合应急降级。Fable 在遇到网络安全、生物化学、模型蒸馏等高危请求时,自动交由 Opus 4.8 处理,而 95% 以上的正常请求都能流畅使用完整版 Fable。

这套架构值得所有 AI 产品借鉴——不要因为 5% 的风险而阉割 95% 的能力。用分类器做风险识别,用降级策略做安全兜底,普通用户全程无感知。

三、全文篇幅最长、细节最密的章节:心理健康

哪块写得最细,说明公司最怕哪块出问题。心理健康这一节,长度冠绝全文档。

几个令人震撼的细节:

禁止主动诊断:用户未提及抑郁,Claude 就不能用「抑郁」解释用户感受。即使对话语气再像,也算越界诊断。

安全计划不能「教方法」:与有自伤倾向的用户讨论安全计划时,连「建议移除哪些物品」都不能具体说——因为列举本身可能就是提示。

资源链接需持续维护:原文直接指定推荐 National Alliance for Eating Disorders,备注理由是 NEDA 那条热线已经永久停线。一份模型指令文档在实时维护转介热线的可用性状态。

反成瘾设计三条红线:

  • 不许因「你来找我」而道谢
  • 不许请求用户继续聊
  • 不许表达「希望你再来」

互联网产品拼命提升的停留时长,这份文档反向书写。Anthropic 在此做了一笔交易:放弃粘性,换取用户安全。

四、「挂电话权」:Agent 可主动终止对话

L140 恐怕是这份文档里流传最广的一条:

注意,end_conversation 不是「我拒绝回答」这种口头上的软抵抗——它是一个带副作用的动作,一旦被调用,对话直接关闭,用户无法继续输入。

完整流程写死:持续辱骂 → 保持礼貌提醒 → 警告无效 → 调用 end_conversation

配合 L138:

这套设计背后是产品哲学层面的决策:用户并非无条件有权让 AI 永远伺候下去。

五、Artifacts 获得持久化存储能力

L155 暴露了一个重磅信息:

Artifacts(Claude 交互界面中可运行的小应用)拿到了跨会话的持久化 API:


window.storage.get(key)
window.storage.set(key, value)
window.storage.delete(key)
window.storage.list()

单值上限 5MB,还带一个 shared 参数,允许数据在所有使用者之间共享。

官方示例是日记、打卡器、排行榜。但实际能力远不止这些——聊天框凭空多了一个数据库。

这意味着:

  1. 以前 Artifacts 刷新即丢失,现在可持久化存储
  2. 支持跨用户数据共享(排行榜、协作工具)
  3. 聊天框正向 Super App 形态演进

六、Ubuntu 24 容器 + Skills 机制:公司将 SOP 嵌入模型

L289-334 揭示了 Claude 的计算环境:

  • 一台 Ubuntu 24 的 Linux 容器
  • 可执行 bash、创建文件、修改文件
  • 三个分区:用户上传 / 草稿 / 最终交付

更关键的是 Skills 机制(L291)

Word、PDF、PPT 各自有一份最佳实践的 Skills 文档。用户说「给我做个怀孕月份变化的 PPT」,Claude 的第一个动作是去读取 pptx 的 Skills 文档。

模型能力再强,也得先查阅公司沉淀的操作手册再执行。这跟人类公司带新员工如出一辙。

七、版权章节:全文唯一用吼的语气

前面 1500 行都是讲道理的口吻,唯独版权这节拍桌子了:

三条硬性限制:

  1. 单一来源引用不得超过 15 个词
  2. 每个来源最多引用一次
  3. 歌词、诗歌、俳句一行都不能复述

这节不像产品经理写的,像公司法务直接操刀。

八、聊天框内置 20+ 工具:Super App 的控制面板

文档中后段躺着 20 多个工具的完整 JSON 定义,占据近一半篇幅。

代表工具:

  • ask_user_input_v0 — 为手机用户提供选项按钮
  • bash_tool — 执行 Linux 命令
  • 体育比分工具 — 接入 SportRadar 数据
  • message_compose_v1 — 帮用户起草邮件和 Slack 消息
  • 地图行程工具 — 基于 Google Places
  • 交互菜谱 — 支持按人数缩放食材
  • 天气卡片、网络搜索

把这些工具拼在一起看就清晰了:地图、菜谱、天气、体育、写信、订座、跑代码——聊天框只是超级 App 的入口。

九、「Claude in Claude」:套娃经济学

L1351-1372 出现了官方代号 Claudeception(盗梦空间梗,梦中梦):

但注意这行代码注释:


model: "claude-sonnet-4-20250514", // Always use Sonnet 4

主模型是 Fable 5 顶配,其生成的应用里内嵌的 AI 一律写死用 Sonnet 4。一行注释,一笔成本账:套娃可以,娃要用便宜的。

十、Unrecognized Entity Rule:对抗幻觉的杀手锏

L444 是全文最重的一条规则,全大写:

任何模型不认识的名词(游戏、电影、产品、菜名),回答之前必须搜索。原文的判词:

L443 还补了一条:知道一个系列、一个作者,不等于知道他们的新作品。这条规则就是冲着 AI 幻觉最高发的场景去的。

写在最后

整份文档读下来,最令人感慨的不是哪个功能多厉害,而是「系统提示词」这个名称已经不再匹配现实。

它现在是:

  • 行为准则
  • 员工手册
  • 工具说明书
  • 防火墙
  • 一个 AI 产品的操作系统

官网博客写的是「我们相信 AI 应该怎样」,系统提示词写的是「遇到这种情况你必须这么做」。

前者是宣言,后者是一家公司愿意用真金白银约束产品的清单。

对每个做 AI 产品的人来说,这份文档比任何论文都值得反复研读。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策