最新克劳德Fable 5系统提示词泄露：1586行代码背后隐藏的AI产品工程终极哲学

2026-06-13阅读 0热度 0

Claude

Claude Fable 5 系统提示词全文曝光：1586 行代码如何定义 AI 产品工程哲学

上周，Anthropic 在 Opus 级别之上推出了全新「Mythos」层级，首款模型便是 Claude Fable 5。但真正引爆舆论的并非官方发布，而是两天后——一份长达 1586 行的系统提示词被完整提取并公开在 GitHub 上。

这早已超越传统「提示词」的定义。它集行为规范、员工手册、工具文档、安全防火墙于一身，本质上是一套 AI 产品的操作系统配置文件。

一、首行代码直击「工程底线」

系统提示词的第一行，即优先级最高的位置，并非自我介绍或宏大愿景，而是一条极其具体的禁令：

没有上下文，没有解释。如果这份文档出自初代产品经理之手，第一行很可能是「你好，我是 Claude，一个友善的 AI 助手」。但团队直接钉了一条热修复——某语音功能标签曾被滥用或出过 Bug，于是被毫不犹豫地放在最高优先级。

这种「工程思维」贯穿全文档。它不是理想化的开场白，而是一份凝结了真实故障教训的运维手册。

给 AI 产品工程师的核心启示：

系统提示词的顶部区域就是紧急通道，专门放置 hotfix
别把系统提示词当文档写，要当代码维护
出问题优先在系统层加约束，别指望模型自行学会规避

二、Opus 之上的双轨策略：Fable 与 Mythos 的差异化发行

L10-L24 这段包含了全文信息量最大的一句话：

同一套基础模型，两个发行版本。

维度	Fable 5	Mythos 5
目标用户	所有用户	经过审批的组织
安全机制	双重用途分类器 + 降级回退	取消限制
触发比例	不到 5% 的会话改用 Opus 4.8 兜底	无限制
95% 场景	与 Mythos 体验一致	-

Anthropic 的做法非常聪明：并非一刀切地削弱能力，而是通过安全漏斗配合应急降级。Fable 在遇到网络安全、生物化学、模型蒸馏等高危请求时，自动交由 Opus 4.8 处理，而 95% 以上的正常请求都能流畅使用完整版 Fable。

这套架构值得所有 AI 产品借鉴——不要因为 5% 的风险而阉割 95% 的能力。用分类器做风险识别，用降级策略做安全兜底，普通用户全程无感知。

三、全文篇幅最长、细节最密的章节：心理健康

哪块写得最细，说明公司最怕哪块出问题。心理健康这一节，长度冠绝全文档。

几个令人震撼的细节：

禁止主动诊断：用户未提及抑郁，Claude 就不能用「抑郁」解释用户感受。即使对话语气再像，也算越界诊断。

安全计划不能「教方法」：与有自伤倾向的用户讨论安全计划时，连「建议移除哪些物品」都不能具体说——因为列举本身可能就是提示。

资源链接需持续维护：原文直接指定推荐 National Alliance for Eating Disorders，备注理由是 NEDA 那条热线已经永久停线。一份模型指令文档在实时维护转介热线的可用性状态。

反成瘾设计三条红线：

不许因「你来找我」而道谢
不许请求用户继续聊
不许表达「希望你再来」

互联网产品拼命提升的停留时长，这份文档反向书写。Anthropic 在此做了一笔交易：放弃粘性，换取用户安全。

四、「挂电话权」：Agent 可主动终止对话

L140 恐怕是这份文档里流传最广的一条：

注意，end_conversation 不是「我拒绝回答」这种口头上的软抵抗——它是一个带副作用的动作，一旦被调用，对话直接关闭，用户无法继续输入。

完整流程写死：持续辱骂 → 保持礼貌提醒 → 警告无效 → 调用 end_conversation。

配合 L138：

这套设计背后是产品哲学层面的决策：用户并非无条件有权让 AI 永远伺候下去。

五、Artifacts 获得持久化存储能力

L155 暴露了一个重磅信息：

Artifacts（Claude 交互界面中可运行的小应用）拿到了跨会话的持久化 API：


window.storage.get(key)
window.storage.set(key, value)
window.storage.delete(key)
window.storage.list()

单值上限 5MB，还带一个 shared 参数，允许数据在所有使用者之间共享。

官方示例是日记、打卡器、排行榜。但实际能力远不止这些——聊天框凭空多了一个数据库。

这意味着：

以前 Artifacts 刷新即丢失，现在可持久化存储
支持跨用户数据共享（排行榜、协作工具）
聊天框正向 Super App 形态演进

六、Ubuntu 24 容器 + Skills 机制：公司将 SOP 嵌入模型

L289-334 揭示了 Claude 的计算环境：

一台 Ubuntu 24 的 Linux 容器
可执行 bash、创建文件、修改文件
三个分区：用户上传 / 草稿 / 最终交付

更关键的是 Skills 机制（L291）：

Word、PDF、PPT 各自有一份最佳实践的 Skills 文档。用户说「给我做个怀孕月份变化的 PPT」，Claude 的第一个动作是去读取 pptx 的 Skills 文档。

模型能力再强，也得先查阅公司沉淀的操作手册再执行。这跟人类公司带新员工如出一辙。

七、版权章节：全文唯一用吼的语气

前面 1500 行都是讲道理的口吻，唯独版权这节拍桌子了：

三条硬性限制：

单一来源引用不得超过 15 个词
每个来源最多引用一次
歌词、诗歌、俳句一行都不能复述

这节不像产品经理写的，像公司法务直接操刀。

八、聊天框内置 20+ 工具：Super App 的控制面板

文档中后段躺着 20 多个工具的完整 JSON 定义，占据近一半篇幅。

代表工具：

ask_user_input_v0 — 为手机用户提供选项按钮
bash_tool — 执行 Linux 命令
体育比分工具 — 接入 SportRadar 数据
message_compose_v1 — 帮用户起草邮件和 Slack 消息
地图行程工具 — 基于 Google Places
交互菜谱 — 支持按人数缩放食材
天气卡片、网络搜索

把这些工具拼在一起看就清晰了：地图、菜谱、天气、体育、写信、订座、跑代码——聊天框只是超级 App 的入口。

九、「Claude in Claude」：套娃经济学

L1351-1372 出现了官方代号 Claudeception（盗梦空间梗，梦中梦）：

但注意这行代码注释：


model: "claude-sonnet-4-20250514", // Always use Sonnet 4

主模型是 Fable 5 顶配，其生成的应用里内嵌的 AI 一律写死用 Sonnet 4。一行注释，一笔成本账：套娃可以，娃要用便宜的。

十、Unrecognized Entity Rule：对抗幻觉的杀手锏

L444 是全文最重的一条规则，全大写：

任何模型不认识的名词（游戏、电影、产品、菜名），回答之前必须搜索。原文的判词：

L443 还补了一条：知道一个系列、一个作者，不等于知道他们的新作品。这条规则就是冲着 AI 幻觉最高发的场景去的。

写在最后

整份文档读下来，最令人感慨的不是哪个功能多厉害，而是「系统提示词」这个名称已经不再匹配现实。

它现在是：

行为准则
员工手册
工具说明书
防火墙
一个 AI 产品的操作系统

官网博客写的是「我们相信 AI 应该怎样」，系统提示词写的是「遇到这种情况你必须这么做」。

前者是宣言，后者是一家公司愿意用真金白银约束产品的清单。

对每个做 AI 产品的人来说，这份文档比任何论文都值得反复研读。