Claude Mythos 深度评测:2026年Anthropic最强AI模型
2026年4月7日,Anthropic发布了一个非常规动作——在揭晓Project Glasswing的当天,同步推出了Claude Mythos Preview。这绝非面向大众的通用模型,而是专攻“防御性网络安全”的顶尖专用工具。核心数据一目了然:在网络安全漏洞复现基准测试中,Mythos实现了83.1%的准确率,相比Claude Opus 4.6的66.6%保持了显著优势。访问方式严格限定为邀请制,仅对经过严格审查的安全研究机构开放,没有自助注册通道。定价方面,每百万输入/输出token分别收费25美元和125美元,可通过Claude API、Amazon Bedrock、Google Vertex AI和Microsoft Foundry使用。
Claude Mythos 的诞生逻辑:Project Glasswing 全景解析
Mythos Preview的发布与Project Glasswing密不可分——这是Anthropic于同日宣布的全球软件安全计划,核心目标是在对手之前,将AI的超凡能力优先配置于防御层面。
12 家创始合作机构
Project Glasswing汇聚了科技与金融领域的12家顶级机构:
- 科技巨头:Amazon Web Services、Apple、Broadcom、Cisco、Google、Microsoft、NVIDIA
- 安全专家:CrowdStrike、Palo Alto Networks
- 金融机构:JPMorganChase
- 开源基金会:Linux Foundation
- AI 公司:Anthropic(发起方)
除这12家外,另有40余家管理关键软件基础设施的机构获得了研究预览的访问权限。合作阵容之强,表明Anthropic意在推动全行业联合行动。
资金承诺
Anthropic的投入实打实:向Project Glasswing参与方提供了1亿美元的模型使用额度,向Alpha-Omega和OpenSSF捐赠250万美元,向Apache Software Foundation捐赠150万美元。这并非象征性举措,而是实质性的资源注入。
Claude Mythos 的核心能力
漏洞识别:已发现数千个零日漏洞
Mythos Preview在真实生产代码中已成功识别数千个此前未知的高危漏洞,覆盖主流操作系统与Web浏览器。举几个冲击力强的案例:它发现了OpenBSD中潜藏27年的安全漏洞,FFmpeg中一个存在16年的漏洞,以及Linux内核中多个内核级别的漏洞。
这些漏洞历经数十年的人工审查与数百万次的自动化安全测试,始终未被发现——直到Mythos介入。这意味着,AI在“漏洞挖掘”这一领域,已经达到人类专家难以企及的水平。
Benchmark:全面超越 Claude Opus 4.6
官方数据显示,Mythos Preview在关键任务上的性能提升极为直接:
| 任务 | Claude Mythos Preview | Claude Opus 4.6 | 提升幅度 |
|---|---|---|---|
| 网络安全漏洞复现 | 83.1% | 66.6% | +16.5pp |
| 复杂编程任务 | 显著提升 | 基准 | 已完成进阶评估 |
Anthropic的表述非常直白:Mythos的能力已“超越大多数人类专家”,尤其在识别和利用软件漏洞方面。这也是为什么该模型仅限邀请制访问——能力过强,必须严格管控。
为何聚焦防御性网络安全?
Anthropic在发布声明中明确强调:Project Glasswing是“一次紧迫的尝试,在对手获得类似技术优势用于进攻性行动之前,将这些能力投入防御用途”。
这句话揭示了Mythos的根本逻辑:既然AI已具备超人级的漏洞挖掘能力,就必须抢先将其部署在防御端,赶在恶意行为者掌握类似技术之前。这种前置部署远胜事后补救。
Claude Mythos vs Claude Opus 4.6:定位对比
Mythos Preview与当前最强通用模型Opus 4.6,核心赛道截然不同。
| 维度 | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| 定位 | 防御性网络安全专用前沿模型 | 最强通用智能模型(编程/推理/Agent) |
| 访问方式 | 邀请制,无自助注册 | API 公开可用 |
| 定价 | $25 / $125 per MTok | $5 / $25 per MTok |
| 上下文窗口 | 已优化配置 | 1M tokens |
| 网络安全漏洞复现 | 83.1% | 66.6% |
| 适合对象 | 安全研究机构、关键基础设施运营商 | 通用开发者、企业 |
| 发布平台 | Claude API、Bedrock、Vertex AI、Microsoft Foundry | Claude API、Bedrock、Vertex AI |
核心差异:Mythos能力更强,但专用化定位与邀请制访问意味着它不会、也不应取代Opus 4.6作为通用开发工具的角色。两者功能各异,分工明确。
如何申请访问 Claude Mythos?
目前没有任何自助注册渠道。若想使用Mythos,仅有两条路径:
- 已获授权机构:12家创始合作方及40余家受邀机构已获得访问权限。
- 申请渠道:通过anthropic.com/glasswing了解计划详情并提交参与申请。
准入条件严苛:聚焦于管理关键软件基础设施的机构,优先考虑安全研究与防御性应用场景。
正式商业上线后,API访问将通过以下平台提供:
- Claude API(直接调用)
- Amazon Bedrock
- Google Vertex AI
- Microsoft Foundry(相比Opus 4.6新增平台)
Claude Mythos 会开放给普通开发者吗?
结合当前定价与访问机制,短期内可能性极低。Mythos每百万token定价是Opus 4.6的5倍,且需通过资质审查——这明显不是走“人人可用”路线。
但参考Anthropic历史发布模式,研究预览阶段通常是正式发布前的过渡。如果Mythos完成安全评估并获得充分防护,未来不排除以某种受限访问形式向更广泛的开发者开放。
对多数开发者而言,Claude Opus 4.6仍是当前最强的通用可用模型:1M tokens上下文、$5/$25 MTok定价、支持Extended Thinking和Adaptive Thinking,在编程与Agent任务上的表现已足够优异。
Project Glasswing 的战略意义
Anthropic将Glasswing描述为“软件安全史上意义最重大的努力之一”。这一说法分量很重,但细究之下确有道理:
- AI能力已质变:Mythos找到了人类与传统工具数十年未能发现的漏洞,表明AI在安全领域已迈入新的质变节点。
- 攻防不对称正在逆转:过去,漏洞发现较修复容易得多;如今,AI可能首次让防守方获得规模化漏洞挖掘的能力。
- 开源基础设施优先:400万美元的捐款指向Alpha-Omega、OpenSSF、Apache等开源基金会,表明安全加固的优先方向是全球共用的开源基础设施。
常见问题
Q:Claude Mythos 是 Claude 5 吗?
官方未将其定名为Claude 5。它是前沿模型的研究预览版,专为网络安全场景设计,并非下一代通用旗舰的正式发布。Anthropic当前最强的通用可用模型仍是Claude Opus 4.6。
Q:Claude Mythos 能否用于攻击性黑客行动?
Project Glasswing明确将Mythos定位为防御性用途,参与机构需接受资质审查。官方的核心逻辑正是“赶在恶意行为者获得类似能力之前,先将其用于防御”——防止滥用是首要设计约束。
Q:Mythos 的漏洞复现 83.1% 对应何种 benchmark?
该数据来自Anthropic官方的网络安全漏洞复现任务评测,衡量模型根据漏洞描述重现已知安全缺陷的能力,是网络安全AI评估的核心指标之一。Claude Opus 4.6在同一测试中为66.6%,提升幅度超过16个百分点。
Q:目前能否调用 Mythos 进行代码安全审计?
无法直接调用,需通过Project Glasswing申请资格。若急需代码安全审计能力,Claude Opus 4.6和Claude Sonnet 4.6均具备较强的代码分析与安全漏洞识别能力,可通过Anthropic API直接使用。
小结
Claude Mythos Preview 是Anthropic迄今发布的能力最强的模型,但它并非通用产品,而是定向部署的安全研究工具。 发布于2026年4月7日,与Project Glasswing联合推出,背后是12家全球顶级科技机构和超过1.04亿美元的资金承诺,定价25/125美元每百万token,仅限邀请制访问。
对多数开发者而言,Claude Opus 4.6仍是当前最强可用选择。而Mythos的发布,更像是对下一代Claude模型能力上限的预示——更强的推理、更深的代码理解,以及超越人类专家的漏洞识别能力。
本文数据来源:Anthropic官方API文档(platform.claude.com/docs,2026年4月8日实测)及Anthropic Project Glasswing公告页(anthropic.com/glasswing,2026年4月7日发布)。
