Claude Mythos 深度评测：2026年Anthropic最强AI模型

2026-06-17阅读 0热度 0

人工智能 LLM

2026年4月7日，Anthropic发布了一个非常规动作——在揭晓Project Glasswing的当天，同步推出了Claude Mythos Preview。这绝非面向大众的通用模型，而是专攻“防御性网络安全”的顶尖专用工具。核心数据一目了然：在网络安全漏洞复现基准测试中，Mythos实现了83.1%的准确率，相比Claude Opus 4.6的66.6%保持了显著优势。访问方式严格限定为邀请制，仅对经过严格审查的安全研究机构开放，没有自助注册通道。定价方面，每百万输入/输出token分别收费25美元和125美元，可通过Claude API、Amazon Bedrock、Google Vertex AI和Microsoft Foundry使用。

Claude Mythos 的诞生逻辑：Project Glasswing 全景解析

Mythos Preview的发布与Project Glasswing密不可分——这是Anthropic于同日宣布的全球软件安全计划，核心目标是在对手之前，将AI的超凡能力优先配置于防御层面。

12 家创始合作机构

Project Glasswing汇聚了科技与金融领域的12家顶级机构：

科技巨头：Amazon Web Services、Apple、Broadcom、Cisco、Google、Microsoft、NVIDIA
安全专家：CrowdStrike、Palo Alto Networks
金融机构：JPMorganChase
开源基金会：Linux Foundation
AI 公司：Anthropic（发起方）

除这12家外，另有40余家管理关键软件基础设施的机构获得了研究预览的访问权限。合作阵容之强，表明Anthropic意在推动全行业联合行动。

资金承诺

Anthropic的投入实打实：向Project Glasswing参与方提供了1亿美元的模型使用额度，向Alpha-Omega和OpenSSF捐赠250万美元，向Apache Software Foundation捐赠150万美元。这并非象征性举措，而是实质性的资源注入。

Claude Mythos 的核心能力

漏洞识别：已发现数千个零日漏洞

Mythos Preview在真实生产代码中已成功识别数千个此前未知的高危漏洞，覆盖主流操作系统与Web浏览器。举几个冲击力强的案例：它发现了OpenBSD中潜藏27年的安全漏洞，FFmpeg中一个存在16年的漏洞，以及Linux内核中多个内核级别的漏洞。

这些漏洞历经数十年的人工审查与数百万次的自动化安全测试，始终未被发现——直到Mythos介入。这意味着，AI在“漏洞挖掘”这一领域，已经达到人类专家难以企及的水平。

Benchmark：全面超越 Claude Opus 4.6

官方数据显示，Mythos Preview在关键任务上的性能提升极为直接：

任务	Claude Mythos Preview	Claude Opus 4.6	提升幅度
网络安全漏洞复现	83.1%	66.6%	+16.5pp
复杂编程任务	显著提升	基准	已完成进阶评估

Anthropic的表述非常直白：Mythos的能力已“超越大多数人类专家”，尤其在识别和利用软件漏洞方面。这也是为什么该模型仅限邀请制访问——能力过强，必须严格管控。

为何聚焦防御性网络安全？

Anthropic在发布声明中明确强调：Project Glasswing是“一次紧迫的尝试，在对手获得类似技术优势用于进攻性行动之前，将这些能力投入防御用途”。

这句话揭示了Mythos的根本逻辑：既然AI已具备超人级的漏洞挖掘能力，就必须抢先将其部署在防御端，赶在恶意行为者掌握类似技术之前。这种前置部署远胜事后补救。

Claude Mythos vs Claude Opus 4.6：定位对比

Mythos Preview与当前最强通用模型Opus 4.6，核心赛道截然不同。

维度	Claude Mythos Preview	Claude Opus 4.6
定位	防御性网络安全专用前沿模型	最强通用智能模型（编程/推理/Agent）
访问方式	邀请制，无自助注册	API 公开可用
定价	$25 / $125 per MTok	$5 / $25 per MTok
上下文窗口	已优化配置	1M tokens
网络安全漏洞复现	83.1%	66.6%
适合对象	安全研究机构、关键基础设施运营商	通用开发者、企业
发布平台	Claude API、Bedrock、Vertex AI、Microsoft Foundry	Claude API、Bedrock、Vertex AI

核心差异：Mythos能力更强，但专用化定位与邀请制访问意味着它不会、也不应取代Opus 4.6作为通用开发工具的角色。两者功能各异，分工明确。

如何申请访问 Claude Mythos？

目前没有任何自助注册渠道。若想使用Mythos，仅有两条路径：

已获授权机构：12家创始合作方及40余家受邀机构已获得访问权限。
申请渠道：通过anthropic.com/glasswing了解计划详情并提交参与申请。

准入条件严苛：聚焦于管理关键软件基础设施的机构，优先考虑安全研究与防御性应用场景。

正式商业上线后，API访问将通过以下平台提供：

Claude API（直接调用）
Amazon Bedrock
Google Vertex AI
Microsoft Foundry（相比Opus 4.6新增平台）

Claude Mythos 会开放给普通开发者吗？

结合当前定价与访问机制，短期内可能性极低。Mythos每百万token定价是Opus 4.6的5倍，且需通过资质审查——这明显不是走“人人可用”路线。

但参考Anthropic历史发布模式，研究预览阶段通常是正式发布前的过渡。如果Mythos完成安全评估并获得充分防护，未来不排除以某种受限访问形式向更广泛的开发者开放。

对多数开发者而言，Claude Opus 4.6仍是当前最强的通用可用模型：1M tokens上下文、$5/$25 MTok定价、支持Extended Thinking和Adaptive Thinking，在编程与Agent任务上的表现已足够优异。

Project Glasswing 的战略意义

Anthropic将Glasswing描述为“软件安全史上意义最重大的努力之一”。这一说法分量很重，但细究之下确有道理：

AI能力已质变：Mythos找到了人类与传统工具数十年未能发现的漏洞，表明AI在安全领域已迈入新的质变节点。
攻防不对称正在逆转：过去，漏洞发现较修复容易得多；如今，AI可能首次让防守方获得规模化漏洞挖掘的能力。
开源基础设施优先：400万美元的捐款指向Alpha-Omega、OpenSSF、Apache等开源基金会，表明安全加固的优先方向是全球共用的开源基础设施。

常见问题

Q：Claude Mythos 是 Claude 5 吗？
官方未将其定名为Claude 5。它是前沿模型的研究预览版，专为网络安全场景设计，并非下一代通用旗舰的正式发布。Anthropic当前最强的通用可用模型仍是Claude Opus 4.6。

Q：Claude Mythos 能否用于攻击性黑客行动？
Project Glasswing明确将Mythos定位为防御性用途，参与机构需接受资质审查。官方的核心逻辑正是“赶在恶意行为者获得类似能力之前，先将其用于防御”——防止滥用是首要设计约束。

Q：Mythos 的漏洞复现 83.1% 对应何种 benchmark？
该数据来自Anthropic官方的网络安全漏洞复现任务评测，衡量模型根据漏洞描述重现已知安全缺陷的能力，是网络安全AI评估的核心指标之一。Claude Opus 4.6在同一测试中为66.6%，提升幅度超过16个百分点。

Q：目前能否调用 Mythos 进行代码安全审计？
无法直接调用，需通过Project Glasswing申请资格。若急需代码安全审计能力，Claude Opus 4.6和Claude Sonnet 4.6均具备较强的代码分析与安全漏洞识别能力，可通过Anthropic API直接使用。

小结

Claude Mythos Preview 是Anthropic迄今发布的能力最强的模型，但它并非通用产品，而是定向部署的安全研究工具。 发布于2026年4月7日，与Project Glasswing联合推出，背后是12家全球顶级科技机构和超过1.04亿美元的资金承诺，定价25/125美元每百万token，仅限邀请制访问。

对多数开发者而言，Claude Opus 4.6仍是当前最强可用选择。而Mythos的发布，更像是对下一代Claude模型能力上限的预示——更强的推理、更深的代码理解，以及超越人类专家的漏洞识别能力。

本文数据来源：Anthropic官方API文档（platform.claude.com/docs，2026年4月8日实测）及Anthropic Project Glasswing公告页（anthropic.com/glasswing，2026年4月7日发布）。