Claude Mythos 深度评测:2026年Anthropic最强AI模型

2026-06-17阅读 0热度 0
人工智能 LLM

2026年4月7日,Anthropic发布了一个非常规动作——在揭晓Project Glasswing的当天,同步推出了Claude Mythos Preview。这绝非面向大众的通用模型,而是专攻“防御性网络安全”的顶尖专用工具。核心数据一目了然:在网络安全漏洞复现基准测试中,Mythos实现了83.1%的准确率,相比Claude Opus 4.6的66.6%保持了显著优势。访问方式严格限定为邀请制,仅对经过严格审查的安全研究机构开放,没有自助注册通道。定价方面,每百万输入/输出token分别收费25美元和125美元,可通过Claude API、Amazon Bedrock、Google Vertex AI和Microsoft Foundry使用。


Claude Mythos 的诞生逻辑:Project Glasswing 全景解析

Mythos Preview的发布与Project Glasswing密不可分——这是Anthropic于同日宣布的全球软件安全计划,核心目标是在对手之前,将AI的超凡能力优先配置于防御层面。

12 家创始合作机构

Project Glasswing汇聚了科技与金融领域的12家顶级机构:

  • 科技巨头:Amazon Web Services、Apple、Broadcom、Cisco、Google、Microsoft、NVIDIA
  • 安全专家:CrowdStrike、Palo Alto Networks
  • 金融机构:JPMorganChase
  • 开源基金会:Linux Foundation
  • AI 公司:Anthropic(发起方)

除这12家外,另有40余家管理关键软件基础设施的机构获得了研究预览的访问权限。合作阵容之强,表明Anthropic意在推动全行业联合行动。

资金承诺

Anthropic的投入实打实:向Project Glasswing参与方提供了1亿美元的模型使用额度,向Alpha-Omega和OpenSSF捐赠250万美元,向Apache Software Foundation捐赠150万美元。这并非象征性举措,而是实质性的资源注入。


Claude Mythos 的核心能力

漏洞识别:已发现数千个零日漏洞

Mythos Preview在真实生产代码中已成功识别数千个此前未知的高危漏洞,覆盖主流操作系统与Web浏览器。举几个冲击力强的案例:它发现了OpenBSD中潜藏27年的安全漏洞,FFmpeg中一个存在16年的漏洞,以及Linux内核中多个内核级别的漏洞。

这些漏洞历经数十年的人工审查与数百万次的自动化安全测试,始终未被发现——直到Mythos介入。这意味着,AI在“漏洞挖掘”这一领域,已经达到人类专家难以企及的水平。

Benchmark:全面超越 Claude Opus 4.6

官方数据显示,Mythos Preview在关键任务上的性能提升极为直接:

任务 Claude Mythos Preview Claude Opus 4.6 提升幅度
网络安全漏洞复现 83.1% 66.6% +16.5pp
复杂编程任务 显著提升 基准 已完成进阶评估

Anthropic的表述非常直白:Mythos的能力已“超越大多数人类专家”,尤其在识别和利用软件漏洞方面。这也是为什么该模型仅限邀请制访问——能力过强,必须严格管控。

为何聚焦防御性网络安全?

Anthropic在发布声明中明确强调:Project Glasswing是“一次紧迫的尝试,在对手获得类似技术优势用于进攻性行动之前,将这些能力投入防御用途”。

这句话揭示了Mythos的根本逻辑:既然AI已具备超人级的漏洞挖掘能力,就必须抢先将其部署在防御端,赶在恶意行为者掌握类似技术之前。这种前置部署远胜事后补救。


Claude Mythos vs Claude Opus 4.6:定位对比

Mythos Preview与当前最强通用模型Opus 4.6,核心赛道截然不同。

维度 Claude Mythos Preview Claude Opus 4.6
定位 防御性网络安全专用前沿模型 最强通用智能模型(编程/推理/Agent)
访问方式 邀请制,无自助注册 API 公开可用
定价 $25 / $125 per MTok $5 / $25 per MTok
上下文窗口 已优化配置 1M tokens
网络安全漏洞复现 83.1% 66.6%
适合对象 安全研究机构、关键基础设施运营商 通用开发者、企业
发布平台 Claude API、Bedrock、Vertex AI、Microsoft Foundry Claude API、Bedrock、Vertex AI

核心差异:Mythos能力更强,但专用化定位与邀请制访问意味着它不会、也不应取代Opus 4.6作为通用开发工具的角色。两者功能各异,分工明确。


如何申请访问 Claude Mythos?

目前没有任何自助注册渠道。若想使用Mythos,仅有两条路径:

  1. 已获授权机构:12家创始合作方及40余家受邀机构已获得访问权限。
  2. 申请渠道:通过anthropic.com/glasswing了解计划详情并提交参与申请。

准入条件严苛:聚焦于管理关键软件基础设施的机构,优先考虑安全研究与防御性应用场景。

正式商业上线后,API访问将通过以下平台提供:

  • Claude API(直接调用)
  • Amazon Bedrock
  • Google Vertex AI
  • Microsoft Foundry(相比Opus 4.6新增平台)

Claude Mythos 会开放给普通开发者吗?

结合当前定价与访问机制,短期内可能性极低。Mythos每百万token定价是Opus 4.6的5倍,且需通过资质审查——这明显不是走“人人可用”路线。

但参考Anthropic历史发布模式,研究预览阶段通常是正式发布前的过渡。如果Mythos完成安全评估并获得充分防护,未来不排除以某种受限访问形式向更广泛的开发者开放。

对多数开发者而言,Claude Opus 4.6仍是当前最强的通用可用模型:1M tokens上下文、$5/$25 MTok定价、支持Extended Thinking和Adaptive Thinking,在编程与Agent任务上的表现已足够优异。


Project Glasswing 的战略意义

Anthropic将Glasswing描述为“软件安全史上意义最重大的努力之一”。这一说法分量很重,但细究之下确有道理:

  • AI能力已质变:Mythos找到了人类与传统工具数十年未能发现的漏洞,表明AI在安全领域已迈入新的质变节点。
  • 攻防不对称正在逆转:过去,漏洞发现较修复容易得多;如今,AI可能首次让防守方获得规模化漏洞挖掘的能力。
  • 开源基础设施优先:400万美元的捐款指向Alpha-Omega、OpenSSF、Apache等开源基金会,表明安全加固的优先方向是全球共用的开源基础设施。

常见问题

Q:Claude Mythos 是 Claude 5 吗?
官方未将其定名为Claude 5。它是前沿模型的研究预览版,专为网络安全场景设计,并非下一代通用旗舰的正式发布。Anthropic当前最强的通用可用模型仍是Claude Opus 4.6。

Q:Claude Mythos 能否用于攻击性黑客行动?
Project Glasswing明确将Mythos定位为防御性用途,参与机构需接受资质审查。官方的核心逻辑正是“赶在恶意行为者获得类似能力之前,先将其用于防御”——防止滥用是首要设计约束。

Q:Mythos 的漏洞复现 83.1% 对应何种 benchmark?
该数据来自Anthropic官方的网络安全漏洞复现任务评测,衡量模型根据漏洞描述重现已知安全缺陷的能力,是网络安全AI评估的核心指标之一。Claude Opus 4.6在同一测试中为66.6%,提升幅度超过16个百分点。

Q:目前能否调用 Mythos 进行代码安全审计?
无法直接调用,需通过Project Glasswing申请资格。若急需代码安全审计能力,Claude Opus 4.6和Claude Sonnet 4.6均具备较强的代码分析与安全漏洞识别能力,可通过Anthropic API直接使用。


小结

Claude Mythos Preview 是Anthropic迄今发布的能力最强的模型,但它并非通用产品,而是定向部署的安全研究工具。 发布于2026年4月7日,与Project Glasswing联合推出,背后是12家全球顶级科技机构和超过1.04亿美元的资金承诺,定价25/125美元每百万token,仅限邀请制访问。

对多数开发者而言,Claude Opus 4.6仍是当前最强可用选择。而Mythos的发布,更像是对下一代Claude模型能力上限的预示——更强的推理、更深的代码理解,以及超越人类专家的漏洞识别能力。

本文数据来源:Anthropic官方API文档(platform.claude.com/docs,2026年4月8日实测)及Anthropic Project Glasswing公告页(anthropic.com/glasswing,2026年4月7日发布)。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策