Anthropic宣布练出神话级模型:Claude Mythos,代码和黑客能力吊打opus4.6,不向公众开放!
Anthropic的神秘“玻璃之翼”:神话级模型与它的闭门测试
就在今天,Anthropic正式揭晓了一项名为“Project Glasswing”(玻璃之翼项目)的计划。这个计划的启动,直接源于他们训练出了一个堪称“神话级”的全新模型——Claude Mythos Preview。没错,这正是前两天在开源社区引起波澜的代码泄露事件中提及的那个模型。
看看这个项目的阵容,你就知道它绝非寻常:亚马逊AWS、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达、Palo Alto Networks,再加上Anthropic自己,整整12家科技与金融巨头联合发起。这阵仗,本身就传递了一个明确的信号。
说直白点,就是因为这个模型的能力实在过于强大,以至于必须采取最严密的安全测试模式。它目前只向获得认可的合作伙伴机构内部开放,完全不对公众发布。那么,它到底强到什么地步?数据是最直接的答案,尤其是在代码和推理能力上,可以说是全面超越了当前的顶梁柱Claude Opus 4.6。
先看代码能力:
再看推理能力:
以及搜索与计算机使用能力:
从命名上就能看出端倪:“Opus”意为杰作,而“Mythos”直指神话。为此,Anthropic的CEO以及一众合作方大佬都亲自出面,为这项计划站台背书,其重要性不言而喻。
Anthropic已经明确指出,没有将Claude Mythos Preview向公众开放的打算。但他们的长期目标,是让未来用户能够安全地使用具备同等能力级别的模型。为了实现这个目标,他们计划首先在即将推出的Claude Opus新版本上开发和验证相关的安全防护机制。说白了,就是要先在风险可控的环境里跑通流程、完成迭代,再考虑下一步。所以,我们很可能很快会看到一个搭载了部分已验证能力的新版Opus问世。
接下来,我们得仔细看看,这个神秘的“Project Glasswing”究竟发现了什么。
这个模型发现了什么?
在过去几周里,Anthropic利用Claude Mythos Preview对全球主流的操作系统、浏览器及其他关键软件进行了一次深度扫描。
结果呢?模型发现了数千个此前从未被记录在案的“零日漏洞”,其中大量被评估为高危级别。这不仅仅是一次简单的漏洞挖掘,它揭示的深度令人咋舌。
几个具体案例足以说明问题:
其一,是在OpenBSD中发现了一个存在长达27年的漏洞。要知道,OpenBSD素以极高的安全性著称,常被用于防火墙等关键基础设施。而这个漏洞,竟然允许攻击者仅仅通过连接目标机器,就能导致其远程崩溃。
其二,是在FFmpeg中揪出了一个隐藏16年的漏洞。FFmpeg作为核心的视频编解码库,被无数软件所依赖。更具冲击力的是,模型找出漏洞的那行关键代码,在此之前已经被各类自动化测试工具反复扫描了超过500万次,却始终未被察觉。
其三,是在Linux内核中,模型展现了更高级的“攻击链”构建能力:它自主发现并成功串联了多个独立的漏洞,使得攻击者能够从普通的用户权限,一步步提升,直至获得整台机器的完全控制权。这种从点到面的威胁串联能力,才是真正需要警惕的。



