Anthropic Mythos AI安全深度测评：curl漏洞独家分析与修复指南

2026-05-14阅读 0热度 0

Anthropic

今年四月，Anthropic公司发布其新型AI模型Mythos，并以“危险地强大”来形容其代码漏洞检测能力，引发了业界广泛关注。出于安全考量，该模型并未公开，仅限少数大型机构访问，用于优先修复关键安全缺陷。伴随其发布的传闻更是加剧了讨论——据称该模型能在数周内识别数千个零日漏洞，这一说法促使人们重新审视现有软件安全体系的稳固性。

那么，它的实际表现究竟如何？近期一份来自独立第三方的评估报告，为我们提供了更为客观的审视依据。

curl创始人Daniel Stenberg通过Linux基金会的Alpha Omega项目，获得了Mythos对curl代码库的分析报告。curl是全球部署量超200亿次的核心数据传输库，其代码长期经受OSS-Fuzz、Coverity等专业工具的深度审计，安全基础极为坚实。

报告显示，Mythos完成了对curl总计17.6万行C代码的扫描——代码规模约相当于《战争与和平》英文版的1.12倍。扫描结束后，AI模型单方面确认了五个“安全漏洞”。

但经过Stenberg团队数小时的逐项核实，结果与AI的断言存在明显出入。这五个被“确认”的问题中，仅有一个被验证为真实的低危漏洞，并已计划在curl 8.21.0版本中修复。其余四个里，有三个属于API文档中已有明确说明的误报，第四个则是一个普通的非安全类程序缺陷。

Stenberg对此的评论直指核心：“AI单方面将问题标记为‘已确认漏洞’，这一行为本身就值得玩味。”他认为，围绕Mythos的舆论声浪中，营销成分可能超过了实际效能。“现有证据表明，该模型在漏洞发现能力上，并未展现出超越现有成熟工具的、传闻中的压倒性优势。”

实际效能与市场宣传存在差距

事实上，在Mythos之前，诸如Zeropath等AI工具已为curl识别出200至300个程序缺陷，其中包含十余个获得CVE编号的漏洞。对于curl这类经过高度审计的项目，Mythos的介入时间较晚，可挖掘的新漏洞空间本就有限。此次检测更像是在已被反复深耕的土地上进行二次筛检。

技术优势体现在检测效率层面

当然，全盘否定AI在代码审计领域的价值并不客观。另一案例可作为佐证：在Mozilla对Firefox的测试中，Mythos确实识别出270多个漏洞。但其核心价值是否在于“革命性的发现能力”？Mozilla自身即指出，这些漏洞同样能被顶尖的人工审计团队发现。

真正的价值差异在于“效率”。AI能极大压缩从漏洞存在到被识别、确认的时间周期。这对于追求快速迭代与高安全标准的大型项目而言，具有显著意义。Stenberg也认可这一点：“新一代AI工具在检测源代码安全缺陷方面，确实显著优于传统静态分析工具。”

需要指出的是，Stenberg本人也是通过第三方报告进行评估，其结论存在一定局限。但此次测试无疑提供了一个关键参照：在一个成熟且经过严格审计的项目中，当前备受瞩目的AI审计工具，其实际产出相对有限。

我们应如何理性看待？或许可以这样总结：Mythos在curl中仅发现一个低危漏洞的结果，固然无法支撑那些过于狂热的行业炒作，但我们也绝不能因此低估AI技术的长期潜力。现有测试表明，AI在漏洞研究领域已具备明确的实用价值，它更像是一个不知疲倦、高速运转的“超级协作者”。至于其所谓“革命性能力”的宣称，目前看来确有夸大之嫌。

正如Stenberg最终所总结的：“任何尚未使用AI工具进行源代码扫描的项目，都可能借助新一代工具发现大量待修复的缺陷。”这或许才是当前阶段，我们对AI代码审计技术最务实、也最具建设性的期待。

Anthropic Mythos AI安全深度测评：curl漏洞独家分析与修复指南

实际效能与市场宣传存在差距

技术优势体现在检测效率层面

相关阅读

最新教程

最新资讯