微软MDASH智能体框架深度评测:多模型性能全面超越My的权威榜单

2026-05-17阅读 0热度 0
微软

2026年5月13日,微软自主代码安全团队正式发布了多模型智能体扫描框架MDASH。该工具在权威基准测试平台CyberGym上的综合性能表现,已全面超越Anthropic的Mythos模型与OpenAI的GPT-5.5。

MDASH的核心差异在于其架构范式。区别于依赖单一AI模型的传统方案,MDASH采用了多智能体协同架构。框架集成了上百个功能专精的AI智能体,它们基于不同的大语言模型或轻量化模型构建,并在扫描流程中被精准调度:分别负责代码预处理、深度漏洞探测、结果复核、去重、证据链构建乃至补丁有效性验证等关键环节。

这一设计显著提升了系统效率。其分层协同机制将最复杂的逻辑推理任务分配给推理能力最强的模型,而将高频次、大规模的代码比对与交叉验证交由响应速度最快的轻量级模型处理。这种分工优化了系统的整体吞吐量与决策一致性。

在实际压力测试中,MDASH展现了卓越的漏洞发现能力。针对Windows网络与身份验证模块的测试,它成功识别出16个此前未公开的安全缺陷,其中包括4个高危远程代码执行漏洞。在一个更具挑战性的私有驱动程序验证场景中,面对人为嵌入的21个已知漏洞,MDASH实现了100%的识别率,且全程零误报。

历史回溯评估进一步印证了其可靠性。对于clfs.sys组件近五年内的所有已知漏洞,MDASH的召回率达到96%;对tcpip.sys组件的漏洞召回率更是达到100%。目前,该框架已应用于微软内部的产品安全强化流程,并开始面向部分合作客户进行有限范围的预览测试。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策