库里被「采访」？别慌！蚂蚁AI鉴真拿下CVPR 2026冠军，专治黑产

2026-05-03阅读 0热度 0

算法 cvpr 蚂蚁ai 电子表格计算机视觉

深度伪造的“靶心”：演艺圈与AI鉴真的攻防战

机器之心发布

深度伪造技术正以前所未有的速度迭代，而演艺行业的明星们，不幸地成为了这场技术浪潮中最醒目的“靶子”。近期，一系列演员肖像被AI换脸、克隆，甚至用于虚假宣传的事件接连曝光，将技术与伦理的冲突推至公众视野的中心。

例如，有网友发现，AI短剧《重生后，我成了娘亲的守护神》第14集的开头，人物面部特征疑似使用了演员杨紫的脸部数据。无独有偶，某短剧平台也被曝出，在未经任何授权的情况下，利用AI换脸技术伪造了易烊千玺的肖像与声音，应用于多部作品中。

网友称AI短剧《重生后，我成了娘亲的守护神》第14集开头疑似使用了演员杨紫的脸。

某短剧平台多部AI短剧在未经许可的情况下使用AI换脸技术，伪造星易烊千玺的肖像及声音。

演员王劲松也曾就AI虚假代言发声。

面对愈演愈烈的滥用，行业不再沉默。中国广播电视社会组织联合会演员委员会于4月2日发布严正声明，强烈谴责AI换脸、素材滥用及违规训练AI模型等行为，并向行业发出明确警告：必须严守法律底线，共同捍卫视听内容的真实性。

然而，声明只是第一步。随着Nano、BananaSeedance、Kling等图像和视频生成模型的飞速进化，人眼辨别真伪的边界正被快速侵蚀。明星换脸，或许只是深度伪造技术滥用浮出水面的冰山一角。

更值得警惕的风险在于，深度伪造的滥用正急剧扩散——从库里采访被AI杜撰，到用AI生成的假水果图骗取电商退款，这些乱象正在系统性挑战社会信任基石，并严重冲击着内容平台的生态健康。

如何让 AI 练就火眼金睛？

当伪造技术“道高一尺”，鉴真技术就必须“魔高一丈”。在这个真伪难辨的时代，赋予AI一双“火眼金睛”已成为刻不容缓的技术命题。

最近，计算机视觉顶级会议CVPR 2026旗下的NTIRE鲁棒性AIGC图像检测挑战赛结果正式公布。蚂蚁集团AI安全实验室的团队MICV，在最具挑战性的“复杂真实场景鲁棒性样本测试”中，其模型的ROC AUC指标达到了惊人的0.9723，成功摘得该赛道冠军。这场赛事吸引了全球超过500支队伍参与，其权威性不言而喻。

与此同时，蚂蚁团队还做了一件对行业颇具意义的事：发布了业内目前最全面的AIGC图像视频检测资源仓库。这个名为“Awesome-AIGC-Image-Video-Detection”的仓库，整合了最新的热点事件、前沿论文、基准数据集及实用工具，为全球研究人员提供了一个宝贵的一站式技术参考。团队承诺将持续更新，确保资源的时效性与前沿性，以共同应对AI生成内容带来的挑战。

开源仓库：Awesome-AIGC-Image-Video-Detection

现实挑战：AIGC 鉴真面临的双重鸿沟

夺冠背后，是行业普遍面临的严峻现实。现有的AI鉴真技术，在实验室的标准高质量测试集上或许表现优异，但一旦投入复杂多变的真实开放场景，检测准确率往往遭遇“断崖式下跌”。究其根源，主要卡在两个核心难题上。

首先是跨域泛化能力不足。如今，生成式AI的“门派”繁多，扩散模型、自回归模型等不同架构，加上各类闭源商业平台，其生成机制和留下的“伪影”特征千差万别。传统检测模型很容易对训练所用的单一数据源产生“过拟合”，一旦遇上新的、未知的生成体系，立刻“水土不服”，难以识别新型伪造内容。

其次是真实世界的“降质”干扰。一张图片在互联网的传播链路上，会经历压缩、模糊、加噪、裁剪等一系列处理，这些退化效果就像一层“滤镜”，往往会掩盖掉那些本就微弱的生成痕迹，让鉴伪工作难上加难。

正因如此，本次CVPR挑战赛才特别将焦点对准了如何在“未知生成架构”与“复杂退化干扰”这双重考验下，依然保持模型的高准确率与高鲁棒性。这，才是真正意义上的实战能力。

解决方案：基于 DINOv3 的鲁棒检测框架

为了跨越上述鸿沟，蚂蚁安全团队提出并实现了一套基于DINOv3视觉基础模型的鲁棒集成检测框架。这套框架的核心思路，在于充分发挥DINOv3在捕捉图像高频细节上的强大表征能力，并通过数据、架构、优化策略的全链路创新，成功将实验室性能迁移至复杂的真实世界。

分层级数据构建：百万级多源训练语料

打破“过拟合”魔咒，基石在于数据。团队依托深厚的数据积累，构建了一个层次分明、覆盖全面的百万级训练语料库。这个库系统性地囊括了四类数据来源：开源学术基准数据集、主流开源生成模型的定向合成数据、商业闭源API生成的高保真样本，以及比赛方提供的最新数据。这种分层设计，确保了对当前主流乃至前沿生成生态的全面模拟。

双流特征融合的集成架构：充分挖掘表征潜力

为了极致挖掘DINOv3的潜力，团队设计了一个双流并行架构。简单来说，他们将多组不同配置的DINOv3主干网络分成两个独立的网络组。每组内部，通过多尺度特征融合机制，巧妙地将局部空间细节与全局语义信息聚合起来，最后由MLP模块输出初步预测。

在最终决策时，两个网络组独立完成特征提取与预测，其结果通过加权平均进行“后融合”。这种设计巧妙地避免了早期特征简单拼接可能导致的信息淹没问题，同时通过不同配置网络之间的互补效应，提取出更为全局和立体的图像表征。

难度感知的鲁棒数据增强：模拟真实传播链路的阶梯式退化

如何让模型提前适应互联网的“洗礼”？团队构建了一条阶梯式的鲁棒数据增强链路，深度还原真实传播场景：

多类型退化的系统模拟：覆盖模糊、噪声、压缩伪影、色彩偏移及几何畸变等多种退化类型，并通过分层配置强度，实现从单一扰动到复杂复合扰动的递进式模拟。
高保真感知增强机制：引入HiFiC、ELIC等先进的神经网络压缩模型来模拟更真实的编码失真，同时补充社交平台传播压缩、二次翻拍及截屏等非对称退化样本，填补了算法模拟与真实边缘场景之间的分布差异。

模型优化：构建平滑鲁棒的参数空间

在优化策略上，团队也下了狠功夫：
Focal Loss：针对退化后样本检测难度不均的问题，动态降低易分类样本的权重，迫使模型集中精力攻克被严重降质掩盖的“困难户”。
随机权重平均（SWA）：在训练收敛后期，对参数空间内多个权重轨迹进行平滑平均，引导模型收敛至更平坦的极小值区域，从而降低过拟合风险。
TTA机制：在推理阶段，联合原始图像及其水平翻转版本进行结果平均，有效提升了最终预测的稳定性。

通过这一系列环环相扣的技术创新，蚂蚁团队不仅直面并解决了当前AIGC检测技术在实际落地中的核心挑战，也为未来更高效、更精准的深度伪造检测奠定了坚实的方法论基础。

产研并进：打破黑盒瓶颈，拓宽 AIGC 鉴真技术边界

技术的突破不止于一场比赛。蚂蚁安全团队在AI鉴真的理论与方法前沿持续深耕，近期已在CVPR、ICLR等国际顶级会议上发表了多项高水平研究成果。这些工作不仅带来了新的技术思路，更旨在破解现有技术的根本性瓶颈。

一个明确的趋势是，未来的AI鉴真技术不应只是一个“黑盒”二分类器。团队的目标是赋予其强大的泛化能力，并让它能像人类专家一样，进行可解释的推理。

“Veritas”框架便是这一理念的实践。它创新性地结合了多模态大语言模型和模式感知推理机制，突破了传统大模型纯文本思维链的限制。这使得模型在面对未知的生成器时，表现出更强的适应性和逻辑推理能力。Veritas在跨域、跨操控类型的检测场景中，性能超越了现有的SOTA方法，并且能输出透明、令人信服的推理过程。该成果被ICLR 2026录用为口头报告，获得了学术界的认可。

与此同时，团队提出的另一项创新——“Locate-Then-Examine”两阶段检测新范式，则从另一个角度提升了精度。该方法遵循“先定位可疑区域，再进行细节审查”的人类分析逻辑，极大提升了检测的精准度，并有效缓解了当前模型普遍存在的“幻觉”问题。这一技术的推出，标志着AIGC检测技术向更高阶的可靠性与实用性迈出了关键一步。

持续深耕：筑牢 AI 安全防线

所有的前沿探索与赛事荣誉，都离不开长期扎实的积累。多年来，蚂蚁集团在生物识别与安全检测领域构筑了深厚的技术优势，不仅参与并主导了多项国际安全标准的制定，还积累了超过50项国际专利。这些积淀，构成了蚂蚁AI安全实验室在全球顶级赛事中屡获佳绩的坚实基础，至今已斩获10余项世界冠军。

进入大模型时代，安全威胁日益复杂多元。蚂蚁团队始终保持高频创新节奏，自2024年以来，已在AI鉴真领域发表8篇高水平学术论文，开源4个具有行业影响力的基准数据集（累计下载超10万次），并在相关国际顶级赛事中获得3次冠军。

在技术落地层面，成果同样显著。团队为蚂蚁集团旗下多个业务平台提供了强大且鲁棒的AIGC检测解决方案，服务覆盖数亿用户。更为重要的是，这些技术已通过CNAS认证、iBeta国际生物安全认证等多项权威认证，这无疑标志着其技术能力与可靠性已处于行业领先地位。