库里被「采访」?别慌!蚂蚁AI鉴真拿下CVPR 2026冠军,专治黑产
深度伪造的“靶心”:演艺圈与AI鉴真的攻防战
机器之心发布
深度伪造技术正以前所未有的速度迭代,而演艺行业的明星们,不幸地成为了这场技术浪潮中最醒目的“靶子”。近期,一系列演员肖像被AI换脸、克隆,甚至用于虚假宣传的事件接连曝光,将技术与伦理的冲突推至公众视野的中心。
例如,有网友发现,AI短剧《重生后,我成了娘亲的守护神》第14集的开头,人物面部特征疑似使用了演员杨紫的脸部数据。无独有偶,某短剧平台也被曝出,在未经任何授权的情况下,利用AI换脸技术伪造了易烊千玺的肖像与声音,应用于多部作品中。
网友称AI短剧《重生后,我成了娘亲的守护神》第14集开头疑似使用了演员杨紫的脸。
某短剧平台多部AI短剧在未经许可的情况下使用AI换脸技术,伪造星易烊千玺的肖像及声音。
演员王劲松也曾就AI虚假代言发声。
面对愈演愈烈的滥用,行业不再沉默。中国广播电视社会组织联合会演员委员会于4月2日发布严正声明,强烈谴责AI换脸、素材滥用及违规训练AI模型等行为,并向行业发出明确警告:必须严守法律底线,共同捍卫视听内容的真实性。
然而,声明只是第一步。随着Nano、BananaSeedance、Kling等图像和视频生成模型的飞速进化,人眼辨别真伪的边界正被快速侵蚀。明星换脸,或许只是深度伪造技术滥用浮出水面的冰山一角。
更值得警惕的风险在于,深度伪造的滥用正急剧扩散——从库里采访被AI杜撰,到用AI生成的假水果图骗取电商退款,这些乱象正在系统性挑战社会信任基石,并严重冲击着内容平台的生态健康。
如何让 AI 练就火眼金睛?
当伪造技术“道高一尺”,鉴真技术就必须“魔高一丈”。在这个真伪难辨的时代,赋予AI一双“火眼金睛”已成为刻不容缓的技术命题。
最近,计算机视觉顶级会议CVPR 2026旗下的NTIRE鲁棒性AIGC图像检测挑战赛结果正式公布。蚂蚁集团AI安全实验室的团队MICV,在最具挑战性的“复杂真实场景鲁棒性样本测试”中,其模型的ROC AUC指标达到了惊人的0.9723,成功摘得该赛道冠军。这场赛事吸引了全球超过500支队伍参与,其权威性不言而喻。
与此同时,蚂蚁团队还做了一件对行业颇具意义的事:发布了业内目前最全面的AIGC图像视频检测资源仓库。这个名为“Awesome-AIGC-Image-Video-Detection”的仓库,整合了最新的热点事件、前沿论文、基准数据集及实用工具,为全球研究人员提供了一个宝贵的一站式技术参考。团队承诺将持续更新,确保资源的时效性与前沿性,以共同应对AI生成内容带来的挑战。
开源仓库:Awesome-AIGC-Image-Video-Detection
现实挑战:AIGC 鉴真面临的双重鸿沟
夺冠背后,是行业普遍面临的严峻现实。现有的AI鉴真技术,在实验室的标准高质量测试集上或许表现优异,但一旦投入复杂多变的真实开放场景,检测准确率往往遭遇“断崖式下跌”。究其根源,主要卡在两个核心难题上。
首先是跨域泛化能力不足。如今,生成式AI的“门派”繁多,扩散模型、自回归模型等不同架构,加上各类闭源商业平台,其生成机制和留下的“伪影”特征千差万别。传统检测模型很容易对训练所用的单一数据源产生“过拟合”,一旦遇上新的、未知的生成体系,立刻“水土不服”,难以识别新型伪造内容。
其次是真实世界的“降质”干扰。一张图片在互联网的传播链路上,会经历压缩、模糊、加噪、裁剪等一系列处理,这些退化效果就像一层“滤镜”,往往会掩盖掉那些本就微弱的生成痕迹,让鉴伪工作难上加难。
正因如此,本次CVPR挑战赛才特别将焦点对准了如何在“未知生成架构”与“复杂退化干扰”这双重考验下,依然保持模型的高准确率与高鲁棒性。这,才是真正意义上的实战能力。
解决方案:基于 DINOv3 的鲁棒检测框架
为了跨越上述鸿沟,蚂蚁安全团队提出并实现了一套基于DINOv3视觉基础模型的鲁棒集成检测框架。这套框架的核心思路,在于充分发挥DINOv3在捕捉图像高频细节上的强大表征能力,并通过数据、架构、优化策略的全链路创新,成功将实验室性能迁移至复杂的真实世界。
分层级数据构建:百万级多源训练语料
打破“过拟合”魔咒,基石在于数据。团队依托深厚的数据积累,构建了一个层次分明、覆盖全面的百万级训练语料库。这个库系统性地囊括了四类数据来源:开源学术基准数据集、主流开源生成模型的定向合成数据、商业闭源API生成的高保真样本,以及比赛方提供的最新数据。这种分层设计,确保了对当前主流乃至前沿生成生态的全面模拟。
双流特征融合的集成架构:充分挖掘表征潜力
为了极致挖掘DINOv3的潜力,团队设计了一个双流并行架构。简单来说,他们将多组不同配置的DINOv3主干网络分成两个独立的网络组。每组内部,通过多尺度特征融合机制,巧妙地将局部空间细节与全局语义信息聚合起来,最后由MLP模块输出初步预测。
在最终决策时,两个网络组独立完成特征提取与预测,其结果通过加权平均进行“后融合”。这种设计巧妙地避免了早期特征简单拼接可能导致的信息淹没问题,同时通过不同配置网络之间的互补效应,提取出更为全局和立体的图像表征。
难度感知的鲁棒数据增强:模拟真实传播链路的阶梯式退化
如何让模型提前适应互联网的“洗礼”?团队构建了一条阶梯式的鲁棒数据增强链路,深度还原真实传播场景:
多类型退化的系统模拟:覆盖模糊、噪声、压缩伪影、色彩偏移及几何畸变等多种退化类型,并通过分层配置强度,实现从单一扰动到复杂复合扰动的递进式模拟。
高保真感知增强机制:引入HiFiC、ELIC等先进的神经网络压缩模型来模拟更真实的编码失真,同时补充社交平台传播压缩、二次翻拍及截屏等非对称退化样本,填补了算法模拟与真实边缘场景之间的分布差异。
模型优化:构建平滑鲁棒的参数空间
在优化策略上,团队也下了狠功夫:
Focal Loss:针对退化后样本检测难度不均的问题,动态降低易分类样本的权重,迫使模型集中精力攻克被严重降质掩盖的“困难户”。
随机权重平均(SWA):在训练收敛后期,对参数空间内多个权重轨迹进行平滑平均,引导模型收敛至更平坦的极小值区域,从而降低过拟合风险。
TTA机制:在推理阶段,联合原始图像及其水平翻转版本进行结果平均,有效提升了最终预测的稳定性。
通过这一系列环环相扣的技术创新,蚂蚁团队不仅直面并解决了当前AIGC检测技术在实际落地中的核心挑战,也为未来更高效、更精准的深度伪造检测奠定了坚实的方法论基础。
产研并进:打破黑盒瓶颈,拓宽 AIGC 鉴真技术边界
技术的突破不止于一场比赛。蚂蚁安全团队在AI鉴真的理论与方法前沿持续深耕,近期已在CVPR、ICLR等国际顶级会议上发表了多项高水平研究成果。这些工作不仅带来了新的技术思路,更旨在破解现有技术的根本性瓶颈。
一个明确的趋势是,未来的AI鉴真技术不应只是一个“黑盒”二分类器。团队的目标是赋予其强大的泛化能力,并让它能像人类专家一样,进行可解释的推理。
“Veritas”框架便是这一理念的实践。它创新性地结合了多模态大语言模型和模式感知推理机制,突破了传统大模型纯文本思维链的限制。这使得模型在面对未知的生成器时,表现出更强的适应性和逻辑推理能力。Veritas在跨域、跨操控类型的检测场景中,性能超越了现有的SOTA方法,并且能输出透明、令人信服的推理过程。该成果被ICLR 2026录用为口头报告,获得了学术界的认可。
与此同时,团队提出的另一项创新——“Locate-Then-Examine”两阶段检测新范式,则从另一个角度提升了精度。该方法遵循“先定位可疑区域,再进行细节审查”的人类分析逻辑,极大提升了检测的精准度,并有效缓解了当前模型普遍存在的“幻觉”问题。这一技术的推出,标志着AIGC检测技术向更高阶的可靠性与实用性迈出了关键一步。
持续深耕:筑牢 AI 安全防线
所有的前沿探索与赛事荣誉,都离不开长期扎实的积累。多年来,蚂蚁集团在生物识别与安全检测领域构筑了深厚的技术优势,不仅参与并主导了多项国际安全标准的制定,还积累了超过50项国际专利。这些积淀,构成了蚂蚁AI安全实验室在全球顶级赛事中屡获佳绩的坚实基础,至今已斩获10余项世界冠军。
进入大模型时代,安全威胁日益复杂多元。蚂蚁团队始终保持高频创新节奏,自2024年以来,已在AI鉴真领域发表8篇高水平学术论文,开源4个具有行业影响力的基准数据集(累计下载超10万次),并在相关国际顶级赛事中获得3次冠军。
在技术落地层面,成果同样显著。团队为蚂蚁集团旗下多个业务平台提供了强大且鲁棒的AIGC检测解决方案,服务覆盖数亿用户。更为重要的是,这些技术已通过CNAS认证、iBeta国际生物安全认证等多项权威认证,这无疑标志着其技术能力与可靠性已处于行业领先地位。










