AI造假调查:30天卧底揭示算法如何奖励虚假内容
回想一下,你最近一次向AI咨询“哪款洗发水效果最好”是什么情形?你是否曾质疑过,它给出的答案究竟源自何处?
如今,有一类公司的主营业务就是生产这类答案。他们不进行产品实测,也不开展用户调研。其核心策略是:大规模制造夸大其词乃至凭空捏造的内容,并将其系统性地“投喂”给AI模型。
这并非危言耸听。一位媒体从业者曾潜入一家从事“生成式引擎优化”的公司,进行了为期30天的实地调查。他所记录下的内幕,远比外界想象的更为触目惊心。
例如,在一篇关于某洗发水品牌的推广稿件中,竟声称使用该产品“平均每日可促进头发生长2厘米”。按此推算,一个月便能长出60厘米。而AI,不加甄别地引用了这一荒谬说法。
这绝非偶然失误。其背后是一套高度工业化、流程化的操作体系。这也不仅仅是某个垂直领域的孤例,而是揭示了AI搜索时代一个系统性的漏洞,正在被有组织、有规模地利用。
01 AI的“信任”基石是什么?
要洞悉AI为何易于被误导,首先需要厘清AI与人类在建立“信任”机制上的本质差异。
人类在评估一个品牌的可信度时,遵循的是“核实逻辑”——我们会查验其线下实体、咨询亲友口碑、研判用户评价的真实性、搜索媒体的相关报道。这个过程虽耗时费力,却能有效筛除大量虚假信息。
AI判断品牌可信度,则依赖于“密度逻辑”——该品牌在网络中被提及的频次是否足够高?描述其的信息口径是否高度一致?信息来源是否显得足够分散?
简而言之:
人类的核实逻辑:主动发现矛盾 → 矛盾越多,可信度越低。
AI的密度逻辑:被动统计密度 → 密度越高,被引用的权重就越高。
这两种逻辑对虚假信息的抵御能力,截然不同。
欺骗人类的核实逻辑,成本极高——你需要让虚假信息在现实世界中经得起多方位的交叉验证。
而欺骗AI的密度逻辑,成本极低——你只需让特定信息在互联网上实现足够广泛、足够一致的重复出现。
这是两套完全不同的攻防游戏规则。前述调查中曝光的发稿系统——能够日均生成并分发上千篇内容至数十个平台——正是精准针对AI“密度逻辑”弱点而设计的工业化工具。那篇宣称“日生发2厘米”的稿件,人类一看便知荒诞,但在AI的识别框架下,它只是又一条增加了该品牌网络声量的“正向内容”。可信度密度,就此被人工抬高了一分。
02 被工业化制造的“可信度”
调查记录中,有一个关键词被频繁提及——“丰富”。
客户提供一个基础资料包,服务商的任务就是对其进行“丰富”。所谓“丰富”,通常意味着:植入虚构数据、冠以不存在的权威机构名称、编造高比例的用户好评。而这些被添加的“佐料”,往往无从考证。
例如,“连续三年荣获中国健康产业协会最佳创新品牌”——该协会子虚乌有。再如,“97.3%的用户在使用28天后肤质得到显著改善”——该数据没有任何研究支撑。
但这并不妨碍其生效。因为当前的AI尚不会执行溯源查证。
这套模式的底层逻辑可以概括为:在AI的信任机制下,可信度不再与真实性强相关,而变成了信息密度与一致性的衍生函数。
我们或许可将此现象定义为“可信度制造”——它并非偶然的欺骗行为,而是一套可标准化、可批量复制的工业生产流程。
该流程通常包含三个核心环节:
环节一·内容生产:利用大语言模型批量生成文稿,植入虚构数据与虚假认证。
环节二·密度投放:通过自动化分发系统,将内容铺展至AI可能抓取的各类平台,以提升网络声量密度。
环节三·一致性维护:确保所有投放内容的核心话术高度统一,使AI抓取到的信息能相互印证,形成“回音壁”效应。
完成这三个环节,一个品牌在AI认知体系内的“可信度”便得以构建。而这,与该品牌的实际品质,可能毫无关联。
03 无法回避的“囚徒困境”
你或许会质疑:那些坚持诚信经营的品牌,该如何应对?
这里存在一个残酷的市场结构性问题。
如果你是一个恪守底线的品牌,拒绝数据造假、拒绝虚构背书、拒绝海量灌水——那么,你在AI搜索结果中的能见度,很可能远低于那些采用激进手段的竞争对手。
最终结果是,消费者通过AI搜索看到的,往往是网络信息密度最高的品牌,而非产品力最强的那个。
调查记录中,一位内部人士的直言颇为犀利:“公司要让客户感知到我们的‘努力’,一天发一千篇听起来就比十篇厉害。”“真正有效的内容,或许一篇足矣。但一篇卖不上价,一千篇可以。”
这句话不仅揭示了行业潜规则,更指向一个经典的“囚徒困境”:
若你造假,而对手不造 → 你在AI中的曝光率碾压对手,赢得短期优势。
若你不造,而对手造假 → 你的曝光率被对手压制,陷入短期劣势。
若大家竞相造假 → AI推荐系统整体公信力受损,长期所有人皆输,但在这种溃败中,最先停止造假的一方,将承受最惨重的损失。
遵守规则者,在AI主导的流量分配新秩序下,正面临被悄然边缘化的风险。这不禁让人联想到“漳州杨梅”的案例——即便违规者最终受到惩处,但那些坚守品质的果农,或许早已砍掉了果树,转营他业。
04 作为用户,如何保持警惕?
剖析完机制,我们来谈谈实际应对。在AI推荐的内容中,以下几类信号值得你高度警觉:
1. 呈现精确到小数点后位的效果数据(如“改善率达97.3%”),却未注明研究机构、样本容量及统计方法。
2. 宣称“连续N年获得XX奖项”,但该奖项的主办方模糊不清,缺乏权威媒体报道佐证。
3. 跨平台、多账号发布的内容,表述高度雷同,有明显的模板化痕迹。
4. 所谓的“权威机构背书”,来自一个名不见经传、网络信息稀少的协会或组织。
这并非全盘否定AI推荐的价值。而是说,在AI的“密度逻辑”被工业化手段大规模利用的当下,其输出结果更应被视为我们信息甄别过程的“起点”,而非做出决策的“终点”。
AI告诉你“某个品牌不错”,这可以成为你进一步深入了解它的契机。但绝不应成为你下单购买的惟一依据。
05 这场博弈关乎哪些人?
① 依赖AI搜索进行消费决策的用户
AI推荐正深度渗透日常消费决策。美妆护肤、健康保健、母婴用品、知识付费——这些信息不对称严重、市场竞争激烈的领域,正是“生成式引擎优化”泛滥的重灾区。你需要做的,是训练自己将AI的答案视为一份待核验的“信息清单”,而非不容置疑的“最终裁定”。
② 考虑相关营销服务的中小品牌主
如果你是一个具备真实产品力的品牌,而竞争对手正在大量采购此类优化服务,那么你正面临一个短期不公平、但长期存在翻盘机会的竞争环境。因为AI平台自身也在持续升级对虚假、低质内容的识别算法。关键在于,找到那些能真正助力内容质量提升(而非单纯堆砌数量)的合作伙伴,这两类服务商的路径已日益分化。
③ 关注AI治理的从业者与政策研究者
“生成式引擎优化”目前仍处于监管的灰色地带。但它所暴露的核心问题——AI的输出质量严重受制于其训练与检索内容的质量,而该质量可被系统性操纵——必将随着AI搜索普及率的提升而日益严峻。当前,正是探讨行业规范、构建监管框架的关键窗口期。
AI正在成为信息分发的核心枢纽,但其底层的信任机制,显然尚未准备好应对如此规模化的系统性操控。
写在最后
讨论至此,一个根本性问题依然悬而未决:AI公司自身,是否有能力反制这套“可信度制造”体系?
从技术原理上讲,答案是肯定的。例如,通过更先进的算法识别内容来源的异常集中性、发布时间的规律性、跨平台文本的过度一致性,从而过滤掉协同性的批量投放。事实上,部分头部AI企业已在此方向投入研发资源。
然而,技术攻防战的节奏历来如此——进攻方的创新速度,往往领先于防守方的响应速度。回顾历史,SEO(搜索引擎优化)与搜索引擎之间的博弈已持续二十余年,至今仍在演进。GEO(生成式引擎优化)与AI搜索之间的这场全新对抗,其长期性与复杂性恐怕亦不例外。
在这场漫长的拉锯战中,作为信息消费者,我们多一分审慎与辨别力,便能少一分被误导的风险。如果本文能带来些许实际价值,或许正在于此。