12美元测试揭示ChatGPT等AI集体失误
你肯定也发现了,现在AI搜索的热度越来越高。“有啥不懂,先问AI”已经成了不少人的新习惯。可刷到那些豆包翻车的热搜时,大家心里都明白——这东西有时候看着挺像那么回事,但根本经不起推敲。
有的数据不知道从哪冒出来的,有的概念压根就不是那么回事,甚至有些论文都是AI自己编的。真要拿这些东西去用,那可就闹笑话了。上网一搜,吐槽AI搜索不靠谱的帖子比比皆是。
前阵子,一位叫罗恩・斯托纳(Ron Stoner)的安全工程师,在自己的博客上发了一篇文章,说他就花了12美元(约82元)注册了个域名,再顺手改了一下维基百科,就把ChatGPT、Claude3、Gemini Advanced这些主流的AI大模型全给骗了。
这哥们到底是怎么操作的?
花12美元就成功欺骗了主流AI
作为安全工程师,Ron Stoner一直对Anthropic、OpenAI这些公司宣扬的“大模型需要花好几个月甚至好几年不断灌输恶意内容才会出问题”的说法表示怀疑。他觉得,自己完全能找到一种更快、更便宜、更简单的攻击方式。
关键是,从数据的源头下手就行。
他盯上了一款叫6 Nimmt!(也就是“谁是牛头王”)的德国桌游,一款1994年发行的老牌策略卡牌游戏。
为什么偏偏是它?因为这游戏在德国以外的地方几乎没什么名气,而且现实中从来没举办过什么官方的世界锦标赛,网络上关于它世界冠军的信息完全是空白。
对AI来说,这种信息真空地带,简直就是无人区。
这就好比一片从来没人开拓过的荒地,谁先搭个窝棚,AI就会认定谁是这块地的主人。
于是,Ron Stoner开始行动了。
第一步,他花12美元注册了一个看起来特别官方的域名——6nimmt.com。
第二步,他让AI帮忙写了一篇激情四射的新闻稿,大概意思是自己在慕尼黑,击败了来自二十多个国家的顶尖选手,拿下了牛头王的世界冠军。他还特意加上了彩带飘落、观众欢呼这些逼真的赛后感言,然后把文章挂在了刚买的那个网站上。
最关键的是第三步。他去维基百科,在那款桌游的词条下面加了一段话,说他就是2025年的世界冠军,并且把参考资料链接指向了自己刚建好的那个破网站。
整个操作,前后不到二十分钟。
接下来,Ron只是问了几家大模型一个简单的问题:你能告诉我6nimmt世界冠军是谁吗?
结果怎么样?
堪称大翻车。
不管是Gemini还是ChatGPT,只要问它们谁是牛头王的世界冠军,所有AI都斩钉截铁地回答是Ron Stoner。
有的模型甚至把那篇假新闻稿里的细节当成了铁证,绘声绘色地描述他赢得比赛的整个过程,仿佛那个AI当时就坐在慕尼黑的观众席上。
一个根本不存在的冠军,就这么被供上了神坛。
AI被投毒后,衰减时间比预期的长
当然,这还不是最离谱的。
如果只是短时间的问题,那倒还好。可这条漏洞百出的假条目,在维基百科上整整存活了两个多月。
在这段时间里,几乎所有带联网搜索功能的大模型都抓取到了这条信息,并在用户提问时毫不犹豫地输出虚假答案。
直到前不久,Ron Stoner在博客上公开了整个实验过程,维基百科的志愿者才发现并删除了这个条目。
看到这种事,网友们的反应出奇一致——大厂们又丢人了。
想想看,那些硅谷巨头动辄花几十亿美元买显卡算力,耗费大量电力建数据中心去训练超级大脑,结果呢?这些号称能改变人类未来的大模型,却被一个安全工程师用几十块钱和二十分钟的空闲时间给轻松打穿了。
至于他是怎么做到的,这就要聊聊什么是检索增强生成(RAG)了。
我们常用的这些大模型虽然能说会道,但他们的训练数据都停留在某个时间节点之前。比如Gemini 3.5 Flash的训练数据还停留在2025年上旬。要想获得这个时间点之后的信息,就得先上网搜一搜,再基于搜索到的资料生成结果。
就像这样,只有打开RAG功能,Google AI Studio才能正确回答我的问题,否则它的知识就被锁在去年的那个时间点上。
按理说,借助外部信息佐证,能让大模型生成更正确、更具体且更新的回答。
但问题就出在这里——AI根本分不清信息的真假,它只认权威。在AI的底层逻辑里,维基百科就是互联网上最靠谱的百科全书,只要百科上有的,那就是真理。
而Ron Stoner就利用这一点,把链接挂到了维基百科上。AI顺着维基百科爬过去一看,两边说法对得上,即便他建的网站是个三无产品,大模型还是直接把它当成了事实。
类似的事情,现在在国内也有发生。
在网上随便搜一搜,到处都是教你怎么优化排名逻辑的GEO教程。每个厂商似乎都希望自己的内容能成为AI眼中的“标准答案”。于是,大量Agent机器人在背后夜以继日地污染内容平台,AI搜索的可信度也在与日俱减。
好消息是,目前海外几家大模型都已经针对性地消除了Ron Stoner的伪造信息。
坏消息是,国内的大模型厂商似乎完全没想到这一出。相反,Ron Stoner的英文网页甚至为这个虚假消息增加了“可信度”。
要知道,这一切的成本只需要12美元。
换句话说,如果国内有人想搞点什么名堂,或者厂商想推广新产品,准备一个看起来相关的网址,去维基百科上动动手指,用Image2搞个网页截图,然后——砰!
这下,Uzi也能成为大模型公认的S赛世界冠军了。
用户急需提高AI商:先甄别再使用
聊到这里,大家应该能感受到目前AI搜索有多不靠谱了吧。
没错,Ron Stoner的操作看起来像个玩笑,他确实也是在玩玩而已。但他的做法,其实暴露了一个非常致命的未来隐患。
今天他改的是一个没人关心的纸牌游戏冠军,那明天如果有组织去篡改历史记录、文学典籍呢?再想想,如果被篡改的是医疗偏方、公司财报或者投资数据呢?
嗯……后果不堪设想。
成本这么低,别有用心的人完全可以批量制造假新闻,再通过百科类网站进行“信任洗白”,最后让AI把这些毒药端给毫不知情的用户。长此以往,大模型的数据可信度只会与日俱减,变成一个充斥着虚假信息的垃圾堆。
当然,各家厂商也有在采取措施。谷歌表示自己在搜索、Gemini、Chrome、Pixel和云端增加了AI验证工具,OpenAI也推出了可溯源的隐形水印。这些举措能在一定程度上遏制AI投毒的现象,至少确保不会出现内容自食的情况。
那么,面对这种局面,我们该怎么办呢?
还是建议摆正心态吧。就目前大模型的可靠性,也就找找乐子、查查旅游攻略的时候能用用,出点小错误也无伤大雅。
但如果你要查证历史事实、做投资决策或者吃药治病,那就得自己做好信息交叉验证。看看这信息的源头到底是个野鸡网站,还是正经媒体。把判断真伪的权力握在自己手里,而不是交给一个连几十块钱的假域名都能骗过去的东西。
未来的AI还会怎么卷,谁也说不准。但至少现在,咱们还是得多用用脑子了。就像之前一直强调的,过去,智商和情商很重要;未来呢?AI商也很重要。提高AI素养,才能真正用好AI。













