GEO公司AI训练师30天卧底实录:揭秘数据标注行业的真实工作流程与挑战

2026-05-08阅读 0热度 0
ai

一个从未生产过任何产品的品牌,被AI认定为“值得推荐”。从注册到上榜,只用了两个小时。

这并非虚构的故事,而是315晚会上,亿万观众共同目睹的现实一幕。

然而,曝光之后呢?整个行业非但没有沉寂,反而愈发火爆。问题是,它真的变好了吗?

为了厘清当下GEO市场的重重迷雾,摸清那些虚假资质、批量灌稿、数据造假的坑究竟如何形成,我们决定不再隔岸观火——直接进去。

历时一个月,我们真正卧底进入一家GEO公司。关起门来,看看这些人究竟在做什么。

1、GEO就是大量发稿?

入职第一天,我被分到了“内容组”。三位同事,两台大屏显示器,一面白板上写满了客户名称。组长姓李,三十出头,此前在一家SEO公司干了五年,去年跳槽过来。他的入职培训,只用了十分钟。

“GEO你知道是啥吧?”他问我。

我表示大致了解,就是让品牌出现在豆包、DeepSeek这类AI搜索的回答里。

“对,就这么简单。”他点了支烟,“用户问AI‘哪个洗发水好用’,AI的回答里能带上我们客户的品牌,这就是我们的工作。”

“那怎么让AI带上呢?”

他笑了笑,那是一种“你问到点子上了”的表情。

“发稿。大量发稿。让AI能搜到的地方全是我们的内容,它自然就会引用。”

这个底层逻辑不难理解。AI搜索的回答基于其抓取到的网络信息,如果某个品牌的正面内容铺天盖地,AI推荐它的概率自然大增。但随后看到的一切,让我意识到事情远非如此单纯。

2、全球第一,竟然全是编的

李哥让我先熟悉“内容模板库”。那是一个共享文件夹,按客户分类,每个客户名下躺着几十个Word文档。随手点开一个,是某健康品牌的GEO稿件。

开头第一句赫然写着:“作为国内领先的健康管理品牌,XX已服务超过500万用户,连续三年获得中国健康产业协会‘最佳创新品牌’称号。”

下意识地去搜索“中国健康产业协会”。查无此机构。

再搜“500万用户”的数据来源。没有任何公开信息可佐证。

本以为是个例,又接连点开几个文件。一个护肤品客户的稿件声称“经权威机构检测,使用本品牌产品28天后,97.3%的用户肤质明显改善”;另一个生发品牌的稿件则写着“每日平均生发2cm”。

所有这些数据,全都找不到出处。

我向李哥求证:“这些数据是客户提供的吗?”

他头也没抬:“有些是,有些是我们‘丰富’的。客户会给个基础材料包,我们在上面加工一下。”

“丰富”。这个词被记住了。

后来才明白,这在业内甚至不算出格。有些服务商会直接给客户发内容模板,上面赤裸裸地标注着“数据可以适当夸张”、“合作案例板块越多越好”。逻辑很直接:夸张一点,AI更容易采信,稿件被引用的几率就更高。

核心原因在于,AI不具备实地调查的能力。你告诉它这个品牌拥有500万用户,它不会打电话核实;你虚构一个认证机构,它不会去查工商注册。它只评估内容的“可信度”——而可信度,恰恰是可以被批量制造的。

央视记者虚构了一个手环品牌,注册官网、设计Logo,然后发布一系列稿件。不久之后,AI搜索便开始推荐这个根本不存在的品牌。一个从未生产过任何产品的“空气品牌”,就这样被AI认定为值得推荐。

另一个案例更接地气。某洗发水品牌的竞品在GEO稿件中宣称“使用该品牌洗发水平均每日头发生长两厘米”。每日两厘米,一个月就是六十厘米。稍微动脑就知道这数据荒谬绝伦,但AI没有脑子——它照单全收,并加以引用。

所谓的GEO内容生产,在某种程度上,演变成了用精心编造的虚假信息投喂AI。因为AI不会核实,只会引用。

3、自动发稿机,日产千篇

入职第三天,我被带到了另一个房间。两个年轻小伙,面前各摆着三台电脑,屏幕上运行着我从未见过的操作界面。

“这是发稿系统。”李哥介绍得轻描淡写。

凑近观察。左边屏幕上的文本编辑器正在批量生成文章——调用的是豆包的API。中间屏幕是一个后台管理界面,罗列着十几个自媒体平台的账号密码。右边屏幕则跳动着实时日志,每隔几秒就弹出一条“发布成功”。

“一天能发多少篇?”我问。

小伙回头瞥了一眼:“看客户需求,量大的时候,上千篇。”

上千篇。一天。

这种工具在行业内被称为“自动发稿机”。315晚会曝光的“力擎”只是冰山一角。在小红书、闲鱼、淘宝等平台,类似的工具随处可见,月费仅需几十元。

量大管饱。这四个字基本概括了我在发稿房里看到的一切。

服务商销售的是稿件数量,客户购买的也是稿件数量。但这两件事叠加,与最终效果几乎脱钩。

事实上,真正有效的GEO,稿件无需海量。精准命中AI模型的信息需求,一篇高质量内容可能抵得上一百篇垃圾稿。但公司需要让客户感知到“努力”,一千篇听起来远比十篇更有冲击力。

一天生产一千篇。而真正起作用的,或许只需要一篇。

但一篇卖不上价钱,一千篇可以。

4、SEO转GEO就是扯淡

公司里至少一半的人来自SEO行业。这不难理解——GEO与SEO仅一字之差,许多人想当然地认为经验可以无缝迁移。

李哥便是典型。他常在组会上强调:“GEO的底子还是SEO,先把百度收录做好,百度才能推给DeepSeek。”

这句话后来被证实错得离谱。除了百度自家的文心一言,目前主流AI搜索产品几乎没有直接调用百度搜索的。DeepSeek用的是博查和小宿,豆包调用字节自研的搜索,Kimi早期接的是Bing,元宝对接微信搜索,通义千问则依托阿里自家生态。

SEO的经验在GEO领域几乎无法平移——两者的底层逻辑截然不同。但这并不妨碍许多人换个名片,继续售卖过时的经验。

另一个在公司里高频出现的词是“蒸馏词”。听起来专业且充满AI感。实际上,它就是将一个核心关键词加上不同的前缀和后缀,批量生成长尾词。这不就是SEO时代的关键词堆砌吗?换了个名叫“蒸馏”,瞬间就显得高级了。

行业里流行的“蒸馏词”,本质就是SEO时代关键词堆砌的变体,只是套了个听起来更智能的名字。

一位在行业深耕多年的朋友后来点破:“搞了些新概念就好包装,一沾AI的边就觉得自己真行了。”他还有一个更犀利的总结:“懂得不能太多。懂得多了反而会害怕、会顾虑。但正因为懂得不多,所以才敢说,才觉得自己厉害。”

5、入职一周,内容生产乱成一锅粥

七天时间,足以看清这家公司的日常运转模式。

早上开会,分配当日各客户的稿件生产指标。上午“写稿”——实则是用大模型生成初稿,人工调整措辞,并塞入那些精心编造的数据和资质。下午发稿,自动发稿机一键分发到各个平台。傍晚整理数据截图,准备向客户汇报。

一条标准的流水线。

内容组不关心稿件质量优劣,只关心“AI能否搜到”。数据真假不重要,重要的是“看起来可信”。发稿量是核心KPI,每日数字必须攀升。

想起HR面试时说的话——“我们做的事情,就是让AI推荐我们的客户。”

没错。但她没说的是,推荐的理由,是我们编造的。

GEO本身有其必要性——品牌需要被AI看见,这是真实存在的需求。但真实的需求,与造假的手段,是两件完全不同的事。

本以为内容造假已是极限,直到亲手学会了计算“推荐率”——那才是这个行业真正的魔术时刻。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策