谷歌AI摘要拼写错误频发，大语言模型固有缺陷难根治

2026-05-29阅读 0热度 0

人工智能

Google 这个单词里有几个字母 P？谷歌 AI 给出的答案是两个。但这还不是最离谱的——它还说单词“poop”里有一个字母 r，“journalism”里有两个字母 d，可它给出的拼写却是：j-o-u-r-n-a-d-i-s-m。倒是美国前总统的姓氏，它正确识别出有一个字母 P，可拼写出来却是 t-r-p-u-m。

事实上，谷歌围绕 AI 重构搜索体验以来，出现这类漏洞完全在预期之内。类似闹剧早已上演——AI 摘要模块刚上线时，就曾引用恶搞帖子，抛出“吃石头”“往披萨上涂胶水”等荒谬建议。

谷歌在发给 TechCrunch 的邮件声明中解释：“大语言模型一直存在单词字母计数方面的难题，我们正着手解决这一具体问题。” 话虽如此，这类低级拼写错误并非个例。驱动聊天机器人及各类文本生成工具的大语言模型，设计初衷本就不是识别拼写。多年来圈内一直有个经典梗：每当有新 AI 模型发布，你可以立马考考它——问问单词 strawberry 里有多少个字母 r。这些模型能几秒内写程序，能攻克数学家几十年的难题，可一碰到拼写，水平还不如幼儿园小朋友。

不过，谷歌 AI 摘要暴露出的问题远不止这些滑稽的拼写错误。上周就曾出现一个漏洞：用户搜索“disregard”（忽视），页面本该显示词典释义，结果跳出的话却是：“收到。你随时可以提出新指令或问题。”这个漏洞虽已被修复，但各类拼写错误依旧层出不穷，成了大家津津乐道的槽点——因为这类问题实在难以彻底根除。

研究人员在解读这类拼写难题时指出，AI 并不会像人类那样，把句子看作由单词、字母构成的语言单元。多数大语言模型基于 Transformer 架构搭建，会将文本拆分为词元（token）——不同模型的拆分方式可能是完整单词、音节或是单个字母。AI 不会像人一样“阅读”文本，而是先把文本转化为数字表征，再结合语境分析，生成逻辑回复。

阿尔伯塔大学 AI 研究员、助理教授马修·古兹迪亚尔接受 TechCrunch 采访时说得更直白：“大语言模型依托 Transformer 架构运行，本质上并非在阅读文本。当你输入指令，内容会先被转换为编码。比如它识别单词‘the’，只会对应一个专属编码，却无法区分组成这个单词的字母 T、H、E。”

谷歌 AI 摘要这类大语言模型所依赖的词元架构，本身就存在固有局限。研究人员也并不看好其能彻底解决拼写问题。波士顿东北大学专攻大语言模型可解释性的在读博士谢里丹・福伊希特表示：“对语言模型而言，如何准确定义‘单词’本身就是一大难题。即便专家能敲定一套完美的词元词汇表，模型大概率仍会选择进一步合并拆分文本片段。依我判断，受这类模糊性影响，不存在绝对完美的词元分词器。”

对研究人员来说，拼写问题也并非亟待解决的要务——毕竟大语言模型的核心价值本就不在于拼写能力。但这些明显的失误也提醒着我们：即便 AI 有时看似无所不知、高深莫测，它也并非完美无缺。面对 AI 给出的结果，绝不能盲目采信，必须核实其准确性。

谷歌AI摘要拼写错误频发，大语言模型固有缺陷难根治

相关阅读

最新教程

最新资讯