机器学习之父MichaelJordan:AGI炒作,AI经济学成新战场
若今日请人列举AI领域最具影响力的学者,多数人或许会首先提及Geoffrey Hinton、Yann LeCun,或更年轻一代的Ilya Sutskever。
相比之下,Michael I. Jordan一直是个颇为独特的存在。
《科学》杂志曾将他评为“最具影响力的计算机科学家”。在机器学习领域,他是概率图模型、变分推断及贝叶斯机器学习等核心方向的关键奠基人之一。此外,他培养的弟子包括吴恩达(Andrew Ng)、Zoubin Ghahramani、Yoshua Bengio等后来影响整个行业的人物。如今被视为机器学习基础设施的诸多理论框架,都能追溯到他与同时代研究者在上世纪九十年代建立的基础工作。
然而,这位机器学习领域的重量级人物,却很少将自己称为AI研究者。在近期接受Machine Learning Street Talk(MLST)采访时,Jordan甚至直言:“我从未认为自己是在做AI。”这并非自谦,而是他从一开始关注的问题便与当今主流AI圈存在本质差异。
过去数十年间,机器学习大致形成了两条重要技术路线。
一条是当下广为人知的深度学习路线,代表人物是Geoffrey Hinton、Yann LeCun和Yoshua Bengio。这条路线相信,只要模型规模足够大、数据量足够多、算力足够强,系统便会不断涌现出新的能力。从AlexNet到GPT,再到如今的大模型热潮,本质上都延续这套逻辑。
另一条则是Michael Jordan代表的统计机器学习路线。这条路线更关注不确定性、统计推断与决策问题。与其追问机器是否具备智能,他们更关心:在信息永远不完备的现实世界中,一个系统如何做出可靠的判断。
Jordan最初学习认知科学,后转向统计学,再进入计算机科学。相比于“机器是否会思考”,他更习惯提出的问题是:预测是否准确?误差范围多大?系统是否可靠?近年来,他的研究兴趣进一步转向经济学与机器学习的交叉领域。
本次采访围绕他去年发布在arXiv上的论文《AI的集体主义经济学视角》(A Collectivist Economic Perspective on AI)展开。该论文的核心主张是:当前的AI技术应当是“集体性”的,因为它建立在数十亿人的数据之上,也旨在服务数十亿人。但目前,围绕它的思考方式几乎完全停留在“如何让单个模型变得更强”的层面。
Jordan认为这远不够。一旦这些系统进入真实世界,它们就不再仅仅是一个模型能力问题,而会转变成关于数据流动、利益分配、激励设计和社会协作的系统性挑战。
在一个多小时的对话里,Jordan围绕论文的核心主张展开论述:AI的真正挑战不在于让模型变得更强大,而在于让系统学会协调。为此,他从优化与均衡的区别、不确定性的本质、模型可靠性等多个角度,阐释了为什么机器学习必须与经济学融合。同时,他也谈及了对AGI炒作的批评,以及对年轻研究者处境的担忧。
以下是几个核心论点的深入展开。
AGI是炒作,且正在危害年轻人
采访伊始,Jordan对AGI的态度便毫不留情。他直接将AGI称为一个“公关术语”(PR term),是炒作与空话。
在他看来,如今许多人对AI的理解建立在一段历史错觉之上。人们仿佛觉得AI是近几年才突然出现的。但事实上,在语言模型成为主角之前,机器学习已在真实世界运行了数十年。
自上世纪六七十年代起,决策树、逻辑回归、最近邻方法、隐马尔可夫模型等技术已在统计学、运筹学和工业界被广泛采用。供应链、交通系统、金融平台和电子商务背后,都有大量机器学习模型在持续运转。
Jordan回忆,自己在2000年左右访问亚马逊时,公司已在利用大规模数据预测货运延误、优化库存与供应链管理。后来支撑整个互联网产业的云计算基础设施,很大程度上正是为满足这些机器学习工作负载而发展起来的。
这些系统不会聊天,也不会写诗,因此很少出现在公众视野里,但它们一直在创造真实价值。
直到训练数据变成了语言数据,模型开始生成流畅的人类语言,人们忽然觉得那个古老的“人工智能梦想”似乎被实现了。于是“AI”重新成为最热门的词汇,甚至进一步衍生出“AGI”。Jordan认为,这种叙事正在扭曲整个行业对技术方向与商业模式的判断。
更令他担忧的是,这种叙事正在影响那些对技术抱有热情的年轻人。这也是整场采访中他最激动的部分。在他看来,那些频繁出现在播客和公共场合的AI思想领袖,传递出的往往只有两种情绪:要么极度亢奋——“超级智能马上就要来了”“智能已经开始理解人类了”;要么极度悲观——“AI很可能毁灭人类”。二十来岁的年轻人看着这些声音,仿佛只剩两个选择:跟着亢奋,或者跟着恐慌。
但现实远没有那么戏剧化。Jordan觉得,许多年轻研究者真正想做的事情其实很简单:利用技术创造一些东西,改善生活,帮助家人,解决具体问题。但他们不断接收到的信息却是:算法已被开发殆尽,未来属于少数巨头;或者超级智能即将到来,人类很快会失去意义。
他还把批评进一步指向AI产业背后的收益分配问题。在他看来,梯度下降、互联网数据基础设施、大规模分布式计算——这些关键基础设施都是前一代研究者和工程师花费二三十年建立起来的。而今天那些最受瞩目的AI公司,以Elon Musk和Sam Altman为代表,很大程度上是在这些既有成果之上“窃取”数据、训练模型、扩大规模。这当然需要巨大的工程能力和资源投入,但他并不愿意将全部功劳归于他们。
更让他不满的是,支撑这些系统的数据创造者几乎没有获得相应回报。“这些巨头从各处收集数据,却不向原始创造者返还价值”,在他看来,这是互联网时代遗留下来的结构性问题,而当下的AI产业正在进一步放大这种失衡。
从优化到均衡:AI为何需要经济学
除了对现象的批评,Jordan还着重展开了他新论文中的一个核心观点:今天AI最大的局限,恰恰来自它最擅长的事——优化。
实际上,过去几十年里,机器学习取得的大部分成功,基本都源于优化。给定一个目标函数,然后不断调整参数,让误差变得越来越小。大语言模型的“预测下一个词”(next-token prediction)就是最典型的例子。
但Jordan认为,真实世界并不是这样运行的。现实中的问题往往涉及大量参与者,每个人拥有不同的信息、不同的资源和不同的目标。用户、企业、平台、监管机构,甚至不同国家之间,都存在合作与竞争关系。你无法像训练神经网络那样,为整个社会写下一个统一的目标函数,然后直接求出最优解。
在Jordan看来,“协调”才是解决真实世界问题的答案。而经济学研究的正是这种协调过程:当每个人都拥有自己的利益诉求时,一个系统如何形成稳定秩序;当信息并不透明时,人们如何建立合作;当激励机制发生变化时,整个系统又会如何演变。
这也是为什么他反复强调经济学的重要性。他认为,机器学习和经济学过去几十年几乎是平行发展的两个领域。一边拥有前所未有的数据和预测能力,却很少思考均衡、激励和市场设计;另一边长期研究这些问题,却从未拥有今天这样规模的数据和计算能力。“过去几十年里,这两个领域几乎从未相遇。”他说,“但未来,它们必须走到一起。”
为了说明这一点,Jordan举了药物监管的例子。假设一家制药公司研发了一种新药,经过内部测试后提交给监管机构审批。监管机构的职责很简单:判断这个药到底有没有效,该不该让它上市。这看起来是一个纯粹的科学问题:收集数据,做统计分析,得出结论。
但Jordan指出,这里隐藏着一个经典统计学没有考虑到的因素:提交数据的人并非中立。
制药公司有自己的利益诉求。一种药只要获批上市,哪怕疗效存疑,十亿人使用就意味着巨额利润。那么公司的激励就是尽可能多地把候选药物塞进审批流程。反正通过了就赚钱,没通过也没太大损失。如果监管机构只是把提交上来的数据当作客观样本来分析,而没有考虑到“送数据的人本身就有动机让结果看起来更好”,整个审批系统就会逐渐失效:不该上市的药被批准,该上市的好药反而被淹没。
这不是一个靠改进分析模型就能解决的问题。你需要在更上游设计一种机制,让制药公司有动力只提交自己真正有信心的药物。而不是把所有东西都丢过来碰运气。这就是经济学所说的激励机制设计。
类似的逻辑也出现在他对数据市场和平台隐私治理的分析中。在每一个案例里,表面上的技术问题背后,都藏着参与者之间的利益冲突和激励错位。如果只盯着模型本身,而忽略模型将要进入的社会系统,许多问题根本无法解决。
他尤其反对一种在硅谷非常流行的想象:仿佛只要拥有足够多的数据和足够强大的模型,就能从上往下设计出一个完美系统。“你不希望有一个站在顶端的上帝一样的人物,为所有人定义价值函数。”在他看来,现实世界的秩序从来不是被设计出来的,而是在无数参与者的互动中逐渐形成的。技术固然重要,但它始终只是这个系统的一部分。
没有人在乎模型是否真正“理解”世界
从经济学和社会系统的话题回到具体技术,Jordan又谈及一个相当重要的问题:基础模型的预测能力越来越强,但它们往往不知道自己什么时候会出错。
他用AlphaFold举了一个例子。
Jordan对AlphaFold的评价其实相当高。“我很欣赏AlphaFold。”他说,“它不像LLM(大语言模型)那样泛泛而为,而是针对一组特定问题有其专攻。”但在实际研究中,他和团队发现了一个有趣的现象:当科学家开始利用AlphaFold回答新的科学问题时,模型的局限也会随之暴露出来。
原因很简单,科学家真正感兴趣的,往往不是训练数据里最常见的现象,而是那些处于知识边缘、过去几乎没人研究过的问题。而也是在这些地方,模型最容易产生偏差。
Jordan团队曾利用AlphaFold预测的两亿个蛋白质结构去检验一个生物学假设。结果发现,模型给出的答案看起来非常确定,但与真实实验结果之间却存在明显偏差。问题不在于AlphaFold整体表现不好,而在于模型并不会主动告诉研究者:在这个具体问题上,我其实没有那么可靠。
“它不会给你误差棒(error bar,即误差范围)。”Jordan说。
在他看来,这才是基础模型进入科学研究后最值得关注的问题。人们总在讨论模型是否足够强大,却很少讨论模型何时值得相信、何时应该保持怀疑。围绕AI偏差的讨论也常常走向两个极端:要么认为数据足够多以后偏差自然会消失;要么只是批评模型架构和输出结果。但真正重要的问题是,如何建立一套科学方法,在模型不可避免存在偏差的情况下,依然得到可靠结论。
这也引出了采访中的另一个话题:我们到底该不该说AI“理解”(understand)了什么?主持人提到,他此前采访AlphaFold创造者John Jumper时,对方甚至对“理解”这个词十分反感。
Jordan完全认同这种态度。在他看来,许多关于“理解”“智能”的争论,本质上更像媒体叙事,而不是工程问题。真正重要的不是模型是否拥有某种拟人化的理解能力,而是它能否持续产生有价值的预测。
他举了一个自己很熟悉的例子。早在二十多年前,亚马逊就已经开始利用机器学习优化全球供应链,预测货船是否会延误、零部件是否能够按时到达。整个系统每天影响数亿用户,没有任何人能够完全解释内部发生的一切。
“你会问这个系统理解运输和物流吗?”Jordan说,“其实根本没人在乎”。
在他看来,一个系统能够降低不确定性、帮助人们规划和决策,这本身就已经足够有价值。执着于判断它是否真正“理解”世界,反而容易把讨论带偏。
相比研究模型内部是否形成了某种神秘的认知结构,他更关心另一件事:如何围绕模型建立配套系统,让它变得更加可靠、透明和可用。
例如,一个人申请贷款被拒绝后,真正需要的并不是看到神经网络内部某个节点的激活情况,而是知道哪些因素影响了结果,以及自己未来可以做些什么来改变结果。换句话说,用户需要的是能够指导行动的解释,而不是模型内部机制的显微镜照片。
不确定性不是敌人
但当模型无法确定答案时,我们应该如何理解这种不确定性?
Jordan对这个问题的兴趣,远不止于给模型增加一个误差棒或置信区间。在他看来,今天许多AI讨论默认把不确定性视为一种缺陷,仿佛技术进步的方向就是不断消灭它。但还是那个论断:真实世界不是这样的。
为了说明这一点,他讲了一个关于鸭子的小故事。
假设一群鸭子生活在湖边。经过长期觅食,它们知道湖的左侧大约有三分之二的食物,右侧则有三分之一。如果按照经典的优化思维,一个理性的决策者应该每天都去左边,因为那里期望收益更高。
但真实世界里的鸭子不会这样做。它们大约会以三分之二的概率飞向左边,以三分之一的概率飞向右边。
原因很简单:鸭子并不是独自行动的。如果所有鸭子都冲向左侧,资源竞争会迅速加剧,原本看似最优的选择反而不再最优。每只鸭子按照食物分布的概率来分配自己的行动,最终形成了一种稳定状态:没有任何一只鸭子能够通过单方面改变策略而获得更好的结果。
用经济学的术语来说,这是一种纳什均衡(Nash equilibrium)。在这里,不确定性不是需要消除的噪声,而是维持整个系统稳定运行的一部分。
沿着这个思路,Jordan进一步把现实世界中的不确定性分成了三类。
第一类是统计学家最熟悉的抽样不确定性。数据有限,因此预测总会存在误差。增加样本量、改善测量方法,能够逐步缩小这种不确定性。
第二类来自信息不对称。现实中的参与者掌握的信息并不相同,而且未必愿意完全公开。你的合作方可能隐瞒了部分信息,甚至可能撒一点谎。这种不确定性无法通过增加样本量来消除,它属于博弈的一部分。
第三类则是他特别强调的“来源”(provenance)。数据来自哪里?是在什么时间、什么环境下产生的?Jordan举例说,如果一项医疗手术的成功率数据来自十年前,那么即使统计意义上的置信区间看起来很窄,人们依然应该保持额外谨慎,因为医疗设备、医生经验和患者群体都可能已经发生了变化。
在人类社会中,我们几乎是本能地整合着这三种不确定性。但当前的大型语言模型并没有真正理解它们。当用户问模型“你有多确定”时,模型并不是在进行严格的不确定性推理。Jordan认为,它做的事情更像是:在训练数据中,曾经有人在网上问过某个人“你对你刚写的那个方程有多确定”,然后那个人说了一些话。模型只是在模仿那类回答的表达方式。“那不是在不确定性下推理,”他说。
而在更宏观的层面上,市场本身就是一种管理不确定性的机制。一家披萨店需要稳定的番茄供应。如果老板每天都必须亲自去寻找番茄,那么他永远无法确定晚上是否还能卖出披萨。但因为存在市场,有人种植、有人运输、有人储销,原本属于个体的不确定性被分散到了整个系统之中。市场降低不确定性,靠的不是某个人设计出了完美方案,而是无数参与者在激励机制下持续探索和试错。用机器学习的话来说,就是兼顾了"探索"与"利用"。
超级智能之外,还有另一条路
采访接近尾声时,Jordan的语气明显变得轻松了一些。与外界印象不同,他并不是一个悲观主义者。恰恰相反,他反复强调自己对AI的未来持乐观态度。只是这种乐观与“超级智能即将到来”的想象无关。
在他看来,人类社会真正面临的问题从来不是智力不足。过去几千年里,人们发动战争,往往不是因为不会思考,而是因为误解了彼此的意图;人们做出糟糕的决策,往往不是因为缺乏能力,而是因为掌握的信息有限;许多社会问题之所以长期存在,也不是因为没有聪明人,而是因为参与者太多、利益太复杂,难以形成有效协调。
因此,AI最值得期待的用途,未必是创造一种远超人类的智能。更重要的是帮助信息更好地流动,帮助人们理解彼此,帮助个人和组织在关键时刻做出原本想做、却因为看不见全貌而没能做出的更好决策。
对于当下流行的“超级智能”与“人类灭绝”两极叙事,Jordan显然有些不耐烦。“这不是仅有的两个选项。”他说。“在人类尺度上,还有大量非常积极的事情可以做。”
事实上,在过去几年里,Jordan一直在尝试为这种思路寻找一个更系统的框架。在他的论文中,曾画过一个三角形。三个顶点分别代表三种不同的思维方式:计算思维(computational thinking)、推断思维(inferential thinking)和经济思维(economic thinking)。
计算思维关注算法与优化;推断思维关注不确定性、误差与证据;经济思维则关注激励机制、多方参与者以及复杂系统中的协调问题。
在他看来,未来最重要的工作恰恰发生在这三者的交汇处。我们需要一个懂计算、懂统计、懂经济的下一代。
他把这种跨学科训练称为“这个时代的博雅教育”。不过他随即也坦率地说,自己的人文学科同事或许不会同意,他们会认为核心仍然是人文学科。
“但我不认为人文学科正在触及这个时代真正的核心智识问题,”Jordan说,在他看来,如今,数据、预测和社会系统之间的关系已经成为最紧迫的智识挑战,我们需要把统计、经济和计算这些元素放到位,才能确保这些技术以对社会负责任的方式被思考。



