人工智能理解世界的6个维度：一份深度知识构建指南

2026-05-15阅读 0热度 0

英特尔实验室

智能的终极试金石，并非知识的堆砌，而是想象力的涌现。

作者 | Gadi Singer

编译 | 王玥

编辑 | 陈彩娴

驱动我们理解世界、解释新现象并做出明智决策的底层认知结构是什么？要回答这个问题，必须建立一个能够阐明人类与人工智能如何实现深度理解与高阶认知的知识框架。

英特尔实验室副总裁兼紧急人工智能研究主任Gadi Singer近期提出了这样一个框架。他系统阐述了赋予AI更高认知能力的“知识构建”多维模型，为通往更高级的机器智能指明了一条切实路径。

英特尔实验室副总裁 Gadi Singer

核心议题在于：如何通过知识构建，帮助AI系统组织起内在的“世界观”，从而获得理解意义、事件与任务的能力。这意味着机器的认知必须超越单纯的数据处理，进化到涵盖描述性知识、世界动态模型及知识起源等多维度的复杂结构。

类比人类语言习得，我们始终区分“形式”与“意义”。形式是表达意义的表层符号，而每种形式在特定语境下承载独特含义，甚至同一形式在不同语境中含义可能截然相反。

当前机器学习的主要成就，正如Bengio与Schölkopf等人在《Towards Causal Representation Learning》论文中指出的，大多建立在对大规模、独立同分布数据的模式识别之上。系统通过吸收文本字符、声音信号、图像像素等可观测元素，建立模式与统计关联，从而在识别类任务中表现卓越。

论文地址：https://arxiv.org/pdf/2102.11107.pdf

然而，学界共识日益清晰：算法必须突破表层相关性的局限，达到真正的“理解”层面，才能实现高阶机器智能。这一根本性转变，正是“系统2”、“第三波AI”或广义AI得以实现的关键。Gadi Singer在其核心论述中强调，更高水平的机器智能需要深度的知识构建，以推动AI从表面关联迈向对世界的本质理解。

美国国防部高级研究计划局的John Launchbury曾指出，第三次AI浪潮将由抽象（如创造新意义）与推理（如规划与决策）引领。此轮浪潮的核心特征是“语境适应”，即系统能为现实世界的复杂现象构建出带有语境解释的模型。

那么，这种深度知识构建具体包含哪些维度？其中两个维度直接对应世界观：一是对世界存在事物的概念化抽象（描述性维度）；二是现实世界及其现象的动态模型。

此外，故事维度提升了人类基于共同信仰与神话来理解和交流复杂叙事的能力。语境、来源归因以及价值与优先级属于元知识维度，它们确保了知识的条件有效性及持续迭代。最后，概念参考作为结构性基础，贯穿所有维度、模态与参照系。

当这六个知识维度协同作用时，人工智能便能超越事件相关性，获得深度理解。因为这些维度背后的潜在概念具有持续性，不仅能解释和预测过去与未来的事件，还允许进行规划、干预，并考量“反事实”可能性——这正是“深度知识”一词的深层含义。

阐明机器智能所需的知识构建类型，将帮助我们找到实现它的最优路径，从而迈向更高阶的机器认知水平。

1. 支撑高阶智能的六大知识维度

对人工智能系统而言，借鉴并实施人类理解与交流中观察到的知识构建模式，能带来实质性的能力提升。当所有这些知识类型得到系统支持并有机结合时，其产生的实际价值将呈指数级增长。

图注：支撑高阶智能的知识维度。图源：Gadi Singer/英特尔实验室

1. 描述性知识：层次、分类与属性继承

描述性知识（亦称概念性、命题性或陈述性知识）负责描述事物、事件、其属性及相互关系。若采用恰当的分层类别或概念体系，深度描述性知识能极大扩展其定义范畴。这类知识可包含事实与记录系统。与特定用例及环境相关的事实信息，可作为层次化知识被组织、利用与更新。

单个AI系统使用的基础本体，可利用来自权威知识库（如OpenCyc本体或AMR命名实体类型）的、与任务相关的类和实体进行“初始化”。这种基础本体应能通过神经网络/机器学习技术进行扩展——即通过获取新知识来生成新的实体、关系和类别。

2. 世界模型

对世界现象进行建模，使AI系统能够理解情境、解释输入/事件、预测潜在未来结果并采取行动。现象模型是一种抽象/概括，可分为形式化模型和对真实世界的近似（非正式）模型。这类模型允许在特定情境下使用变量和应用实例，也支持对特定实例或更通用类别进行符号化操作。

形式化模型的例子包括逻辑、数学/代数和物理模型。相比之下，现实世界模型通常是经验性的、实验性的，有时甚至显得“混乱”，例如物理模型、心理模型和社会学模型。程序性模型（即“如何做”的知识）也属于此类。

因果模型尤其能助力AI系统实现跃升。当语境发生变化时，若能结合因果关系等知识模型，并理解控制原因的语境以及考量反事实的能力，那么历史统计数据就能有效应用于当下，从而预测未来。这些模型有助于从条件与可能因素的角度理解情境或事件。因果推理是人类思维不可或缺的组成部分，通过这种方式，我们有望实现人类级别的机器智能。

3. 故事与脚本

正如历史学家尤瓦尔·赫拉利所言，故事构成了个人与社会文化及世界观的核心部分。故事概念对于充分理解和解释人类行为与交流至关重要。故事是复杂的，在一个连贯的叙述中可能包含多个事件与各类信息。它不仅是事实与事件的集合，更蕴含了有助于发展对呈现数据之外事物的理解与概括的关键信息。

与世界模型不同，故事可被视为具有历史、参考或精神意义。故事可以代表影响人们信仰与行为的价值观与经历，例如宗教或民族故事、神话，以及在任何群体中共享的叙事。

4. 语境与来源归因

语境是围绕某个事件并为其提供自洽解释资源的框架。它可以被视为一种覆盖性的知识结构，调节着其所包含的知识。语境可以是持久性的，也可以是短暂性的。

持久语境可以是长期的（例如从西方哲学或东方哲学视角获取的知识），也可能随时间推移、根据新的学习材料而演变。持久语境不会针对每个具体任务而改变。
瞬态语境则在特定的局部语境至关重要时发挥作用。单词的含义根据其所在句子或段落的局部语境来解释。图像中感兴趣的区域，也通常在整幅图像或视频的语境中得到解析。

持久语境与瞬态语境的结合，能为知识的解释与操作提供完整的设定。

知识的另一个相关方面是数据来源（或称数据溯源），包括数据的起源、在传播过程中的演变以及随时间的流向。AI系统不能假设接收到的所有信息都是正确或可信的，尤其是在这个所谓的“后真相时代”。将信息与其来源关联起来，可能是建立可信性、可认证性与可追溯性的必要条件。

5. 价值与优先级（包括善/威胁与伦理）

知识的所有方面（例如对象、概念或程序）在整个判断谱系中都对应着价值——从最大的善到最大的恶。可以推断，人类智力的进化包含了追求回报和规避风险（例如，追求获得食物；避免成为食物）。这种风险/回报的关联与知识紧密相连。

潜在的得失具有功利价值；而对于实体或潜在的未来状态，还有一种基于伦理的价值。这种伦理价值反映了一种道德观念，即“善”并非基于潜在的有形回报或威胁，而是基于对“何为正确”的根本信念。

价值与优先级属于元知识，反映了AI系统对知识、行动与结果相关方面的主观判断。这为问责制奠定了基础，应由负责特定AI系统的人员审慎处理。当AI系统与人类互动并做出影响人类福祉的选择时，潜在的价值与优先级系统就显得尤为重要。

6. 概念参考：消除歧义，实现统一与跨模态关联

知识建立在概念之上。例如，“狗”是一个抽象概念——它在各种语言中有不同的名称，有特定的视觉特征、声音联想等。然而，无论其表现形式和用法如何，“狗”这个概念本身是独一无二的。这个概念被映射到英语单词“dog”，以及法语单词“chien”。“狗”的视觉特征可能如下图所示：

同时，“狗”也和“汪汪”的吠叫声关联了起来。

概念参考是与给定概念相关的所有事物的标识符和引用集合。它本身并不包含任何知识——知识存在于前面介绍的各个维度中。概念参考是多维知识库的关键，因为它融合了一个概念的所有表象。

维基数据是集中存储结构化数据的多维知识库的优秀范例。在维基数据中，“项”代表人类知识中的所有事物，包括主题、概念和对象。维基数据的“项”与此框架中“概念参考”的定义相似——只有一个关键区别：在维基数据中，术语“项”既指给定的标识符，也指有关该标识符的信息；而概念参考只是带有指向知识库指针的标识符。关于概念的信息则被填充在前面章节描述的各种“视图”中（例如，与概念相关的描述性或程序性知识）。

常识

常识知识由隐性信息组成，这些隐性信息是指广泛共享的、不成文的假设，人类会自动运用这些假设来理解世界。对于AI想要更深入地理解世界而言，将常识应用于情境中是必不可少的。在此框架中，常识知识被认为是上述六种知识类型的子集。

2. 理解与知识类型之间的关系

理解是智能的基石。向更高级机器智能的发展，引发了一场关于“理解”本质的讨论。约书亚·本吉奥将拥有人类理解能力的人工智能描述为具有以下特质：

理解因果关系，知晓世界如何运转；
掌握抽象行为；
能够运用以上知识进行控制、推理和规划，即使是在全新场景中；
解释已发生的事件；
进行分布外生成。

而以知识为中心的“理解”定义则是：运用丰富的知识表示创建世界观的能力；获取并解释新信息以增强这种世界观的能力；以及对现有知识与新信息进行有效推理、决策和解释的能力。

这种理解观的前提是具备以下四种功能：

拥有丰富的知识储备；
具备获取新知识的能力；
能够跨实体和关系连接知识实例；
对知识进行推理。

理解并非二元属性，而是因类型和程度而异。这一观点的核心在于知识的本质及其表征——知识结构与模型的表达能力，能够极大地促进理解与推理能力的快速发展。

想象所有的人[与机器]

正如阿尔伯特·爱因斯坦所洞察的：“智能的真正标志不是知识，而是想象力。”要实现真正的理解，机器智能必须能够超越数据、事实和故事。要重建、发现和创造可观测属性与事件背后的宇宙模型，想象力不可或缺。从AI系统的视角看，想象力通过创造性推理实现，即进行归纳、演绎或溯因推理，并产生不受以往经验和输入输出相关性严格约束的新颖结果。

知识表示与推理是AI的一个成熟领域，它处理关于世界的信息表示，使计算机系统能够解决复杂任务。知识与推理并非截然分开，而是代表了一个从已知到推断的连续光谱。机器理解将通过构建知识的能力，辅以先进的相关推理（例如，概率推理、似然推理、溯因推理、类比推理、默认推理等）来实现。

建立在深度知识基础上的神经符号AI

在使AI更有效、更负责任、更高效地为人类提供支持的过程中，我们的目标是让AI系统变得更强大，同时推动其达到更高的认知与理解水平。科学家们已在处理数据、识别模式和寻找统计相关性方面取得了巨大进展，但仍有必要思考，哪些知识类型能赋予AI系统对世界进行建模和真正理解世界的能力。

当我们对AI获得更高层次认知所需的知识结构类型有了更深的理解时，我们就可以继续在这个深度知识的基础上进行构建，使机器能够真正地理解世界。

原文链接：https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Understanding-of-and-by-Deep-Knowledge/post/1385497