北京大学AI研究揭秘：新知识为何难以应用？记忆与思考的存储机制解析

2026-05-12阅读 0热度 0

北京大学

AI系统常陷入一种“知识消化不良”的困境：它能准确无误地记住新信息，但在需要调用这些信息解决实际问题时，却表现得像个理论家，缺乏将知识转化为有效行动的能力。近期，北京大学人工智能研究院与元培学院的研究团队在2026年1月发表的一项研究中，为这一核心挑战提供了关键性的神经机制解释。他们发现，在AI的神经网络内部，知识的表征与技能的编码存储于彼此正交的参数子空间中——这种功能分离与人脑的记忆与执行中枢分工机制存在深刻的相似性。

理解这一发现，需要区分“知道什么”与“知道如何做”。记住一份菜谱的配料与步骤是知识，而在厨房中精准掌控火候、协调工序则是技能。当前AI的瓶颈在于，其监督学习模块能高效编码前者，但缺乏将编码信息转化为流畅决策与行动的后端机制。

研究团队从计算神经科学的角度切入，揭示了问题根源。他们通过数学建模证实，在神经网络的高维参数空间中，由监督学习驱动的知识更新向量，与由强化学习驱动的技能优化向量，呈现出近乎正交的关系。这意味着，AI的“记忆库”与“操作中心”在物理层面就是解耦的。

这一根本性洞见直接催生了一项名为“参数化技能转移框架”的创新技术。其逻辑清晰而有力：既然知识与技能存在于不同的参数“分区”，那么就可以从一个已训练模型中，纯化并提取出通用的“技能向量”，然后将其无缝集成到另一个仅学习了新知识的模型中。这相当于将一位资深工程师的“问题解决直觉”与“调试手感”，直接赋能给一位刚读完技术手册的新手。

一、AI学习的双重困境：为什么机器人学会了却不会用

现代AI系统普遍面临“知识截止”的挑战：模型拥有庞大的事实性知识储备，但在需要推理、规划与执行的复杂任务中，其表现往往与知识量不成正比。

主流解决方案依赖监督微调，这种方法侧重于增强模型对知识的记忆与复现能力，但无助于提升其灵活应用与策略性思考的水平。结果是，AI能背诵物理定律，却无法在具体工程场景中选择并运用合适的公式。

强化学习通过试错来磨练技能，能有效提升任务执行能力，但其训练过程数据效率低下、计算成本高昂。每面对一个新任务，模型几乎都需要从头开始探索，这在现实应用中难以规模化。

该团队的研究精确指出了困境的本质：知识获取与技能掌握在AI系统内部本就是两条并行的处理路径。监督学习将知识刻录在特定的神经连接模式中，而解决问题所需的策略性“手感”，则需通过强化学习在另一套参数回路中独立锻造。两者在参数更新方向上的正交性，为打破“学用脱节”提供了全新的理论杠杆。

二、神经网络中的“左右脑分工”：知识与技能的神奇分离

深入AI的“大脑”内部，一个结构清晰的图景得以展现。团队通过严格的数学分析与实验验证，证实了知识与技能学习在参数空间中的变化轨迹是相互垂直的。

为验证这一假设，研究人员设计了一项对照实验。他们让模型先在长文档理解任务中进行监督学习以记忆知识，随后通过强化学习优化其问答技能。分析两个阶段网络权重变化的余弦相似度，结果趋近于零。这提供了确凿证据，表明知识与技能活跃于彼此独立的参数子空间。

这种“参数正交性”具有重要的功能意义。它意味着模型可以并行地进行知识扩展与技能升级，而两者不会相互干扰或产生冲突。进一步的对照实验显示，两次独立知识学习之间的参数变化相似度，显著高于任何一次知识学习与技能训练之间的相似度。这排除了高维空间中的随机性，证实了这是一种具有明确功能意义的模块化特性。

从信息处理角度看，这种正交性确保了信号流的纯净。知识更新与技能更新在网络激活层产生的信号模式也能保持分离，如同交响乐中不同乐器组的声波，只要频率基底不同，便能清晰分辨、和谐共处。

三、技能转移的奇妙旅程：从一个AI到另一个AI的知识传递

基于上述发现，团队构建了一套高效的技能转移系统。其过程，类似于将一位专家的“隐性经验”封装并传递给新手。

流程分为两个核心阶段。第一阶段是“源领域技能萃取”：让模型在某个成熟领域（如编程）同时进行知识学习与技能训练。随后，通过计算从训练后的总参数中，减去仅经过知识学习的参数，从而分离出一个纯净的“技能向量”。这个过程提炼了专家模型中关于“如何有效操作”的通用策略。

第二阶段是“目标领域技能灌注”：当模型需要适应新领域（如学习一门新编程语言）时，先让其通过监督学习掌握该领域的基础知识。之后，直接将此前萃取的“技能向量”叠加到其网络参数上。模型便即刻获得了运用新知识执行任务的核心能力。

为确保技能向量的鲁棒性与泛化性，团队采用了迭代优化策略，将源数据分批处理进行多次技能提取，最终得到一个去除了任务特异性、保留了通用操作逻辑的技能核心。该方法之所以高效，正是因为它精准利用了参数空间的正交性，使得“技能移植”手术不会扰动或覆盖模型已有的“知识记忆”。

四、实验验证：从阅读理解到智能助手的全面测试

这套方法的实际效能经过了多维度、高难度的基准测试。

在闭卷文档问答任务中，模型需先记忆文档内容再回答问题。采用技能转移方法的模型取得了56.9%的准确率，相比仅进行知识学习的基线模型提升了17.2个百分点，同时也超越了同期其他先进方法。

在长文本理解测试中，面对平均长度超过2.1万词的综合文档，技能转移方法将模型的准确率从基线30.1%提升至38.1%，实现了8个百分点的性能跃升。这证明该方法能有效增强AI处理海量信息并进行复杂推理的能力。

最具说服力的是智能工具调用测试。模型先在电影推荐领域学习使用API工具的“技能”，随后被要求将这一技能迁移到广告、金融、数据库查询等20个全新领域。结果显示，技能转移方法的平均任务成功率达到32.2%，较基线方法（21.9%）提升了超过10个百分点。在一些基线方法完全失败的领域（如广告服务定制），该方法甚至实现了从0到16.7%的突破性性能，充分证明了其卓越的跨领域泛化能力。

五、深入机制：为什么这种方法如此有效

其成功建立在三个坚实的理论支柱之上。

首先是参数空间的几何结构。研究证实，知识学习与技能训练在神经网络的高维流形中，确实沿着近似正交的方向演化。这种内在的结构化分离是方法可行的物理基础。

其次是激活空间的信号独立性。理论推导证明，当参数更新方向正交时，其在网络各层激活中引发的信号变化也近乎不相关。这保证了知识流与技能流在信息传递过程中互不干扰，实现了干净的技能迁移。

第三，这种分离具有明确的功能性导向，而非高维空间的统计巧合。对照实验表明，同类学习任务（如两次知识学习）间的参数变化模式高度相似，而异类学习任务（如知识学习与技能训练）间则差异显著，这证实了神经网络为不同功能演化出了模块化的内部表征。

这些发现也挑战了“AI是黑箱”的简化观点，揭示了其内部表示具有意料之外的结构化与可解释性。

六、技术创新的三重突破：从理论到实践的完整闭环

此项研究在三个层面实现了系统性突破。

第一是理论认知突破：首次在AI系统中明确区分并实验验证了知识表征与技能编码的物理分离，将学习过程的理解从“混合模型”推进到“分层架构”。

第二是工程方法突破：实现了技能的模块化封装与无损移植。创造出的“技能向量”如同可即插即用的“能力芯片”，极大促进了AI核心能力的复用与灵活组合，显著降低了重复训练的成本。

第三是应用能力突破：大幅提升了AI的跨域适应与泛化能力。通过将通用的问题解决策略与具体的领域知识解耦，AI获得了一种“元技能”，能够更快地将已有经验迁移到陌生场景。

此外，团队在实现细节上的优化，如迭代提取策略与精细的超参数调节，也保证了方法的稳定性与可扩展性，为其持续演进奠定了基础。

七、实用价值与未来展望：改变AI应用的游戏规则

这项研究的产业应用前景明确。它为AI落地中“适配成本高、部署周期长”的痛点提供了新颖的解决方案。企业将AI应用于新业务线时，无需从零开始进行昂贵的端到端训练，只需为目标模型注入预训练的通用技能向量，即可快速获得具备实战能力的模型，大幅压缩开发周期与计算资源消耗。

展望未来，几个方向极具潜力：一是推动技能向量的标准化与开源共享生态建设，类似模型参数的“应用商店”；二是探索多技能向量的有机融合与组合，以构建具备复合能力的AI智能体；三是借此深化对神经网络可解释性与可控性的理解，推动开发更可靠、更安全的下一代AI系统。

当然，当前方法也存在局限，例如技能向量的缩放系数仍需人工调试，已验证的模型架构范围也有待拓宽。未来的研究需要向更自动化、更普适的方向演进。

从根本上说，这项研究的核心价值在于重塑了我们对AI学习范式的理解。它揭示出，AI的内部世界并非均质混沌，而是存在着精密的、功能特异化的分区。这不仅为当前的技术瓶颈提供了巧妙的工程解法，更为未来设计更高效、更灵活、更具通用性的智能系统，奠定了一块坚实的理论基石。对终端用户而言，这意味着未来的AI助手将更深刻地理解意图，更娴熟地将知识转化为解决实际问题的行动力。

Q&A

Q1：参数化技能转移框架PaST具体是怎么工作的？

A：PaST框架的工作流程分为“技能萃取”与“技能灌注”两步。首先，让一个源模型在特定任务上完成全流程训练（知识+技能），通过数学计算分离出纯技能成分，形成“技能向量”。随后，当目标模型学习了新领域的知识后，直接将该技能向量叠加到其网络参数上，使其立即获得应用新知识执行任务的核心操作能力。

Q2：为什么AI学会新知识后不会灵活运用？

A：根本原因在于AI神经网络内部的功能模块化。负责存储事实性知识的参数区域，与负责规划、决策与执行的技能参数区域，在数学空间中是相对独立甚至正交的。监督学习优化的“知识参数”与强化学习优化的“技能参数”更新方向不同，导致知识记忆与调用应用之间存在结构性“断层”。

Q3：这种技能转移方法在实际应用中效果如何？

A：实验验证效果显著。在闭卷文档问答任务中，该方法将模型准确率提升至56.9%，大幅超越基线。在跨领域工具调用测试中，AI能够将在电影领域习得的API调用技能，成功迁移到广告、金融等20个差异显著的领域，平均成功率提升超过10个百分点，在部分领域甚至实现了从零到有的突破，展现了强大的跨任务泛化能力。