2024新知探索指南:张宁豫的深度思考与前沿洞察
在人工智能飞速迭代的浪潮中,有一项基础研究虽不常占据头条,却支撑着技术向纵深突破——它探索知识如何被表征、组织与持续演化,更关乎机器如何在动态世界中获得真正的理解与学习能力。浙江大学副教授张宁豫的学术路径,清晰地映射了这条演进主线:从知识图谱的工程构建,迈向大模型时代的认知机理探索;从静态的知识增强,发展到动态的持续学习与演化。他的研究始终锚定一个核心命题:机器如何能像人类一样,系统性地获取、积累并更新知识,从而形成稳定、可靠且可进化的认知体系,以应对真实世界的复杂挑战。
▲张宁豫
知识工程:在表达与结构之间
人类认知世界,语言是核心载体。自然语言承载经验,数学语言刻画规律,而人工智能的关键目标之一,便是让机器理解并运用这些“语言”。纵观技术演进,知识工程始终是AI发展的一条深层脉络:从早期专家系统僵化的“If-Then”规则,到知识图谱中明确的结构化三元组,再到大模型内部庞大而隐晦的分布式知识表示。知识形态持续演变,但那个根本性挑战依然存在:如何让机器更“懂”世界?
正是在此背景下,张宁豫投身于自然语言处理与知识图谱研究。博士阶段,他的工作聚焦于从海量文本中抽离出结构化信息,将非结构化叙述转化为实体与关系网络。这一过程,本质上是为知识绘制一张可计算、可推理的“认知地图”。“给你一本书,抽取其中的结构化信息,就是在构建知识图谱。”他如此概括。这不仅是技术实现,更是对知识表达方式的重构与深度思考。
毕业后,他的轨迹横跨学界与业界。在之江实验室,他从国家战略需求的宏观视角,重新审视技术的价值与边界;在阿里巴巴的工业实践中,他深度参与了知识图谱在搜索等核心场景的落地,真切体会一项技术从理论走向应用所必经的路径与挑战。最终,他选择回归浙江大学,在一个鼓励自由探索的科研环境中继续深耕。对他而言,保持对未知的好奇与兴奋,是研究走向深入的关键动力。“探索未知、享受新知,这就是我的理想,也是我的行动准则。”这句话背后,是一种纯粹的科研驱动力。
大模型时代:从“会表达”到“真理解”
大模型的崛起将AI推至新高度,但一个关键问题随之凸显:流畅的文本生成,是否等同于真正的知识理解?围绕这一核心差异,张宁豫逐步构建起一套以“知识”为轴心的研究体系,并从多个维度展开系统性探索。
▲2024年5月国际计算语言学大会(COLING 2024),张宁豫组织大模型知识编辑讲习报告
一方面,在知识增强方向,他的团队致力于将知识图谱等结构化信息“注入”大模型。通过构建如KnowAgent等技术框架,让模型学会有效调用外部知识库,从而在医疗、法律等专业领域,显著提升回答的准确性与可信度。这绝非简单信息堆叠,而是追求知识与模型能力的深度协同,旨在让模型逐步形成清晰的知识边界与可追溯的推理链。
另一方面,研究深入至模型“黑箱”内部。团队从表示学习层面,系统分析知识在参数空间中如何被编码、存储与调用,并提出“知识回路”等新视角来阐释这一过程。在此基础上,知识编辑成为重点研究方向——如何像进行“微创手术”一般,精准修正模型中的特定知识(例如更新某个事实),同时最大限度保留其其他能力?这项研究的目标,正是推动大模型从一个“难以捉摸的黑箱”,演进为一个“可理解、可干预”的智能系统。
如何理解这项工作的价值?可以做一个类比:驾驶一辆高性能跑车,转动方向盘即可改变方向。但若要调整发动机性能,例如提升高速燃油经济性,就必须打开引擎盖进行精密调校。当前大模型正面临类似困境:我们期望它能稳定、精准地执行指令,却又无法依赖“推倒重来”式的全量训练。那么,能否在不“伤筋动骨”的前提下,实现对模型行为的精细调控?这正是知识增强与知识编辑研究力图攻克的核心难题。
从外部知识增强,到内部机理剖析,再到精准知识编辑,这一系列工作环环相扣,共同指向一个目标:构建具备稳定性、可解释性与可控性的知识型智能体。同时,通过组织国际研讨会与学术讲习班,张宁豫也在积极推动相关领域的学术交流与社区生态建设。
面向现实:从方法体系到应用落地
当一套研究方法趋于成熟,其价值自然向具体应用场景延伸。响应国家海洋强国战略,张宁豫团队将知识增强大模型技术体系应用于海洋领域,研发了OceanGPT·沧渊。这项工作远不止于训练一个垂直领域模型,而是结合了专业的海洋知识、多模态数据与实际业务需求,系统性地探索了大模型在重大战略场景中落地应用的可行路径。
此外,团队持续投身开源生态建设。他们积极参与并推动中文开放知识图谱社区OpenKG的发展,整合知识资源与工具链,并探索SkillNet等技能图谱网络,促进知识与技术的开放共享与协同创新。这些努力从不同层面汇聚于同一愿景:构建更加系统化、开放的知识基础设施,让科研成果不仅停留于论文,更能持续滋养更广阔的学术与产业土壤。值得一提的是,张宁豫本人已多次入选斯坦福大学发布的全球前2%顶尖科学家榜单,其培养的多位学生也先后入选了多项国家级及省部级青年人才支持计划。
▲2024年8月,在国际人工智能联合会议(IJCAI 2024)上,张宁豫(右六)组织并主持OpenKG知识增强大模型专题研讨会
谈及科研心得,张宁豫总结了几个关键点:“首先,科研需要传承与体系。我的导师陈华钧教授是引领我进入自然语言处理领域的人,他的影响至关重要。其次,要敢于思考那些有深度、值得长期探索的科学问题。它们眼下或许看不到直接应用,但未来必定会发光发热。研究者需要有前瞻性,提前布局,然后大胆创新。第三,坚持将我们的研究和算法开源开放,让学术同行和工业界能够用起来。同时,认真对待每一个基础性问题,引导更多人关注和进入这个领域。最后,在自由探索之外,我们的工作也应当与国家战略同频共振,比如OceanGPT·沧渊,就是一次将前沿研究与国家需求相结合的实践。”
当然,在人工智能为社会注入强大驱动力的同时,其可靠性与安全性也日益成为公众关注的焦点,这也是张宁豫持续关注的方向。“大模型同样存在‘副作用’,”他指出,“我们需要从机理上高效、精准地理解并控制它,从根本上防范潜在风险,让人工智能的发展更加安全、可控。”
科研、教学、学术交流……忙碌是张宁豫的工作常态。但他觉得自己是幸运的,能在最好的年华投身于最热爱的事业。这份幸运,既源于时代发展的馈赠,也离不开迷茫时的坚持与笃定。对他而言,真正的幸运并非名利,而是一种更深层的价值实现:“作为一名科研工作者,唯有将个人所幸,与国之所需、民之所向紧密结合起来,才能不负这个时代,也不负自己的人生。”