AI自进化新突破!Meta华人研究改写Agent法则
以往,智能体(Agent)的竞争焦点在于“谁能更高效地完成指定任务”。如今,风向骤变——比拼的核心转向“谁能更自如地实现自我进化”。最新研究暗示,AI或许已经触及“自我进化引擎”的临界点。
这项来自Meta的研究,由华人学者Jenny Zhang在实习期间主导,联合Meta AI、英属哥伦比亚大学(UBC)及纽约大学等机构的研究者共同完成。他们提出了一种名为“HyperAgents”(DGM-H)的全新智能体框架。
这项工作的核心,并非制造一个更擅长具体任务的Agent。它瞄准了更高维度的命题:既然AI已能自主调整任务解决的方法,那它能否连“未来如何调整自身”这套元规则一并优化?
论文给出的答案是肯定的。更重要的是,这已不再是理论推演,而是经过实验验证的系统能力。
HyperAgents的关键突破,在于将“执行任务的智能体”与“负责改进智能体的元智能体”融合进同一个可编辑的程序,作者称之为“超级智能体”(hyperagent)。
在新框架下,系统不仅会修改任务求解逻辑,甚至开始修改未来生成改进方案的机制本身。论文将这种能力命名为“元认知自我修改”。
这标志着一个潜在的范式迁移:过去的竞争是“谁的Agent更会干活”,而HyperAgents指向的下一阶段,则可能是“谁的Agent更会变强,并且越来越精通如何变强”。
以往的“自我进化”,本质上仍是半自动化
这篇论文清晰地揭示了上一代自我进化路线的天花板。
去年的“达尔文·哥德尔机”(Darwin Gödel Machine, DGM)已足够惊艳。它能在编码任务中不断自我修改代码、验证结果,将成功版本存入档案库,并以此为基础持续迭代。数据显示,DGM在SWE-bench基准测试上性能从20.0%提升至50.0%,在Polyglot上从14.2%提升到30.7%。
但问题在于,DGM之所以在编码领域有效,是因为“评估”和“自我修改”本身也属于编码任务。代码写得越好,反过来就更擅长修改自己的代码——任务能力与自我改进能力在此场景下自然对齐。
然而,一旦离开编码领域,这种对齐关系便断裂了。例如,评审论文、设计机器人奖励函数、为国际数学奥林匹克(IMO)级别的解答打分——在这些任务上表现出色,并不等同于更擅长修改自己的元认知机制。
HyperAgents论文最核心的突破,就是直接摒弃了“任务能力与元能力必然对齐”的假设。既然两者未必天然一致,那就不要再把元层(meta-layer)的规则写死。这意味着,过去许多所谓的“自我进化”系统,本质上仍在人为设定的轨道内运行。而HyperAgents真正改变的,是改变机制本身。
HyperAgents新在哪里?
从表面看,HyperAgents似乎只是多了一个元智能体(meta agent)。但真正值得关注的是,它将任务智能体和元智能体融合进了同一个可编辑的程序。
在以往的DGM中,系统包含一个手工设计的“指令生成机制”,负责根据过往表现决定下一步如何修改。这一步本身是不可修改的,因此它反而成了整个系统进化的瓶颈。
HyperAgents的做法,是将这部分机制也纳入可修改的范围。换句话说,AI不只是修改自己的答案、工具或流程,它开始修改“自己是如何提出修改建议的”。在DGM中,上层机制基本是固定的;而在DGM-H中,元层本身也进入了可演化空间。这意味着,它是一个能够经营自身进化过程的系统。
因此,HyperAgents所做的并非简单地“增加一个Agent”,而是取消了“上层规则永远不变”这个默认前提。
自我改进能力开始跨域迁移
在编码任务中,HyperAgents在Polyglot基准上取得的提升,与原始DGM处于同一量级:在50个任务的训练子集上,得分从0.140提升至0.340;在完整测试集上,从0.084提升到0.267。这表明其性能提升并未以牺牲泛化能力为代价。
更关键的是,它的能力不局限于编码领域。在论文评审、机器人奖励函数设计等非编码任务上,系统同样能持续自我改进。
具体而言,在论文评审任务上,初始智能体在测试集得分为0.0,而DGM-H将其提升至0.710;在机器人奖励设计任务上,则从0.060提升到0.372。重要的是,这些提升不仅体现在训练任务中,也成功迁移到了预留的测试任务上。
对照实验的结果同样具有说服力:如果关闭自我改进功能,效果明显减弱;如果限制开放式探索,系统也难以取得有意义的进展;而原始的DGM框架直接移植到非编码领域几乎失效,只有经过人工定制化改造(DGM-custom)后,才恢复竞争力。
这说明HyperAgents的核心价值,不在于某个特定基准测试上多拿了几个百分点,而在于它将原本依赖编码场景对齐关系的自我改进,推进成了一个能在多样化非编码任务中运行的通用框架。
更值得关注的是其迁移能力。作者将在论文评审和机器人任务中演化出的超级智能体,迁移到奥林匹克级别的数学评分任务中。
尽管这些迁移体自身的初始评分能力接近零,但它们作为“能够生成更优智能体的元智能体”,在50轮迭代内就能将生成的最佳智能体性能推至0.630。相比之下,来自定制版DGM的迁移体几乎不具备这种能力。
这意味着,被迁移过去的不仅仅是任务经验,更核心的是“如何持续变得更好”的元能力。
它开始自主构建“基础设施”了
许多人听到“自我进化”,可能以为无非是AI自己调整提示词、优化工作流或添加几条规则。但论文中最具冲击力的展示之一是:系统开始自主地生长出内部“基础设施”。
在迭代过程中,DGM-H会自动生成性能追踪、持久记忆、评估分析和计算感知规划等模块。
论文中甚至直接给出了由系统自动生成的性能追踪器代码和持久记忆条目:它开始记录跨代指标、总结哪些代际的策略有效、诊断过度修正问题,并制定下一轮的改进计划。
这已不仅仅是简单的“日志记录”。系统开始将改进视为一个需要长期经营的过程,而非一次次孤立的修补。它不仅记录每一代的分数,还会比较趋势、识别性能回退,并将跨代的经验沉淀到持久记忆中。
正如一些观察者所指出的,让这一切成为现实的关键,恰恰是“持久记忆”的自主出现。
论文展示的记忆示例中写道:某一代评审员准确率更高但过于严苛;另一代表现更平衡;下一轮的目标是融合两者的优点。
没有这层记忆,智能体往往只会反复“重新发明轮子”;有了它,过去数代的有效经验才第一次能够真正沉淀为下一轮改进的起点。这标志着智能体正从“输出一个结果”,走向“维护一个持续优化的系统”。
这不是AGI宣言,但旧规则确实在失效
当然,必须明确指出,这篇论文并未证明“无限自我进化的AI”已经降临。作者在文中也清晰地阐述了限制:所有实验均在沙箱环境、资源限制和人工监督下完成;外层循环(如任务分布、父代选择策略、评估协议等)仍有不少部分未开放给系统自改;真正无界的开放式自我改进,仍然遥不可及。
然而,风险预警的信号已经出现。一旦AI开始修改自身的改进机制,相关的安全讨论就变得至关重要。论文也专门设立了章节讨论风险:随着系统越来越擅长开放式地自我修改,其演化速度可能超越人类的审计和理解能力。今天依靠沙箱和人工监控或许还能管控,明天则未必。
HyperAgents代表了一种新的技术路线,它可能会重塑智能体领域的竞争格局。未来的比拼可能不再只是谁会调优模型、谁会设计工作流、谁会做出更强的单点工具,而是谁能将“改进能力”本身产品化、系统化并实现跨域迁移。
这将深刻影响AI公司的竞争壁垒。真正的护城河,可能不再仅仅是参数规模、算力或数据,而在于是否拥有一套能够跨任务累积经验、跨运行周期持续自我优化的改进系统。
同时,这也将改变开发者的角色定位。开发者不再仅仅是编写功能的人,而更像是在为AI设计可以继续自我设计的边界条件。
最重要的一点在于,它动摇了AI行业过去一条默认的规则:系统可以变得更强,但变强的方法必须由人类来定义。现在,这条规则开始松动了。








