AI智能体问责缺失的深层危机:OpenClaw事件警示

2026-06-13阅读 0热度 0
OpenClaw

先说几个核心判断:AI编程智能体的自主权正在快速膨胀,但整个生态里还没有人真正为这些智能体生成的东西负责。上周的OpenClaw事件就是一面镜子——不是照出技术问题,而是照出了一个正在快速加深的信任裂缝。

OpenClaw事件揭示AI智能体问责机制缺失的深层危机

故事是这样的。极简智能体NanoClaw的开发者加夫列尔·科恩发现,自己的代码出现在OpenClaw项目中,既没标注出处,也没人问过他本人意见。他的反应很有意思——没有提出版权投诉,没有发起拉取请求,也没有要求和解。他只是看了看这个自己无意中帮助构建的工具,判断没有人能为它的内容负责,然后公开退出了项目。大卫·伊斯特曼在The New Stack上报道了这件事,随后迅速成为各平台阅读量最高的文章,领先幅度相当惊人。

这场风波之所以引发这么大关注,是因为成千上万的开发者突然意识到一个可怕的可能性:OpenClaw是不是也在用我的代码?而这种担忧真正刺痛人的,不是代码被用了,而是没有人能说清楚谁放进去的、什么时候放的、依据什么条款放的。

更深层的问题同时浮现。据Aikido Security的调查发现,被赋予依赖项自主管理权限的AI编程智能体,正在安装一些来源不明的软件包——这些包根本没人为其负责。这不是危言耸听,而是对当前软件供应链现状的准确描述。两个事件都没有说智能体本身不好用——智能体运行完全正常,它们正在按设计初衷做事,即自主运作。但问题在于,所处的生态系统还没有决定,谁来为结果承担后果。

就连Linux之父林纳斯·托瓦兹也碰到了类似的话题。他对那种“99%的代码都是AI写的”的说法表达了强烈愤慨,这篇报道随即被广泛转载。托瓦兹反对的并非AI本身,而是一种抹去了“人在回路中”这一事实的叙事方式。他批评的趋势是真实存在的:Anthropic本周披露,其工程师目前的代码产出量是两年前的8倍,其中一名员工已经五个月没亲手写过一行代码了。

生成出来的代码,与真正意义上由人创作的代码,是两回事。署名权之所以重要,是因为它意味着有人能说清楚代码做什么、为什么存在、出问题谁来修。现在AI已经获得了自主权,问责机制必须尽快跟上。

应对之策:从不同方向出发

JetBrains做了一个有意思的选择。他们把自己的编程模型Mellum2开源了,这意味着可以在本地运行,直接对接那些出于法律合规或常识判断不能上传到第三方云端的代码库。JetBrains没有声称Mellum2在智能程度上超越了Claude,他们卖的是截然不同的东西:一个可供检查、可在自有硬件上运行、并且有明确责任归属的模型。这是将问责能力作为产品特性来呈现的做法,判断相当精准。在AI编程工具市场日益与模型实验室和超大规模云服务商深度绑定的语境下,JetBrains将自己定位为最后一家主要的独立开发工具公司。

谷歌则走向了另一个方向——将免费用户、Pro和Ultra用户从开源的Gemini CLI迁移到闭源的Antigra vity CLI。就在OpenClaw突破30万星标的几天后,谷歌同步推出了Spark,一款闭源智能体,也是对这款最受欢迎的开源智能体的直接回应。但经历了科恩事件之后,向早期采用者推销闭源智能体,恐怕比预想的要难得多。

真正的转折点:当AI开始构建自身

Anthropic本周发布了那份重要的报告,标题叫“当AI开始构建自身”。这是一份对自己自动化进程的公开总结,包含了一些令人震惊的坦诚披露。

根据报告,Claude已经完成了研究工作的前两个层级:执行任务和设计方案。第三个层级是选择研究问题,而Claude也已开始涉足。基准测试揭示的数据令人瞠目:在让模型训练代码运行得更快这项任务中,Claude仅用一年时间,便从约3倍提速跃升至约52倍。而完成同样任务,一名经验丰富的人类工程师通常需要四到八小时,才能实现4倍的提速效果。更值得注意的是,当Anthropic复盘真实研究过程中间出现失误的会话时,其最强模型在11月能以51%的概率选出比研究人员更优的下一步操作,到4月这一比例已上升至64%。判断力——曾被认为人类难以被超越的核心优势——正在逐步消解。

报告内部员工的发言读来像是一场互助会式的倾诉。有员工坦言,在心情好的日子里,“忍不住觉得自己做什么都无关紧要”;心情差的时候则感叹,“已经不知道自己最近在干什么了”。从“创作者”到“审阅者”的角色转变正在实时发生,这个过程似乎给相关从业者带来了真实的心理压力。

值得关注的是,报告称Anthropic愿意放缓甚至暂停前沿模型的研发——前提是其他实验室也同步这样做,并且能够得到切实验证。这个提议听起来难以落地。验证本身几乎无法实现,而当前有数以万亿美元计的资金正在推动AI以最快的速度发展。

这份报告指向了本周所有事件共同汇聚的同一个结论:人类很快将停止编写代码,转而专注于审阅代码,而人工审阅将成为制约AI发展速度的瓶颈。突然之间,最稀缺的资源不再是算力,而是那个能够承担责任的人类。

但问题在于,企业究竟能在多久之内容忍人类成为进步的障碍?

当然,在可预见的未来,人类必须持续参与整个流程。但这个参与方式本身将会改变。AI在代码审阅方面将持续进步,工具和防护机制也会不断完善。那些急于加速的企业会尝试将审阅环节也自动化,用智能体来检查智能体——这种方式有些时候会奏效,有些时候则不然。

真正无法被自动化的,是那个为最终结果负责的人。

这是隐藏在所有这些事件之中的职业建议:在未来几年胜出的开发者,不会是用AI生成代码最多的那些人,而是那些签名认可本身具有分量的人。智能体最先获得了自主权,而问责,仍然是人类的职责。

Q&A

Q1:OpenClaw擅自使用他人代码事件的核心问题是什么?

A:核心不在于简单的版权纠纷,而在于AI智能体生态中问责机制的系统性缺失。开发者科恩的代码被纳入OpenClaw,却没有任何人能说清楚谁放进去的、何时放入的、基于什么条款。科恩没有走法律途径,而是直接公开退出项目,原因正是他判断这个系统中根本没有可以为此负责的人。这一事件引发了大量开发者对自身代码是否同样被使用的担忧。

Q2:Anthropic报告中关于Claude自主编程的数据有多惊人?

A:根据Anthropic发布的报告,Claude目前编写的代码已超过该公司合并代码总量的80%。在让模型训练代码提速的测试中,Claude在一年内从约3倍提速跃升至约52倍,而完成同类任务,经验丰富的人类工程师通常需要四到八小时才能实现4倍提速。此外,在对真实研究失误会话进行复盘时,Claude选出更优操作步骤的准确率从11月的51%上升到4月的64%,显示其判断能力也在快速逼近人类水平。

Q3:JetBrains开源Mellum2模型的意义是什么?

A:JetBrains开源Mellum2的核心意义不在于模型性能超越Claude,而在于它提供了一种“可问责”的替代方案。Mellum2支持本地运行,可直接对接因法律合规或安全原因不能上传至第三方云端的企业级代码库。JetBrains将“可检查、可在自有硬件上部署、有人为其负责”作为产品的核心卖点,在当前AI编程工具市场日益向大型模型实验室和超大规模云服务商集中的背景下,这一定位具有重要的差异化价值。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策