AI编程革命:2026年企业代码75%由AI生成,内部30%PR实现Agent端到端自动化
我们进行了一项实验:让AI智能体完全自主、端到端地开发一个浏览器,全程无人工干预。您所看到的成果,是一个智能体系统及其团队在一周内独立工作的产物,它生成了大量PR,编写了三百万行代码,并构建了一个基本可用的浏览器原型。
谁能想到,几十年前首映《星球大战》的传奇影院,如今成为了Cursor的新办公地。
近期,在Cursor迁入新址后的首场活动中,创始人兼CEO Michael Truell进行了一场题为《AI编程的下一个纪元》的前瞻性演讲。他通过一系列令人震撼的数据,清晰地勾勒出软件开发行业的演进轨迹。
在演讲中,Michael将软件开发史划分为三个纪元:Tab时代、Agent时代和Team时代。
Tab时代是编程的“手动纪元”。开发者必须亲自编写每一行代码,使用正式的编程语言构建软件,过程极其繁琐。这种底层的复杂性被简洁的用户界面所掩盖,导致非技术人员难以理解,为何一个看似简单的修改需要耗费数周时间。
当前,我们正处于Agent时代。工程师已不再直接编写语法细节,而是将编程任务委托给AI智能体。Cursor的数据极具说服力:2025年,其平台上的智能体请求量相较Tab操作暴涨了15倍。如今,其企业业务线中约75%的代码由AI生成。随之而来的,是工程师角色的根本性转变——他们正逐渐成为智能体的管理者与协调者。
面向未来,Michael描绘了无需人类介入的Team时代愿景,即由自主的AI智能体团队端到端完成整个软件开发流程。目前,Cursor内部已有30%的代码拉取请求由智能体自主完成。他们甚至进行了一次大胆尝试:让一个智能体团队在完全无监督的情况下,全自动开发浏览器。仅用一周时间,该系统便生成了一个相当不错的网页渲染原型,尽管其尚未达到生产环境的标准。
Michael坦言,这一方向仍处于早期探索阶段,但团队将持续推进,不断突破AI自主编程的边界。
软件工程行业正站在时代的分水岭
感谢各位莅临。很高兴能在我们的新办公室举办第一场活动。当前世界正处于一个激动人心的技术拐点,我们非常荣幸能与各位一同探讨软件的未来。在开始之前,请允许我简要介绍一下我们此刻所在的场所及其在科技史中的独特位置。
数十年前,即1970年代末,第一部《星球大战》电影正是在此地首映。这里曾是一家电影院。《星球大战》之所以成为传奇,不仅在于其叙事,更在于它在电影技术史上的里程碑意义。制作团队不仅是卓越的故事讲述者,更是技术创新的先驱。
例如,当时应用的Dykstraflex系统——一种计算机控制的摄影机运动系统——能够精确重复复杂的拍摄轨迹。它通过分层拍摄模型并无缝合成,实现了前所未有的视觉效果。正是这类技术,在最小化人工直接干预的情况下,依靠计算机与摄影系统的高度协同,将《星球大战》的科幻想象变为银幕现实。
这深刻揭示了技术如何重新定义行业,如何清晰划出“前”与“后”的时代分界线。我认为,软件工程领域此刻正处在这样一个历史性的分水岭。
传统编程:繁琐的正式语言构建过程
让我们深入探讨软件构建方式的演变。如果回溯到更早的时期,审视当时的代码——或许诸位管理者已许久未曾亲历——你会发现,就在几年前,构建软件的唯一方式仍是通过文本编辑器编写正式的编程语言。
以一个简单的Python脚本为例:创建列表、遍历元素、添加内容、再次遍历并计算结果。将业务逻辑转化为严格的编程语言语法,是当时唯一的实现路径。那么,其核心痛点与高昂成本体现在何处?为何动辄消耗数周时间与巨额研发预算?
关键在于,你必须将高层次的业务构想,分解为极其细碎的逻辑片段,并以计算机能精确理解的方式逐一陈述。长期以来,你不得不使用if-then-else条件语句、循环结构以及数据移动指令来构建软件。这个过程异常冗繁,要求极度详尽的表述。
软件开发的隐性成本:被掩盖的复杂性
一个仅需数语即可向人类描述的功能,最终可能转化为成千上万行底层代码。让专业软件工程尤为艰巨的另一挑战,是既有系统遗留的庞大逻辑债务。你面对的并非一个简单的脚本,而是横跨数千文件、数千万行代码的复杂系统。
这正是软件开发的一个根本性矛盾:其内在复杂性被完全隐藏。最终呈现给用户的界面简洁直观,但这在所有工程学科中并非通例。以哥特式大教堂为例,其建筑结构的承重与复杂性直接展露于外观,清晰可见。
软件则相反。为了用户体验,我们必须让界面极度简单——用户只看到按钮与必要信息,完全感知不到底层数千万行代码交织成的复杂逻辑网络。因此,数十年来,产品经理与非技术背景的同事时常对开发周期感到困惑与沮丧,因为他们看不到工程师在庞大代码库中修改、调试与整合所付出的巨大工作量。
2025年智能体请求量激增:较Tab操作增长15倍
数据清晰地揭示了这一转变。2025年,我们观察到平台内“Tab接受操作”与“智能体请求”的比例发生了根本性逆转。智能体请求量实现了超过15倍的同比增长。年初,Tab操作数量尚领先智能体请求十倍;如今,趋势已彻底反转,智能体请求量远超前者。这一变化意义重大,因为一次智能体请求通常对应一个完整的功能模块开发,而一次Tab操作可能仅涉及几行代码的修改。这正是过去一年Cursor平台上发生的深刻变革。
Cursor内部30%的代码拉取请求已由智能体端到端完成
我们同时观察到第三个纪元——Team时代的萌芽,正在一些前瞻性组织内部扎根。以Cursor自身为例,内部数据显示,目前已有30%的代码拉取请求由AI智能体端到端独立完成,全程无需工程师手动介入。这些智能体甚至拥有独立的云端计算环境,能够为单一任务持续运行数小时乃至数日,实现真正的端到端交付。这一趋势不仅见于初创公司,在大型企业环境中也日益显著。
Cursor企业业务线代码生成率已达75%
回顾大约一年前,我们企业业务线中AI生成的代码占比可能仅在15%到20%之间。如今,这一比例已跃升至75%左右。工程师已基本脱离直接的语法编写,转而将任务指令下达给智能体。这意味着什么?
角色演进:工程师转型为智能体管理者,上万“虚拟同事”上线
随着时代演进,工程角色将如何定义?在Agent时代向Team时代过渡的边界上,一个明显趋势是:工程师越来越少地直接编写代码,越来越多地扮演智能体管理者的角色。理解组织从Agent时代迈向Team时代的思维模型如下:过去,你的软件由数千名人类工程师构建;现在,你不仅拥有数千名工程师,还增加了成千上万名“虚拟同事”与人类协同工作。
无论是人机协作还是智能体间的协作,组织都期望招募最高效、最具性价比的AI同事。随之而来的是工作流的重大变革。我们看到,工程师正转型为智能体管理者,其核心职责逐渐演变为委派任务、协调并管理这些并行运作的智能体。相应地,工程师投入代码审查的时间也大幅增加。
当然,从Tab到Agent再到Team的转型路径也可能出现偏差。盲目生成大量代码可能导致架构决策失误、技术债务堆积和漏洞频发。因此,负责任的团队正在将更多精力投入审查阶段。工程师花费更多时间评估输出结果、检查代码质量、验证构建版本和进行测试。这意味着更深入的事后审查与更复杂的多任务并行处理。
在Agent时代,当智能体仅在本地运行并接受零散任务时,你能同时管理的智能体数量有限,可能仅为一到三个,因为它们通常需要共享同一个代码库环境。
协同数十个并行智能体同事
当你更接近Team模式,即智能体拥有独立计算环境时,你可以同时与数十个智能体同事协作。它们能够并行处理不同任务,并长时间自主运行。这带来了更高的多任务处理能力、更强的并行性,也意味着更频繁的上下文切换。这或许能让你窥见未来工作模式的雏形。此外,我想简要预告一个更前沿的探索方向,这也是我们在Cursor内部进行实验的领域:如果尽可能减少人类干预,实现高度自我改进的系统,世界将会怎样?
未来预览:探索完全自主的智能体团队模式
例如,我们尝试了让智能体团队完全端到端、全自动地开发一个浏览器,全程无任何人工介入。您所看到的,便是一个智能体系统及其团队在一周内独立工作的成果:它提交了大量拉取请求,生成三百万行代码,并构建了一个基本可用的原型。
您可以观察到演进过程:第一天,它尚无法正确渲染apple.com或特定落地页;随着第二天、第三天、第四天的持续迭代,最终呈现出一个相当完善的网页渲染系统。这一切都是在无人类干预的情况下自主完成的。当然,这项实验仍处于非常早期的阶段,成果距离正式产品化尚有距离。
这里展示了一些汇总数据:包括生成的代码行数、并行运行的团队智能体数量、消耗的Token总量。您还可以观看一段视频,直观展示智能体团队如何生成文件。这里是代码库,这些是库中的文件,以及文件之间的关联关系在一周内被逐步构建出来的可视化呈现。
这一研究方向虽极具实验性且尚未成熟,但我们对此充满期待,并将持续探索,努力将自主编程的边界推向更远。这些实验也为我们规划Cursor产品中Team时代的功能提供了关键洞察。
参考链接:https://www.youtube.com/watch?v=8h9j2rskP14
