Claude Code上新测评:功能升级,成本不容小觑

2026-05-29阅读 0热度 0
Claude

一条指令即可驱动数百个智能体并行协作。

智东西5月29日报道,Anthropic今日正式推出了一项引人注目的更新:Claude Code动态工作流预览版已全面上线。该功能专为超大规模任务设计,Claude无需开发者手动编排工作流,而是自主生成执行脚本,随后调度数十乃至上百个智能体同步处理任务。

▲Anthropic发布动态工作流功能(来源:X)

根据Anthropic官方博客的描述,过去需要数个季度才能啃下的工程难题,如今几天内即可完成交付。最具说服力的案例来自Bun运行时创始人Jarred Sumner——他利用动态工作流将整个Bun运行环境从Zig完全迁移至Rust,最终生成约75万行代码,耗时仅11天,现有测试套件通过率高达99.8%。

不过,Anthropic官方的坦诚也不容忽视:该功能的token消耗量远高于常规的Claude Code使用场景。动态工作流即日起覆盖Claude Code CLI、桌面版及VS Code扩展。Max和Team用户默认激活,Enterprise用户则需管理员手动授权。API端同步上线,支持Amazon Bedrock、Vertex AI及Microsoft Foundry平台。

消息发布后,开发者社群迅速掀起讨论热潮。但客观来看,Hacker News上的反馈并不算积极。许多质疑聚焦于:真正令开发者头疼的从来不是Claude编写代码的速度,而是它能否保证代码正确性。还有开发者戏称该产品的本质是“tokenmaxxing”,对极高的token消耗表示不满。

▲Hacker News开发者对该功能的反馈(来源:Hacker News)

全自动进入集群模式:

Claude学会任务分配、质量审核与互相校验

动态工作流功能的定位极其明确——应对复杂且庞大的任务。当单一智能体无法胜任时,需要调用多个子智能体协同作业,而如何合理分配这些子任务历来是令开发者头疼的环节。

启用动态工作流后,情况发生了根本性转变。用户下达复杂指令时,Claude会自主编写编排脚本,自动将大任务拆解为多个子任务,随后派遣数十上百个子智能体同步执行。每个子智能体将从不同维度处理问题,同时还有专职智能体负责“挑错”并推翻先前结论,使整个流程通过反复迭代直至任务完成。

▲多智能体协同处理任务示意图(来源:Claude)

一个值得关注的细节是:Anthropic强调该模式运行于用户对话窗口中。即便同时调度上百个子Agent,用户所见的主会话也不会被中间结果淹没。进度实时保存,断点处可自动恢复,无需从头开始。

前文提及的Bun迁移案例值得深入解读。Jarred Sumner借助动态工作流,将Bun从Zig全面迁移至Rust,最终交付了约75万行Rust代码,从首次提交到合并仅用11天,现有测试套件通过率达到99.8%。迁移完成后,Sumner又开启一轮过夜工作流,用于消除不必要的数据拷贝,并为每一项优化单独创建了PR。当然,Anthropic也特别提示:重写后的Bun尚未部署至生产环境,Sumner本人后续将单独撰文详细记录整个过程。

与新模型同步上线

是效率提升利器还是新一轮token消耗挑战?

Claude Opus 4.8今日正式全量上线,标准模式定价保持不变,快速模式的价格仅为Opus 4.7和4.6的三分之一,整体定价对开发者更加友好。同时,动态工作流搭配Opus 4.8能够更高效地处理大规模复杂任务——例如大型代码库的跨语言迁移。

如果你使用的是Max或Team套餐,或者通过API接入Claude Code,动态工作流默认处于开启状态。Enterprise用户则默认关闭,需要管理员在Claude Code设置面板手动激活。

用户拥有两种启用方式。第一种是直接向Claude下达创建工作流的指令,让其自主规划并拆分任务。第二种是在effort菜单中找到新增的设置项“ultracode”,将思考强度调至最高,让Claude自行判断何时需要启动工作流。Anthropic建议配合自动模式使用,以获得最佳体验。

Anthropic在博客中留下了一句极为坦诚的警告:动态工作流的token消耗将“远高于典型的Claude Code会话”。换句话说,指挥智能体集群是有成本的,且成本并不低廉。建议从范围可控的小任务开始尝试,先摸清自身使用习惯,再逐步扩大规模。

▲Anthropic对token消耗量的提醒(来源:Claude)

结语:在token成本降低之前

动态工作流仍是少数开发者的实验性工具

当一次动态工作流消耗数十甚至上百美元的token,单次成本逼近甚至超过一名初级工程师的日薪时,该功能的日常化便转化为一个现实的经济问题。无可否认,它能够攻克极端案例——比如Bun这类创始人亲自操刀、目标明确的跨语言迁移——但这并不意味着每个开发团队的日常迭代都能承担这样的开销。

同时,尽管Bun迁移的通过率达到99.8%,但剩余0.2%的缺陷由谁修复?这一问题尚无明确答案。有开发者指出,每增加一个Agent,代码的复杂性和冗余度也随之上升。将如此庞大的任务完全托付给Claude,其质量究竟能否令人放心?

平心而论,这一探索方向恰恰是AI编程领域必须突破的瓶颈。大规模任务的自动化编排需求真实存在,剩下的变量只有两个:一是token消耗量,二是任务完成的质量。或许在未来的某一天,模型性价比更高、能力更强大,到那时,这一自动化未来才能真正落地。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策