Claude Code上新测评:功能升级,成本不容小觑
一条指令即可驱动数百个智能体并行协作。
智东西5月29日报道,Anthropic今日正式推出了一项引人注目的更新:Claude Code动态工作流预览版已全面上线。该功能专为超大规模任务设计,Claude无需开发者手动编排工作流,而是自主生成执行脚本,随后调度数十乃至上百个智能体同步处理任务。
▲Anthropic发布动态工作流功能(来源:X)
根据Anthropic官方博客的描述,过去需要数个季度才能啃下的工程难题,如今几天内即可完成交付。最具说服力的案例来自Bun运行时创始人Jarred Sumner——他利用动态工作流将整个Bun运行环境从Zig完全迁移至Rust,最终生成约75万行代码,耗时仅11天,现有测试套件通过率高达99.8%。
不过,Anthropic官方的坦诚也不容忽视:该功能的token消耗量远高于常规的Claude Code使用场景。动态工作流即日起覆盖Claude Code CLI、桌面版及VS Code扩展。Max和Team用户默认激活,Enterprise用户则需管理员手动授权。API端同步上线,支持Amazon Bedrock、Vertex AI及Microsoft Foundry平台。
消息发布后,开发者社群迅速掀起讨论热潮。但客观来看,Hacker News上的反馈并不算积极。许多质疑聚焦于:真正令开发者头疼的从来不是Claude编写代码的速度,而是它能否保证代码正确性。还有开发者戏称该产品的本质是“tokenmaxxing”,对极高的token消耗表示不满。
▲Hacker News开发者对该功能的反馈(来源:Hacker News)
全自动进入集群模式:
Claude学会任务分配、质量审核与互相校验
动态工作流功能的定位极其明确——应对复杂且庞大的任务。当单一智能体无法胜任时,需要调用多个子智能体协同作业,而如何合理分配这些子任务历来是令开发者头疼的环节。
启用动态工作流后,情况发生了根本性转变。用户下达复杂指令时,Claude会自主编写编排脚本,自动将大任务拆解为多个子任务,随后派遣数十上百个子智能体同步执行。每个子智能体将从不同维度处理问题,同时还有专职智能体负责“挑错”并推翻先前结论,使整个流程通过反复迭代直至任务完成。
▲多智能体协同处理任务示意图(来源:Claude)
一个值得关注的细节是:Anthropic强调该模式运行于用户对话窗口中。即便同时调度上百个子Agent,用户所见的主会话也不会被中间结果淹没。进度实时保存,断点处可自动恢复,无需从头开始。
前文提及的Bun迁移案例值得深入解读。Jarred Sumner借助动态工作流,将Bun从Zig全面迁移至Rust,最终交付了约75万行Rust代码,从首次提交到合并仅用11天,现有测试套件通过率达到99.8%。迁移完成后,Sumner又开启一轮过夜工作流,用于消除不必要的数据拷贝,并为每一项优化单独创建了PR。当然,Anthropic也特别提示:重写后的Bun尚未部署至生产环境,Sumner本人后续将单独撰文详细记录整个过程。
与新模型同步上线
是效率提升利器还是新一轮token消耗挑战?
Claude Opus 4.8今日正式全量上线,标准模式定价保持不变,快速模式的价格仅为Opus 4.7和4.6的三分之一,整体定价对开发者更加友好。同时,动态工作流搭配Opus 4.8能够更高效地处理大规模复杂任务——例如大型代码库的跨语言迁移。
如果你使用的是Max或Team套餐,或者通过API接入Claude Code,动态工作流默认处于开启状态。Enterprise用户则默认关闭,需要管理员在Claude Code设置面板手动激活。
用户拥有两种启用方式。第一种是直接向Claude下达创建工作流的指令,让其自主规划并拆分任务。第二种是在effort菜单中找到新增的设置项“ultracode”,将思考强度调至最高,让Claude自行判断何时需要启动工作流。Anthropic建议配合自动模式使用,以获得最佳体验。
Anthropic在博客中留下了一句极为坦诚的警告:动态工作流的token消耗将“远高于典型的Claude Code会话”。换句话说,指挥智能体集群是有成本的,且成本并不低廉。建议从范围可控的小任务开始尝试,先摸清自身使用习惯,再逐步扩大规模。
▲Anthropic对token消耗量的提醒(来源:Claude)
结语:在token成本降低之前
动态工作流仍是少数开发者的实验性工具
当一次动态工作流消耗数十甚至上百美元的token,单次成本逼近甚至超过一名初级工程师的日薪时,该功能的日常化便转化为一个现实的经济问题。无可否认,它能够攻克极端案例——比如Bun这类创始人亲自操刀、目标明确的跨语言迁移——但这并不意味着每个开发团队的日常迭代都能承担这样的开销。
同时,尽管Bun迁移的通过率达到99.8%,但剩余0.2%的缺陷由谁修复?这一问题尚无明确答案。有开发者指出,每增加一个Agent,代码的复杂性和冗余度也随之上升。将如此庞大的任务完全托付给Claude,其质量究竟能否令人放心?
平心而论,这一探索方向恰恰是AI编程领域必须突破的瓶颈。大规模任务的自动化编排需求真实存在,剩下的变量只有两个:一是token消耗量,二是任务完成的质量。或许在未来的某一天,模型性价比更高、能力更强大,到那时,这一自动化未来才能真正落地。




