Claude Code上新测评：功能升级，成本不容小觑

2026-05-29阅读 0热度 0

Claude

一条指令即可驱动数百个智能体并行协作。

智东西5月29日报道，Anthropic今日正式推出了一项引人注目的更新：Claude Code动态工作流预览版已全面上线。该功能专为超大规模任务设计，Claude无需开发者手动编排工作流，而是自主生成执行脚本，随后调度数十乃至上百个智能体同步处理任务。

▲Anthropic发布动态工作流功能（来源：X）

根据Anthropic官方博客的描述，过去需要数个季度才能啃下的工程难题，如今几天内即可完成交付。最具说服力的案例来自Bun运行时创始人Jarred Sumner——他利用动态工作流将整个Bun运行环境从Zig完全迁移至Rust，最终生成约75万行代码，耗时仅11天，现有测试套件通过率高达99.8%。

不过，Anthropic官方的坦诚也不容忽视：该功能的token消耗量远高于常规的Claude Code使用场景。动态工作流即日起覆盖Claude Code CLI、桌面版及VS Code扩展。Max和Team用户默认激活，Enterprise用户则需管理员手动授权。API端同步上线，支持Amazon Bedrock、Vertex AI及Microsoft Foundry平台。

消息发布后，开发者社群迅速掀起讨论热潮。但客观来看，Hacker News上的反馈并不算积极。许多质疑聚焦于：真正令开发者头疼的从来不是Claude编写代码的速度，而是它能否保证代码正确性。还有开发者戏称该产品的本质是“tokenmaxxing”，对极高的token消耗表示不满。

▲Hacker News开发者对该功能的反馈（来源：Hacker News）

全自动进入集群模式：

Claude学会任务分配、质量审核与互相校验

动态工作流功能的定位极其明确——应对复杂且庞大的任务。当单一智能体无法胜任时，需要调用多个子智能体协同作业，而如何合理分配这些子任务历来是令开发者头疼的环节。

启用动态工作流后，情况发生了根本性转变。用户下达复杂指令时，Claude会自主编写编排脚本，自动将大任务拆解为多个子任务，随后派遣数十上百个子智能体同步执行。每个子智能体将从不同维度处理问题，同时还有专职智能体负责“挑错”并推翻先前结论，使整个流程通过反复迭代直至任务完成。

▲多智能体协同处理任务示意图（来源：Claude）

一个值得关注的细节是：Anthropic强调该模式运行于用户对话窗口中。即便同时调度上百个子Agent，用户所见的主会话也不会被中间结果淹没。进度实时保存，断点处可自动恢复，无需从头开始。

前文提及的Bun迁移案例值得深入解读。Jarred Sumner借助动态工作流，将Bun从Zig全面迁移至Rust，最终交付了约75万行Rust代码，从首次提交到合并仅用11天，现有测试套件通过率达到99.8%。迁移完成后，Sumner又开启一轮过夜工作流，用于消除不必要的数据拷贝，并为每一项优化单独创建了PR。当然，Anthropic也特别提示：重写后的Bun尚未部署至生产环境，Sumner本人后续将单独撰文详细记录整个过程。

与新模型同步上线

是效率提升利器还是新一轮token消耗挑战？

Claude Opus 4.8今日正式全量上线，标准模式定价保持不变，快速模式的价格仅为Opus 4.7和4.6的三分之一，整体定价对开发者更加友好。同时，动态工作流搭配Opus 4.8能够更高效地处理大规模复杂任务——例如大型代码库的跨语言迁移。

如果你使用的是Max或Team套餐，或者通过API接入Claude Code，动态工作流默认处于开启状态。Enterprise用户则默认关闭，需要管理员在Claude Code设置面板手动激活。

用户拥有两种启用方式。第一种是直接向Claude下达创建工作流的指令，让其自主规划并拆分任务。第二种是在effort菜单中找到新增的设置项“ultracode”，将思考强度调至最高，让Claude自行判断何时需要启动工作流。Anthropic建议配合自动模式使用，以获得最佳体验。

Anthropic在博客中留下了一句极为坦诚的警告：动态工作流的token消耗将“远高于典型的Claude Code会话”。换句话说，指挥智能体集群是有成本的，且成本并不低廉。建议从范围可控的小任务开始尝试，先摸清自身使用习惯，再逐步扩大规模。

▲Anthropic对token消耗量的提醒（来源：Claude）

结语：在token成本降低之前

动态工作流仍是少数开发者的实验性工具

当一次动态工作流消耗数十甚至上百美元的token，单次成本逼近甚至超过一名初级工程师的日薪时，该功能的日常化便转化为一个现实的经济问题。无可否认，它能够攻克极端案例——比如Bun这类创始人亲自操刀、目标明确的跨语言迁移——但这并不意味着每个开发团队的日常迭代都能承担这样的开销。

同时，尽管Bun迁移的通过率达到99.8%，但剩余0.2%的缺陷由谁修复？这一问题尚无明确答案。有开发者指出，每增加一个Agent，代码的复杂性和冗余度也随之上升。将如此庞大的任务完全托付给Claude，其质量究竟能否令人放心？

平心而论，这一探索方向恰恰是AI编程领域必须突破的瓶颈。大规模任务的自动化编排需求真实存在，剩下的变量只有两个：一是token消耗量，二是任务完成的质量。或许在未来的某一天，模型性价比更高、能力更强大，到那时，这一自动化未来才能真正落地。

Claude Code上新测评：功能升级，成本不容小觑

相关阅读

最新教程

最新资讯