Claude Fable 5 CAD绘图实测 工程师老爹惊呆
Claude 系列最新旗舰模型 Claude Fable 5 现已正式上线。
业界对此次发布的关注度远超以往。核心原因在于——这是 Claude 首次推出的整数代架构模型。回顾从 4.6 到 4.8 的几次迭代版本,性能提升幅度确实相对有限,这种反差反而让市场对 Fable 5 的期待值持续走高。
为验证其真实能力,直接部署了一项建筑 CAD 绘图任务:
同时尝试构建了 SpaceX 星舰配套的 Raptor 3 发动机三维模型:
实测效果令人印象深刻。
官方公布的 Fable 5 benchmark 数据显示,该模型在绝大多数评测指标上均显著超越上一代 Opus 4.8,并全面领先 GPT 5.5,覆盖推理、代码生成、多模态理解等核心维度。
详细技术白皮书已公开发布,本文不再赘述基准测试的具体数值。
需要指出的是,从 4.6 到 4.8 的迭代过程中,benchmark 分数同样呈现上升趋势,但实际用户体验并未同步提升,部分场景甚至出现倒退。因此,本次评测并未将 benchmark 数据作为核心参考。指标提升是一回事,真正值得关注的是模型在实际业务场景中的落地表现与产出质量。
Fable 5 使用方式与定价策略
Fable 5 的 API 定价为每百万输入 token 10 美元、每百万输出 token 50 美元,相较上一代产品价格接近翻倍。
即日起至 6 月 22 日,Fable 5 面向 Pro Max、Team 及按席位计费的企业版用户开放,订阅套餐内可直接使用,无需额外支付费用。
但 Claude 的分阶段运营策略值得留意。6 月 23 日起,订阅套餐将不再包含 Fable 5 的使用权限,用户需消耗使用积分才能继续调用。API 接口则始终保持可用。官方表示待计算资源扩容后,会重新将 Fable 5 纳入订阅体系。
当前策略明确:6 月 22 日前是订阅用户免额外成本体验 Fable 5 的窗口期,之后访问门槛将显著提高。
实战测试:AI 驱动建筑 CAD 全流程绘图
在测试方案设计上,投入了大量时间思考——究竟什么样的任务才能真正检验新一代 AI 模型的工程化能力上限。
近期行业内的热点方向之一,是将 Claude Code 或 Codex 与工业级软件进行深度联动。例如,已有开发者通过 Codex 驱动 Blender 完成人体三维建模,该案例在社区中引发了广泛关注与讨论。
另一个更具工程价值的探索方向是:利用 Claude Code 或 Codex 直接生成 CAD 工程图纸。
测试立即启动。
第一步,部署 FreeCAD 开源 CAD 软件,并通过 Claude 为其配置 MCP server 接口。
Fable 5 在任务响应与执行速度上表现突出。相比之下,使用 Codex 搭建同样配置时,整体流程耗时明显更长。
本次向 Fable 5 输入了一段结构完整的建筑 CAD 提示词,涵盖墙体布局、门窗定位、尺寸标注等关键参数。
Fable 5 在指令遵循度与推理效率上均展现出明显进步,整个执行流程的连贯性显著优于前代。模型几乎从零开始,自主完成了一整张建筑 CAD 工程图的构建:
高清输出效果如下:
值得关注的是,整个生成过程一次性通过,未出现任何运行报错。模型在自检环节也未发现逻辑或结构性问题,未进行任何修正操作。从提示词输入到最终图纸输出,实现了零迭代一次成型。
作为 Claude Pro 5X 订阅用户,完成上述全流程——包括导出 PDF、PNG 和 DXF 三种格式——仅消耗了 15% 至 25% 的每小时算力配额,资源占用处于合理区间。
近期持续在跟进 AI 与 CAD 协同设计领域,经手分析过大量 AI 生成的建筑图纸。让 Codex 与 Fable 5 对同一任务进行交叉评估后,可以确认这张 CAD 图的整体完成度较高。
墙体结构、门窗系统、文件可编辑性、出图精度,以及尺寸链标注、窗位链定位等细分维度,均达到了较高的覆盖标准。
由于自身并非建筑或土木工程背景,难以从专业维度对图纸进行严格评判。因此邀请了一位拥有数十年从业经验的土木工程专家——家中长辈,曾主导多个大型项目并培养过多名项目经理——来进行独立评估。
将图纸发送给该专家进行审阅。
反馈简洁直接:
整体可用,但存在若干专业错误。
仅就前半句评价而言,已经具有标志性意义。一位资深工程专家给出「整体可用」的判断,意味着这张图纸已经跨过了工业级应用的基础门槛。这一反馈直接挑战了一个普遍认知:AI 技术虽然在消费级领域被广泛讨论,但在真正的产业与工业场景中仍被认为难以创造实际价值。
进一步追问了时间成本对比:同样一张图纸,由专业工程师完成约需 10 至 15 分钟;而由实习生或未经专业训练的人员绘制,则可能需要半天至一整天。
专家随后对图纸进行了详细审查,共计指出 11 处具体问题。这一结果并不令人意外。AI 生成的 CAD 图纸在视觉呈现上往往具有欺骗性,但在工程规范层面仍存在系统性缺陷,这一点需要正视。
仅展示 Fable 5 的单一样本并邀请专家点评,普通用户难以直观感知代际差异。因此,同时使用 Codex GPT 5.5 XHigh 绘制了完全相同的建筑 CAD 图纸,进行横向对照测试。
下图即为 Codex 生成的版本。即便以非专业视角审视,也能明显发现多处结构性问题。例如左下角及左中部区域的玄关开口位置完全不符合建筑规范,错误程度相当显著。
尽管版面要素覆盖率尚可,初看视觉结构较为完整,但墙体几何关系与工程合规性完全未达到交付标准,明显错误密度过高。
再次邀请同一位专家进行评审,针对 Codex 版本的图纸给出 10 分制的量化评分。反馈依然简短:
质量明显更差。
这一评价直接揭示了模型间的显著差距。
当追问具体差距幅度时,专家的量化结论是——综合质量落后约 80%。
随后要求 Fable 5 对两份图纸进行自我评分。针对自身生成的版本,Fable 5 给出了 8 分(满分 10 分),绝大多数评估子项均在 7 分以上。
而 Codex 版本的各项评分则集中在 3 分至 5 分区间。
从二维图纸到三维建模:Raptor 3 发动机全流程复现
补充说明一点,FreeCAD 的核心优势在于三维建模。在纯二维 CAD 制图领域,其专业性不及 AutoCAD,但在三维模型构建方面表现更为出色。
基于这一工具特性,进一步要求 Fable 5 构建 SpaceX 星舰所使用的 Raptor 3 发动机三维模型:
在提示词尾部补充了一条指令:要求模型自主检索 Raptor 3 的外观结构资料,并在生成后执行自检。需要说明的是,Raptor 3 的具体工程细节属于未公开信息,本次测试主要聚焦于整体结构还原度与视觉表现。
Fable 5 输出的结果如下:
整体渲染效果:
局部放大展示其中一个泵组件的结构细节——
值得特别指出的是,在最终自检阶段,模型确实主动检索了参考资料进行对比验证。经过比对发现,真实发动机中存在一组从喷管顶部卡箍斜向延伸至托盘的拉杆结构,随后模型自动补充构建了 4 根对应组件,完成了最后一轮迭代优化。
作为对照,下图是 Codex 生成的版本。其输出结果抽象到让人反复核验提示词是否出现偏差,以至于担心是否对 Codex 存在不公平测试:
经过一次修改后的版本如下:
模型之间的能力差距一目了然。
测试总结与迁移决策
两个月前,基于对 Claude opus 4.7 与 4.8 版本性能表现的不满——这两代模型在实际使用中甚至不如 4.6 版本——因此全面切换至 Codex 生态,并订阅了 Codex Pro 5X 套餐。
然而,经过本轮对 Fable 5 的全面测试,现有工具链的忠诚度正在被动摇。接下来需要认真评估,是否应该重新回归 Claude 平台。