深度揭秘Codex集成DeepSeek V4模型后变笨：Tools工具能力失效是性能下降主要原因

2026-06-17阅读 0热度 0

其他

在实际开发中，我发现一个令人费解的现象：同样是 Codex 客户端，此前搭配 GPT 或 Claude 时体验非常流畅——修改代码、新建文件、重构项目一气呵成。但自从将模型切换为 DeepSeek V4 后，操作总感觉不对劲：代码生成能力明显下降，文件修改变得拖沓，操作路径异常迂回，整体体验甚至不如 OpenCode。

起初我怀疑是模型本身能力不足，折腾了半天才发现，根源出在工具调用上——第三方 API 导致 Codex 的原生 Tools 功能彻底失效。

现象一：Codex 不再直接修改文件

之前用 GPT 时，让 Codex 修改某个文件（例如帮我修改 src/api/user.js），它会直接调用文件编辑工具，清晰展示变更详情：

修改文件：src/api/user.js 12-3

增加行数、删除行数、具体修改内容一目了然，整个流程如同 Cursor 一样直观。

接入 DeepSeek V4 后，情况骤变。模型开始疯狂使用命令行操作，例如：

echo "xxxx" > temp.js

或者：

cat > test.js

再或者：

cp fileA fileB

接着：

mv temp.js target.js

表面上看似在修改文件，实际流程变成了：创建临时文件 → 复制内容 → 删除原文件 → 替换目标文件。整个操作绕得离谱，甚至经常出现创建 A 文件→修改 B 文件→读取 C 文件→再回头覆盖 A 文件的循环，令人困惑。

现象二：大文件修改尤为棘手

以修改一个 1000 行的 Vue 页面为例。正常情况下应做到：定位目标代码 → 修改指定区域 → 保存。但 DeepSeek 接入后，经常变为：读取整个文件 → 生成全新文件 → 覆盖原文件。

这直接导致两个问题：

Token 消耗激增。 原本只需读取 10 行、修改 10 行；现在要读取 1000 行、重写 1000 行，成本直接翻倍。

旧代码容易误覆盖。 尤其在多人协作的项目中，刚编写的新逻辑可能被模型整体替换，非常困扰。

起初以为是 DeepSeek 能力问题

老实说，最开始我真以为是 DeepSeek V4 的代码能力下滑，甚至将其与 OpenCode 对比。结果 OpenCode 修改文件更加直接，而 Codex 却绕来绕去。于是开始怀疑：Codex 是不是变得越来越难用？越排查越觉得不对劲。

真正原因：第三方 API 无法调用 Codex 原生 Tools

深入排查后，终于找到关键症结。问题不在于模型，而在于第三方中转 API。许多第三方接口仅兼容 Chat Completion，即最基础的“发送消息→返回文本”能力。而 Codex 真正的优势在于其 Tools 能力——文件编辑、文件创建、文件搜索、终端执行、项目索引、差异对比（Diff）等。这些都属于 Tool Calling 范畴。

GPT 为何正常？

因为多数 GPT 接口（如 gpt-5、gpt-5-mini、gpt-4.1）原生支持 Tool Calling，官方接口能返回{"tool_calls":[]}结构。Codex 接收到后就能明确：应该修改文件、执行命令或搜索项目。于是那些清晰的差异对比随之呈现。

DeepSeek 第三方接口为何不行？

很多第三方平台虽然标注“兼容 OpenAI API”，但实际只兼容 Chat 接口，并未完整支持 Responses API 或完整的 Tool Calling。因此模型只能输出文本，无法返回工具调用指令。Codex 只能退而求其次——读取文件→生成新内容→用 CMD 覆盖，采用这种低效方案。

为何感觉模型突然降智？

实际上是两个能力被混淆了：模型能力负责理解代码、生成代码、分析问题；Tools 能力负责修改文件、搜索项目、执行命令。当 Tools 缺失时，即便模型本身能力在线，用户感受到的体验仍是“笨拙、缓慢、迂回”。于是很多人误以为 DeepSeek 不行，实际缺席的是 Agent 能力。

OpenCode 为何感觉更顺手？

不少开发者发现，OpenCode、Claude Code、Cursor 等工具即使接入第三方模型，有时仍能直接修改文件。原因在于这些工具通常自带本地文件系统工具，例如 read_file、write_file、replace_text 等。这些工具由客户端提供，模型只需输出调用格式即可，因此体验相对稳定。

我的测试结论

经过几天的横向比对，最终得出清晰的结论：

方案	文件编辑体验	Tools 支持	推荐程度
官方 GPT 接口	非常好	完整支持	★★★★★
官方 Claude 接口	非常好	完整支持	★★★★★
DeepSeek 官方支持 Tools 接口	较好	部分支持	★★★★
第三方 DeepSeek 中转	一般	经常缺失	★★
仅 Chat 兼容接口	较差	无 Tools	★

解决建议

如果你遇到 Codex 出现以下状况：不直接修改文件、频繁执行 CMD、大量创建临时文件、整体覆盖代码、修改逻辑迂回，先别急着归咎于模型。建议从以下方面排查：

1. 是否使用了第三方中转？ 绝大多数问题的根源在此。

2. 接口是否支持 Tool Calling？ 查阅文档，确认是否明确提及 Tool Calling、Function Calling、Responses API 等关键词。

3. 优先选择官方接口。 对于长期开发项目，直接使用 GPT 或 Claude 的官方接口，体验差距非常显著。

总结

近期我一直觉得 Codex 越来越难用，后来才意识到并非 Codex 本身退步，而是接入 DeepSeek V4 的第三方中转 API 导致大量原生 Tools 功能无法正常工作。结果文件修改能力、项目操作能力、Agent 能力以及整体开发体验全面下降。表面看似模型降智，实际上是“模型还能思考，但手脚被束缚”。对于 Codex、Claude Code、Cursor 这类重度依赖工具调用的 AI 编程产品而言，模型实力固然重要，但 Tool Calling 能力同样关键。很多时候让你感觉 AI 变笨的，并不是模型，而是它失去了操作项目的能力。