DeepSeek组建Harness团队：对标Claude Code的AI开发新势力

2026-05-20阅读 0热度 0

DeepSeek

DeepSeek Code，这次真的要来了。

据「甲子光年」从接近DeepSeek的知情人士处获得的消息，DeepSeek内部正在组建一个全新的Harness团队，其核心目标正是打造一款代码智能体产品，内部对标的，正是Anthropic旗下的明星产品Claude Code。

这一动向，也得到了DeepSeek资深研究员陈德里在社交媒体上的证实。他明确表示，团队正在“组织一个新的Harness团队做Harness方向的产品和研究”，并直言不讳地指出，其目标就是“对标Claude Code，做DeepSeek Code Harness”。

这绝非一次普通的招聘。

从公开的招聘信息来看，DeepSeek此次开放了两个关键岗位：Harness产品经理和Harness研发工程师，工作地点目前仅限北京。其北京办公室坐落于海淀区融科资讯中心，这个位置颇有深意——在官方最新的表述中，这里属于“百年京张AI创新带”；而在业内的民间讨论里，这里也恰好位于近期备受关注的“王慧文区域”。

图片来源：DeepSeek最新招聘页面

在岗位描述中，一个核心公式被置于最显眼的位置：

Model + Harness = Agent。

这句话，几乎可以视为DeepSeek对下一阶段产品化路径的内部定义。它清晰地传递出一个信号：模型本身只是智能体的底座，而模型之外的一切——包括上下文管理、工具调用、任务规划、文件读写、代码修改、终端执行、反馈回收乃至评测闭环——这些才是让智能体真正融入并改变工作流的关键所在。

招聘信息进一步阐述道：“我们正在把DeepSeek的前沿模型能力，转化为领先的Agent产品。这其中除模型本身以外的所有工作，都属于Harness的范畴。”该岗位将深度参与“DeepSeek桌面端Agent产品”的全过程，并承担“定义DeepSeek对Harness的理解”这一重任。

综合来看，DeepSeek的意图已经相当明确：它并非简单地想做一个代码助手插件，而是在全力补齐模型通往真实工作流之间那层至关重要的“中间层”。

过去一年的行业实践已经反复证明：代码能力强，并不等于开发者会真正用起来；模型能写代码，更不等于它能持续、可靠地完成一个完整的工程任务。

真正能改变开发者工作方式的，从来不是孤立的模型本身。不是单独的Claude模型，而是Claude Code；不是单独的GPT模型，而是Codex；不是一个聊天框里孤零零的代码回答，而是一个能够深入终端、理解项目上下文、读写文件、运行命令、修复错误、管理Git、并灵活调用各种工具的“工程智能体”。

DeepSeek过去最强的王牌是模型。现在，它开始为这副强大的“大脑”，装配一双灵巧的“手”。

1. DeepSeek为什么强调Harness

在传统的AI产品语境里，“代码助手”通常指向两类产品：一种是集成在IDE里的智能补全插件，另一种则是聊天界面中的代码问答机器人。

但仔细阅读DeepSeek的这次招聘，反复出现的核心词汇并非“Code Assistant”，而是“Harness”。

Harness一词，原本在工程语境中指“测试线束”或“运行框架”。将其置于智能体的语境中，它更接近一套让模型真正“动起来”的外部系统。模型负责理解、推理和生成，而Harness则负责将这些抽象能力，无缝接入并作用于真实、复杂的环境之中。

岗位描述中有一句话尤为关键：该角色需要“规划DeepSeek Harness产品路线图，串联研究员、工程师、开源社区与终端用户，并与模型训练团队的研究员深度沟通，实现模型与Harness的共同进化。”

这恰恰点明了DeepSeek的深层意图。它想做的，绝不只是给现有模型套上一层产品外壳，而是要将Agent产品本身，打造成驱动模型持续进化的核心反馈场。

过去，大模型公司常见的产品逻辑是线性的：研究团队先训练出一个强大的模型，产品团队再基于这个模型的能力去设计应用。但在Agent时代，这个顺序正在被彻底打破。产品不再仅仅是模型能力的出口，它本身就成了模型能力迭代的训练场。

一个代码智能体在真实项目中遭遇失败，原因可能多种多样：或许不是产品交互设计的问题，而是模型对长上下文的压缩与理解方式存在缺陷；或许不是工具调用链路不通畅，而是模型对复杂任务的拆解策略不够稳定；也可能并非代码生成能力不足，而是它缺乏对工程约束、测试反馈和用户真实意图的持续、深度理解。

因此，Harness团队的核心价值，远不止于“做出一款产品”。其更深层的使命在于，将海量的真实开发任务，系统性转化为驱动模型持续优化的反馈源。

2. DeepSeek为什么必须补上Code Harness？

DeepSeek在代码能力上的布局其实很早。从DeepSeek-Coder到DeepSeek-Coder-V2，其在代码模型上的投入持续加码，支持的语言、上下文长度以及处理复杂任务的能力都在不断提升。它面临的问题，从来不是“有没有代码能力”，而在于这部分强大的能力，过去更多停留在模型层，尚未转化为开发者日常工作流中不可或缺的高频产品。

DeepSeek近两年27篇论文时间线，横轴表示每篇论文或技术报告的去重作者数，颜色表示技术方向，「甲子光年」制图

Claude Code的成功已经证明了一个趋势：AI编程工具的竞争焦点，正在从单纯的模型能力比拼，转向对开发者工作流“入口”的争夺。

这，正是DeepSeek当下必须补上的一课。

一个颇为微妙的现象是，在DeepSeek官方正式出手之前，开发者社区已经用实际行动，替它打造了一版“民间DeepSeek版Claude Code”。

一个名为DeepSeek-TUI的开源项目此前在开发者社区悄然走红。这是一个运行在终端里的coding agent，具备读写文件、执行Shell命令、搜索网页、管理Git等能力，并通过TUI界面协调多个子智能体进行工作。

DeepSeek-TUI界面，图片来源：DeepSeek-TUI

DeepSeek-TUI的走红，至少说明了两个问题。

第一，DeepSeek模型在开发者心智中，已经具备了支撑代码智能体的坚实基础。否则，社区不会自发地围绕它构建出Claude Code式的产品形态。

第二，DeepSeek目前欠缺的，并非模型的关注度或能力，而恰恰是官方主导的、成体系的Harness层。

在开发者看来，DeepSeek-TUI的吸引力非常直接：成本相对较低、国内访问顺畅、上下文长度充足、部署门槛也不算太高。事实上，国内许多开发者并非不想使用Claude Code，而是受限于价格、访问稳定性、账号体系以及企业合规要求等因素。

然而，社区项目天然存在边界。一个第三方开源项目无论多么活跃，都很难真正掌握模型内部能力的演化节奏；它可以围绕现有API做适配优化，但无法反向决定模型该如何训练与迭代；它可以尽力优化提示词、工具链和交互设计，却很难将海量真实任务反馈，系统性地注入到模型改进的闭环中。

而这，正是官方亲自下场打造Harness的核心意义所在。

DeepSeek自己做Code Harness，拥有几个社区项目难以比拟的优势：与模型团队的深度协作、对接口设计的绝对主导权、构建训练数据闭环的能力、接触内部真实任务场景的便利，以及对开发者生态进行长期、系统运营的实力。

开源社区已经用实际行动，为DeepSeek踩出了一条清晰的路：市场确实需要一个DeepSeek版本的Claude Code。现在，DeepSeek要做的是将这条社区踩出的“小路”，收归并升级为一条由自己主导的“主干道”。

此次启动招聘，意味着DeepSeek终于准备亲自下场，将战略重心向产品化与生态构建倾斜。

其实，陈德里在去年11月的乌镇世界互联网大会上就曾提到：“我们公司的一个核心优势就是长期主义，坚持做前沿智能突破这条主线。而在这个过程中，我们也舍弃了很多支线上的事情，不做那些短平快的支线事情。”

如今看来，模型层面的战争远未结束，但真正的Agent战争序幕已经拉开。DeepSeek这一次要补强的，正是从强大的“模型大脑”到高效的“智能体行动”之间，那层最关键的中枢——Harness。

DeepSeek，正在为自己的超级模型，装上那双可以改变&现实世界的“手”。

（封面图来源：AI生成）

DeepSeek组建Harness团队：对标Claude Code的AI开发新势力

1. DeepSeek为什么强调Harness

2. DeepSeek为什么必须补上Code Harness？

相关阅读

最新教程

最新资讯