DeepSeek组建Harness团队:对标Claude Code的AI开发新势力
DeepSeek Code,这次真的要来了。
据「甲子光年」从接近DeepSeek的知情人士处获得的消息,DeepSeek内部正在组建一个全新的Harness团队,其核心目标正是打造一款代码智能体产品,内部对标的,正是Anthropic旗下的明星产品Claude Code。
这一动向,也得到了DeepSeek资深研究员陈德里在社交媒体上的证实。他明确表示,团队正在“组织一个新的Harness团队做Harness方向的产品和研究”,并直言不讳地指出,其目标就是“对标Claude Code,做DeepSeek Code Harness”。
这绝非一次普通的招聘。
从公开的招聘信息来看,DeepSeek此次开放了两个关键岗位:Harness产品经理和Harness研发工程师,工作地点目前仅限北京。其北京办公室坐落于海淀区融科资讯中心,这个位置颇有深意——在官方最新的表述中,这里属于“百年京张AI创新带”;而在业内的民间讨论里,这里也恰好位于近期备受关注的“王慧文区域”。
图片来源:DeepSeek最新招聘页面
在岗位描述中,一个核心公式被置于最显眼的位置:
Model + Harness = Agent。
这句话,几乎可以视为DeepSeek对下一阶段产品化路径的内部定义。它清晰地传递出一个信号:模型本身只是智能体的底座,而模型之外的一切——包括上下文管理、工具调用、任务规划、文件读写、代码修改、终端执行、反馈回收乃至评测闭环——这些才是让智能体真正融入并改变工作流的关键所在。
招聘信息进一步阐述道:“我们正在把DeepSeek的前沿模型能力,转化为领先的Agent产品。这其中除模型本身以外的所有工作,都属于Harness的范畴。”该岗位将深度参与“DeepSeek桌面端Agent产品”的全过程,并承担“定义DeepSeek对Harness的理解”这一重任。
综合来看,DeepSeek的意图已经相当明确:它并非简单地想做一个代码助手插件,而是在全力补齐模型通往真实工作流之间那层至关重要的“中间层”。
过去一年的行业实践已经反复证明:代码能力强,并不等于开发者会真正用起来;模型能写代码,更不等于它能持续、可靠地完成一个完整的工程任务。
真正能改变开发者工作方式的,从来不是孤立的模型本身。不是单独的Claude模型,而是Claude Code;不是单独的GPT模型,而是Codex;不是一个聊天框里孤零零的代码回答,而是一个能够深入终端、理解项目上下文、读写文件、运行命令、修复错误、管理Git、并灵活调用各种工具的“工程智能体”。
DeepSeek过去最强的王牌是模型。现在,它开始为这副强大的“大脑”,装配一双灵巧的“手”。
1. DeepSeek为什么强调Harness
在传统的AI产品语境里,“代码助手”通常指向两类产品:一种是集成在IDE里的智能补全插件,另一种则是聊天界面中的代码问答机器人。
但仔细阅读DeepSeek的这次招聘,反复出现的核心词汇并非“Code Assistant”,而是“Harness”。
Harness一词,原本在工程语境中指“测试线束”或“运行框架”。将其置于智能体的语境中,它更接近一套让模型真正“动起来”的外部系统。模型负责理解、推理和生成,而Harness则负责将这些抽象能力,无缝接入并作用于真实、复杂的环境之中。
岗位描述中有一句话尤为关键:该角色需要“规划DeepSeek Harness产品路线图,串联研究员、工程师、开源社区与终端用户,并与模型训练团队的研究员深度沟通,实现模型与Harness的共同进化。”
这恰恰点明了DeepSeek的深层意图。它想做的,绝不只是给现有模型套上一层产品外壳,而是要将Agent产品本身,打造成驱动模型持续进化的核心反馈场。
过去,大模型公司常见的产品逻辑是线性的:研究团队先训练出一个强大的模型,产品团队再基于这个模型的能力去设计应用。但在Agent时代,这个顺序正在被彻底打破。产品不再仅仅是模型能力的出口,它本身就成了模型能力迭代的训练场。
一个代码智能体在真实项目中遭遇失败,原因可能多种多样:或许不是产品交互设计的问题,而是模型对长上下文的压缩与理解方式存在缺陷;或许不是工具调用链路不通畅,而是模型对复杂任务的拆解策略不够稳定;也可能并非代码生成能力不足,而是它缺乏对工程约束、测试反馈和用户真实意图的持续、深度理解。
因此,Harness团队的核心价值,远不止于“做出一款产品”。其更深层的使命在于,将海量的真实开发任务,系统性转化为驱动模型持续优化的反馈源。
2. DeepSeek为什么必须补上Code Harness?
DeepSeek在代码能力上的布局其实很早。从DeepSeek-Coder到DeepSeek-Coder-V2,其在代码模型上的投入持续加码,支持的语言、上下文长度以及处理复杂任务的能力都在不断提升。它面临的问题,从来不是“有没有代码能力”,而在于这部分强大的能力,过去更多停留在模型层,尚未转化为开发者日常工作流中不可或缺的高频产品。
DeepSeek近两年27篇论文时间线,横轴表示每篇论文或技术报告的去重作者数,颜色表示技术方向,「甲子光年」制图
Claude Code的成功已经证明了一个趋势:AI编程工具的竞争焦点,正在从单纯的模型能力比拼,转向对开发者工作流“入口”的争夺。
这,正是DeepSeek当下必须补上的一课。
一个颇为微妙的现象是,在DeepSeek官方正式出手之前,开发者社区已经用实际行动,替它打造了一版“民间DeepSeek版Claude Code”。
一个名为DeepSeek-TUI的开源项目此前在开发者社区悄然走红。这是一个运行在终端里的coding agent,具备读写文件、执行Shell命令、搜索网页、管理Git等能力,并通过TUI界面协调多个子智能体进行工作。
DeepSeek-TUI界面,图片来源:DeepSeek-TUI
DeepSeek-TUI的走红,至少说明了两个问题。
第一,DeepSeek模型在开发者心智中,已经具备了支撑代码智能体的坚实基础。否则,社区不会自发地围绕它构建出Claude Code式的产品形态。
第二,DeepSeek目前欠缺的,并非模型的关注度或能力,而恰恰是官方主导的、成体系的Harness层。
在开发者看来,DeepSeek-TUI的吸引力非常直接:成本相对较低、国内访问顺畅、上下文长度充足、部署门槛也不算太高。事实上,国内许多开发者并非不想使用Claude Code,而是受限于价格、访问稳定性、账号体系以及企业合规要求等因素。
然而,社区项目天然存在边界。一个第三方开源项目无论多么活跃,都很难真正掌握模型内部能力的演化节奏;它可以围绕现有API做适配优化,但无法反向决定模型该如何训练与迭代;它可以尽力优化提示词、工具链和交互设计,却很难将海量真实任务反馈,系统性地注入到模型改进的闭环中。
而这,正是官方亲自下场打造Harness的核心意义所在。
DeepSeek自己做Code Harness,拥有几个社区项目难以比拟的优势:与模型团队的深度协作、对接口设计的绝对主导权、构建训练数据闭环的能力、接触内部真实任务场景的便利,以及对开发者生态进行长期、系统运营的实力。
开源社区已经用实际行动,为DeepSeek踩出了一条清晰的路:市场确实需要一个DeepSeek版本的Claude Code。现在,DeepSeek要做的是将这条社区踩出的“小路”,收归并升级为一条由自己主导的“主干道”。
此次启动招聘,意味着DeepSeek终于准备亲自下场,将战略重心向产品化与生态构建倾斜。
其实,陈德里在去年11月的乌镇世界互联网大会上就曾提到:“我们公司的一个核心优势就是长期主义,坚持做前沿智能突破这条主线。而在这个过程中,我们也舍弃了很多支线上的事情,不做那些短平快的支线事情。”
如今看来,模型层面的战争远未结束,但真正的Agent战争序幕已经拉开。DeepSeek这一次要补强的,正是从强大的“模型大脑”到高效的“智能体行动”之间,那层最关键的中枢——Harness。
DeepSeek,正在为自己的超级模型,装上那双可以改变&现实世界的“手”。
(封面图来源:AI生成)






