AI Agent核心概念完整权威深度全攻略:模型、工具、技能与Harness工程实践详解
在人工智能领域,Agent无疑是近两年最热门且最容易被误解的概念。
模型开发者、产品经理、应用工程师都在谈论Agent。但核心问题是,不同人口中的“Agent”很可能指向完全不同的东西。
有人将“能调用外部工具的大模型”称为Agent,有人把“驱动模型执行整个流程的系统”叫做Agent,还有人将“负责特定子任务的独立模块”也称为Agent。初学者很容易陷入困惑——并非缺乏资料,而是术语纷杂,且各方定义并不统一。
近期,Hugging Face发布了一份AI Agent术语表,系统梳理了当前讨论中高频出现的核心概念。无论你正在构建Agent、部署Agent,还是日常使用Claude Code、Codex、Hermes Agent等工具,这些术语几乎都会反复出现。
术语表原文地址:https://huggingface.co/blog/agent-glossary
一、核心认知:Agent并非模型
用一句话快速理解AI Agent:
AI Agent是以大模型为中枢,能调用工具、接收反馈并持续执行任务的完整系统。
关键不在于“生成回复”,而在于“持续达成目标”。
传统聊天模型是“一问一答”的被动响应;Agent则是“给定目标,拆解任务,执行后根据反馈继续推进”的主动循环。
以下任务无法通过单次回复完成:
- 搜索并整理资料为摘要
- 读取文件并分析其内容
- 调用代码工具进行数据处理
- 在网页上执行一连串操作
这正是Agent与传统聊天模型的本质差异。
二、模型与Agent:究竟有何区别?
初学者最常问的问题:Agent和模型是同一回事吗?答案是:否。
模型是Agent的核心组件,但并非Agent的全部。
模型本质上是“文本输入,文本输出”的处理器。它不具备跨步骤的记忆,也无法自主执行循环。虽然模型能根据目标、上下文和规则表达出“下一步调用某个工具”的意图,但实际执行点击网页、读取文件、调用API或运行工具等操作,仍需依靠模型外部的系统。
三、Scaffolding与Harness:各自负责什么?
这两个术语常被混为一谈,统称为“Agent框架”。但若要深入理解Agent系统,必须明确区分。
一句话概括:
Scaffolding负责“思考逻辑”,Harness负责“执行调度”。
Context Engineering与Policy:输入管理 vs 行为定义
这两个概念常被并列讨论,因为它们共同决定Agent的下一步行动。但本质不同:Context Engineering控制模型每一步所见的内容,Policy则决定模型在这些输入下采取的行为模式。
Context Engineering:控制模型每一步的可见信息
若说Prompt Engineering关注“提示词如何构建”,那么Context Engineering则聚焦:在Agent执行每一步时,模型应当接收哪些信息。
涉及系统提示词、工具描述、对话历史、检索知识以及工具返回结果。这不是一次性配置——随着任务推进,harness动态决定保留、丢弃或重新注入哪些信息。
Context Engineering在训练和推理阶段均适用,但代价不同。训练时输入错误会导致模型学偏;推理时输入错误通常可通过调整提示词或上下文再次尝试。
Policy:定义Agent的选择逻辑
Policy指Agent遵循的行为策略:在特定情境下,它如何在多个可能的动作中进行选择。
在强化学习中,Policy被严格定义为对各动作的概率分布。在LLM Agent中,策略一部分来自模型权重,另一部分受提示词、工具、记忆和执行循环的影响。
因此,Policy并非Agent本身。Agent是在环境中实际执行动作的完整系统,而Policy是其表现出的行为模式。
Tool、Skill、Sub-agent:三者为何不同?
这三个术语常被混用,实则分别对应动作、方法、分工三个层次。
1. Tool:具体动作
Tool是最底层,指Agent与外部交互的途径,例如API调用、代码解释器、数据库、网页搜索和文件系统。
模型仅以结构化格式表达“调用某工具”的意图;实际执行调用路由、获取结果并驱动循环的是harness。
因此,Tool好比Agent的“双手”。
2. Skill:可复用的方法论
Skill并非单一动作,而是围绕特定目标积累的完整执行方法。
例如“调试一个Bug”、“执行数据清洗”、“撰写市场调研摘要”,这些任务无法通过单次工具调用完成,通常需要一系列步骤、经验积累和稳定流程。
因此,Skill好比Agent的“战术模板”。
3. Sub-agent:独立完成子任务的Agent
Sub-agent更高级。它并非被动工具或固定方法,而是能自主思考、调用工具、独立处理子任务的另一个Agent。
例如,主Agent接到“撰写行业分析报告”任务后,可拆分为:Sub-agent负责资料收集、Sub-agent处理数据整理、Sub-agent撰写初稿,最后统一整合输出。
因此,Sub-agent相当于Agent的“分身”。
为何训练Agent时频繁提及Environment、Rollout、Reward和Trainer?
以上聚焦Agent的构建。下面这些术语则多出现在“Agent训练优化”阶段。
Environment
Environment是Agent与之交互的环境,可以是浏览器、文件系统、代码仓库,或更抽象的虚拟空间。Agent在环境中执行动作,环境返回新状态和结果。
Rollout
Rollout指Agent从启动到结束完成一次任务的完整历程,记录其观测、动作及最终结果。
Reward
Reward是对执行结果的评分,反馈系统任务完成质量、正确与错误环节。分数可源自测试通过与否、人工偏好或其他评估机制。
Trainer
Trainer利用大量rollout和reward数据更新模型,使Agent在反复试错中习得更优策略。
因此,训练阶段的Agent不仅关注“能否调用工具”,更在于“能否在环境中持续进化”。
结语:用文字版概念图总结
简而言之,AI Agent并非单一的新模型名词,而是一套围绕模型构建的完整系统:模型负责理解与决策,工具负责执行动作,执行系统驱动任务循环推进。
厘清这些概念后,再审视各类Agent产品、框架和论文,就不会轻易混淆。





