AI Agent核心概念完整权威深度全攻略：模型、工具、技能与Harness工程实践详解

2026-06-20阅读 0热度 0

Model

在人工智能领域，Agent无疑是近两年最热门且最容易被误解的概念。

模型开发者、产品经理、应用工程师都在谈论Agent。但核心问题是，不同人口中的“Agent”很可能指向完全不同的东西。

有人将“能调用外部工具的大模型”称为Agent，有人把“驱动模型执行整个流程的系统”叫做Agent，还有人将“负责特定子任务的独立模块”也称为Agent。初学者很容易陷入困惑——并非缺乏资料，而是术语纷杂，且各方定义并不统一。

近期，Hugging Face发布了一份AI Agent术语表，系统梳理了当前讨论中高频出现的核心概念。无论你正在构建Agent、部署Agent，还是日常使用Claude Code、Codex、Hermes Agent等工具，这些术语几乎都会反复出现。

术语表原文地址：https://huggingface.co/blog/agent-glossary

一、核心认知：Agent并非模型

用一句话快速理解AI Agent：

AI Agent是以大模型为中枢，能调用工具、接收反馈并持续执行任务的完整系统。

关键不在于“生成回复”，而在于“持续达成目标”。

传统聊天模型是“一问一答”的被动响应；Agent则是“给定目标，拆解任务，执行后根据反馈继续推进”的主动循环。

以下任务无法通过单次回复完成：

搜索并整理资料为摘要
读取文件并分析其内容
调用代码工具进行数据处理
在网页上执行一连串操作

这正是Agent与传统聊天模型的本质差异。

二、模型与Agent：究竟有何区别？

初学者最常问的问题：Agent和模型是同一回事吗？答案是：否。

模型是Agent的核心组件，但并非Agent的全部。

模型本质上是“文本输入，文本输出”的处理器。它不具备跨步骤的记忆，也无法自主执行循环。虽然模型能根据目标、上下文和规则表达出“下一步调用某个工具”的意图，但实际执行点击网页、读取文件、调用API或运行工具等操作，仍需依靠模型外部的系统。

三、Scaffolding与Harness：各自负责什么？

这两个术语常被混为一谈，统称为“Agent框架”。但若要深入理解Agent系统，必须明确区分。

一句话概括：

Scaffolding负责“思考逻辑”，Harness负责“执行调度”。

Context Engineering与Policy：输入管理 vs 行为定义

这两个概念常被并列讨论，因为它们共同决定Agent的下一步行动。但本质不同：Context Engineering控制模型每一步所见的内容，Policy则决定模型在这些输入下采取的行为模式。

Context Engineering：控制模型每一步的可见信息

若说Prompt Engineering关注“提示词如何构建”，那么Context Engineering则聚焦：在Agent执行每一步时，模型应当接收哪些信息。

涉及系统提示词、工具描述、对话历史、检索知识以及工具返回结果。这不是一次性配置——随着任务推进，harness动态决定保留、丢弃或重新注入哪些信息。

Context Engineering在训练和推理阶段均适用，但代价不同。训练时输入错误会导致模型学偏；推理时输入错误通常可通过调整提示词或上下文再次尝试。

Policy：定义Agent的选择逻辑

Policy指Agent遵循的行为策略：在特定情境下，它如何在多个可能的动作中进行选择。

在强化学习中，Policy被严格定义为对各动作的概率分布。在LLM Agent中，策略一部分来自模型权重，另一部分受提示词、工具、记忆和执行循环的影响。

因此，Policy并非Agent本身。Agent是在环境中实际执行动作的完整系统，而Policy是其表现出的行为模式。

Tool、Skill、Sub-agent：三者为何不同？

这三个术语常被混用，实则分别对应动作、方法、分工三个层次。

1. Tool：具体动作

Tool是最底层，指Agent与外部交互的途径，例如API调用、代码解释器、数据库、网页搜索和文件系统。

模型仅以结构化格式表达“调用某工具”的意图；实际执行调用路由、获取结果并驱动循环的是harness。

因此，Tool好比Agent的“双手”。

2. Skill：可复用的方法论

Skill并非单一动作，而是围绕特定目标积累的完整执行方法。

例如“调试一个Bug”、“执行数据清洗”、“撰写市场调研摘要”，这些任务无法通过单次工具调用完成，通常需要一系列步骤、经验积累和稳定流程。

因此，Skill好比Agent的“战术模板”。

3. Sub-agent：独立完成子任务的Agent

Sub-agent更高级。它并非被动工具或固定方法，而是能自主思考、调用工具、独立处理子任务的另一个Agent。

例如，主Agent接到“撰写行业分析报告”任务后，可拆分为：Sub-agent负责资料收集、Sub-agent处理数据整理、Sub-agent撰写初稿，最后统一整合输出。

因此，Sub-agent相当于Agent的“分身”。

为何训练Agent时频繁提及Environment、Rollout、Reward和Trainer？

以上聚焦Agent的构建。下面这些术语则多出现在“Agent训练优化”阶段。

Environment

Environment是Agent与之交互的环境，可以是浏览器、文件系统、代码仓库，或更抽象的虚拟空间。Agent在环境中执行动作，环境返回新状态和结果。

Rollout

Rollout指Agent从启动到结束完成一次任务的完整历程，记录其观测、动作及最终结果。

Reward

Reward是对执行结果的评分，反馈系统任务完成质量、正确与错误环节。分数可源自测试通过与否、人工偏好或其他评估机制。

Trainer

Trainer利用大量rollout和reward数据更新模型，使Agent在反复试错中习得更优策略。

因此，训练阶段的Agent不仅关注“能否调用工具”，更在于“能否在环境中持续进化”。

结语：用文字版概念图总结

简而言之，AI Agent并非单一的新模型名词，而是一套围绕模型构建的完整系统：模型负责理解与决策，工具负责执行动作，执行系统驱动任务循环推进。

厘清这些概念后，再审视各类Agent产品、框架和论文，就不会轻易混淆。