AI Agent五大核心形态解析：YC投资视角下的趋势与机遇

2026-05-20阅读 0热度 0

AI Agent的发展已跨越了简单指令执行阶段，进入复杂工作流构建的新纪元。核心挑战不再是“模型能否执行任务”，而是“如何将AI能力转化为可复用、可迭代的流程资产”。

从Garry Tan的GBrain等前沿实践中，一套清晰的架构范式正在浮现。这一范式也映射了Codex、Claude Code、Hermes等工具在深度应用中的自然演进路径，其核心可归结为五种关键形态，共同构建起新一代的“流程智能”。

Skills：从固定流程到参数化「方法」

Skills是大多数人最直接的切入点。它类似于标准作业程序，但更精确的理解是将其视为一个“方法调用”。

在编程中，方法调用意味着用不同的参数反复执行同一段核心逻辑。一个设计优良的Skill遵循同样的原则：其内部工作流是固定的，变化的是外部输入的参数——目标、问题或数据集。例如，一个名为 /investigate 的Skill，其七步研究框架保持不变，但当参数指向生物科技案例时，它执行行业分析；指向SEC备案文件时，它则转为合规审查。

这超越了传统SOP。传统SOP通常与单一场景深度耦合，而Skill实现了更高层级的抽象。一套流程能解决一类问题，将具体情境从流程定义中剥离，交由参数动态决定。实际应用中，Skills的形态光谱很宽，一端接近固定SOP，另一端则更贴近纯粹的函数调用。

Thin Harness：为智能体赋予“行动力”

大模型提供了认知与推理能力，而像Claude Code、Codex CLI这类Harness（执行框架），则赋予了模型与环境交互的“行动力”。它们负责循环控制、文件操作、上下文管理与安全边界，其核心代码通常非常精简。

一个常见的陷阱是不断向Harness中堆砌功能。工具定义越来越多，MCP服务器持续增加，最终导致上下文窗口被大量无关描述占据。模型开始困惑于工具选择，响应延迟增加，准确性下降，陷入“上下文腐化”的困境。

Resolvers：通过精确路由抵御腐化

对抗上下文腐化的根本方案是引入明确的路由机制。Resolver充当一张路由表，将“任务类型X”精确映射到“应调用的Skill Y”。当工具库规模较小时，依赖模型的模糊匹配或许可行；但当Skill数量膨胀至上百个，基于明确规则的路由就变得不可或缺。

类似的“审计-路由”结构也可应用于文件系统。通过另一张路由表，决定Skill的输出应持久化到哪个具体路径，确保结果稳定落地，而非依赖模型的临时决策。

与之配套的，是建立“Skill化”的质量闭环——将一次性操作转化为可长期运行的基础设施。典型流程包括：契约定义、在关键环节引入确定性代码、单元与集成测试、LLM-as-judge评估、更新Resolver路由条目、审计脚本以及端到端测试。一个简单的验收标准是：如果同一个问题需要向模型询问两次，那么这个流程就尚未成功。

Latent vs. Deterministic：清晰的责任分层

必须清晰界定：哪些工作应交由LLM处理，哪些应交由确定性系统执行。LLM擅长判断、综合、模式识别与理解潜台词；但在算术、组合优化，或任何要求输出绝对一致的任务上，它并非合适选择。LLM本质是概率性的。

一个普遍的盲点是低估确定性层的价值。非技术背景的实践者容易倾向于将所有任务抛给模型。关键在于培养一种工程纪律：始终追问，这件事能否用代码稳定、低成本地完成？如果可以，就应该引导模型生成这段代码，并将其固化下来。

Memory：构建持续进化的知识基石

一个真正有用的系统必须具备记忆能力。目前业界探索了多种形态：向量嵌入、语义检索、知识图谱或混合存储。一种简洁高效的实践是使用Markdown文件夹作为基础记忆层。

例如，为每个客户、每个项目、每个核心概念建立独立的Markdown页面。页面顶部是“当前可信结论”，随着新证据不断重写更新；底部则是一条只追加、不覆盖的审计时间线。

选择Markdown带来了多重优势：文件本身就是主记录，人类可直接查看与编辑，Agent会自动同步变更；同时，类型化关系可以通过正则表达式在写入时自动抽取，从而在不消耗额外算力的情况下构建起知识图谱。当然，具体结构需要根据实际业务场景进行定制。

在此基础之上，可以构建自动化的信号探测器与维护流程。例如，当某个实体被频繁提及后触发信息补全，或在夜间运行“维护循环”扫描对话记录、更新过时信息、修复断裂的引用。文本作为基础层，其上的所有功能增强都变得成本低廉且高度可组合。

从工具到壁垒：流程能力即核心护城河

不同的构建者独立地收敛到类似的结构，这本身就是一个强烈的信号：这种架构模式具备普适的工程价值。尽管具体实现存在差异，但其总体框架正被反复验证。

这引出了一个更本质的议题：在AI时代，如何构建可持续的竞争优势？

基于模糊指令快速搭建的原型固然令人兴奋，但任何能通过一次性提示词生成的东西，其长期均衡价格最终都会趋近于生成它所消耗的Token成本——几乎可以忽略不计。竞争会迅速抹平这种技术红利。

真正可持续的，是“流程能力”。借鉴Hamilton Helmer在《7 Powers》中的框架，企业维持超额利润的能力源于七种结构性力量。对于大多数中小企业和初创公司而言，规模经济、网络效应、转换成本、独占资源和品牌这五道门槛通常难以跨越。反定位的机会更是可遇不可求。

于是，最切实的路径便落在了流程能力上。而一个设计精良的AI系统，恰恰是锻造这种能力的理想熔炉。它与建立高质量SOP或开发专有软件一脉相承：流程被编码，任务被参数化，底层系统稳定可靠，记忆层持续沉淀知识。这极大地放大了“服务产品化”的潜力——你能以更低的边际成本或更高的交付质量提供服务，因为整个工作流已被彻底工程化。

设想一位会计师构建了这样的系统。记忆层是每位客户的Markdown档案；Skill层是参数化的年终审计、季度税务预估、合规审查流程；确定性层包含了所有税表模板与历史文件库；还有夜间自动运行的异常洞察与更新机制。

于是，她可以收取合理的专业溢价，服务更多客户，而竞争对手难以复制。因为真正的壁垒并非那些Markdown文件本身，而是文件背后所承载的、经年累月迭代与优化而成的深度流程知识。这种优势，从系统运行的第一天起就在持续积累，最终内化为坚固的竞争护城河。