OpenHarness测评:港大开源AI Agent框架的轻量级优势解析
香港大学数据智能实验室(HKUDS)近期开源了OpenHarness,一个仅用约1.2万行纯Python代码实现的轻量级AI Agent框架。该项目精准复现了Claude Code近98%的核心工具能力,为寻求强大工作流但拒绝框架臃肿的开发者提供了一个高效、简洁的新选择。
OpenHarness是什么
OpenHarness是一个致力于“瘦身”的AI Agent框架,其核心设计目标是在保留强大功能的同时,实现极致的轻量与简洁。该项目采用MIT许可证,其架构哲学是“Agent Harness”模式,即将大语言模型的“思考”决策层与“执行”操作层进行清晰分离。模型专注于决定“做什么”,而框架则负责安全、高效地处理“如何做”。
其突出的兼容性是一大亮点。框架不仅完全兼容Anthropic的Skills技能生态与Claude Code的插件格式,更能通过简单的环境变量配置,无缝切换至Kimi、DeepSeek、Ollama等任何兼容OpenAI API的模型端点,实现了真正的模型中立性。
OpenHarness的主要功能
尽管代码精炼,其功能模块却相当完备:
1. 健壮的 Agent 核心循环:集成了流式工具调用、指数退避重试、并行执行等工业级特性,并内置实时Token计数与成本追踪。同时支持上下文自动压缩与“断点续聊”功能,简化长对话管理。
2. 丰富的工具集:内置超过43个工具,覆盖文件I/O、Shell命令、网络搜索、浏览器自动化、MCP协议、Notebook编辑等高频场景,宣称复刻了Claude Code 98%的工具能力。
3. 即插即用的技能系统:技能以Markdown文件形式存在,支持按需加载。完全兼容anthropics/skills官方生态,可直接复用社区上千个现成技能,并利用Pydantic进行严格的类型校验。
4. 持久的记忆与上下文管理:项目启动时自动注入CLAUDE.md中的项目规则,并通过SQLite持久化保存MEMORY.md记忆文件,实现跨会话记忆留存。上下文管理支持模板化,灵活性高。
5. 多 Agent 协调能力:支持创建子Agent并进行任务委派,通过Swarm模式进行团队管理。后台任务的生命周期管理已内置,未来计划集成ClawTeam。
6. 细致的权限治理:提供从宽松到严格的四级权限模式(默认、自动、计划、严格),支持路径级规则、命令白名单及交互式审批对话框。通过预执行和后执行工具钩子,可对敏感操作进行拦截与审计。
7. 高度可扩展的插件系统:兼容claude-code/plugins格式,允许开发者自定义命令、钩子、Agent类以及集成MCP服务器,扩展性极强。
OpenHarness的技术原理
理解其技术架构,便能洞悉其轻量化的根源。
架构设计:Harness 模式:这是核心思想。框架作为“缰绳”,将LLM的智能决策与具体的工具执行、记忆存储、安全边界解耦。这种分离带来了清晰的职责划分与完整的系统可观测性。
核心循环:标准的 ReAct:工作流遵循经典的ReAct模式:LLM输出JSON格式的工具调用指令 → Harness解析并安全执行 → 流式返回结果给LLM。循环持续直至模型决定停止。
模块化子系统:整个框架由超过10个独立的子系统构成,如引擎、工具注册表、技能加载器、权限治理等。各层通过明确定义的接口解耦,这是其保持清晰架构与高可维护性的关键。
轻量级工程实现:这是与Claude Code最直观的差异。它采用纯Python 3.10+编写,总计11,733行代码,仅为Claude Code的1/44。它刻意剔除了企业级应用中常见的遥测、OAuth认证及数百个React组件等“臃肿”部分,仅保留一个可选的React TUI前端,通过标准输入输出与后端通信。
如何使用OpenHarness
上手OpenHarness的流程非常清晰:
- 环境准备:确保Python版本在3.10以上,并通过
pip install uv安装uv包管理器。同时,准备好你的LLM API密钥。 - 安装项目:使用
uv init my-project && cd my-project初始化项目,然后运行uv add "hkuds/openharness[cli]"安装框架和CLI。 - 配置密钥:通过环境变量
export ANTHROPIC_API_KEY=sk-...设置密钥。如需使用Kimi、DeepSeek等其他模型,还需额外设置ANTHROPIC_BASE_URL指向对应端点。 - 初始化项目:运行
oh init,它会自动生成CLAUDE.md(项目规则)和MEMORY.md(记忆文件)的模板。 - 启动与体验:使用
oh run --model claude-3.5-sonnet开始交互,或用oh demo快速体验演示任务。 - 扩展使用:将.md技能文件放入指定目录即可自动加载;通过
--permissions strict参数开启严格管控模式;在Swarm模式下进行多Agent任务委派。
OpenHarness的项目地址
- GitHub仓库:https://github.com/HKUDS/OpenHarness
OpenHarness的核心优势
综合评估,OpenHarness的优势集中在以下几个方面:
- 极致轻量:44倍的代码压缩比是其最大亮点,大幅降低了阅读源码、二次开发和学习Agent原理的门槛。
- 生态兼容:几乎无缝对接Claude Code的工作流和技能生态,对于已有相关经验的开发者而言迁移成本极低。
- 模型中立:不绑定任何特定厂商,通过一个环境变量即可切换后端模型,提供了极大的灵活性。
- 开箱即用的安全:内置多层权限治理和交互确认机制,在本地运行时可以设定严格模式,安全性更高。
- 测试完备:包含114个单元测试和6个端到端测试套件,这在开源AI Agent项目中难能可贵,为代码质量提供了坚实保障。
OpenHarness的关键信息和使用要求
在决定采用前,需要明确几个关键点:
- 项目状态:由香港大学数据智能实验室于2026年4月初开源,当前版本为v0.1.0,处于早期但活跃的开发阶段。
- 技术栈:强制要求Python 3.10+和uv包管理器,不支持传统的pip直接安装。
- 模型配置:虽然支持多模型,但配置上统一使用
ANTHROPIC_*系列环境变量来指向不同的端点,需要稍加适应。 - 网络要求:部分工具如网络搜索需要联网,但若完全使用本地模型(如Ollama),核心功能可离线运行。
OpenHarness的同类竞品分析
要看清OpenHarness的定位,最好的方式是与当前主流方案进行对比。
| 对比维度 | OpenHarness (港大 HKUDS) | Claude Code (Anthropic) | OpenClaw (开源社区) |
|---|---|---|---|
| 开发方 | 香港大学数据智能实验室 (HKUDS) | Anthropic (AI 独角兽公司) | 原 Clawdbot 团队/开源社区 |
| 发布时间 | 2026 年 4 月 1 日 | 2025 年 2 月 (v2.1+ 持续迭代) | 2025 年 11 月 (Clawdbot) → 2026 年 1 月 (OpenClaw) |
| 代码规模 | 11,733 行 (Claude Code 的 1/44) | 512,000+ 行 TypeScript | 430,000+ 行 Node.js |
| 编程语言 | Python 3.10+ | TypeScript (Bun 运行时) | TypeScript/Node.js |
| 开源许可 | MIT | 闭源 (2026.3.31 曾意外泄露源码) | MIT |
| 架构设计 | Agent Harness 模式:智能层与执行层分离,扁平模块化子系统 | 多层治理架构:Agent 循环 + 上下文压缩 + 权限控制平面 | 三层 Hub-and-Spoke:Gateway + Channel + LLM 层 |
| 模型支持 | 任意 OpenAI 兼容端点 (Kimi/DeepSeek/Ollama) | 仅 Anthropic 模型 (Claude 4.6/Opus) | 多模型 (Claude/GPT/本地模型) |
| 工具能力 | 43 个工具 (复刻 Claude Code 98%) | 40+ 工具 + 85 个斜杠命令 | 内置工具 + 13,729+ ClawHub 技能 |
| 记忆机制 | CLAUDE.md + MEMORY.md 跨会话持久化 |
三层压缩 (Micro/Auto/Full) + Kairos 永久记忆 (泄露版) | SOUL.md 人格定义 + Markdown 记忆 |
| 多 Agent 支持 | Swarm 模式子 Agent 委派 (Asyncio) | Coordinator 模式 (泄露功能) + 子 Agent 工具 | 异步多 Agent 工作流 + OpenClaw-RL 强化学习 |
| 扩展方式 | Skills (Markdown) + Plugins + MCP | Skills + Plugins + MCP + 108 个内部 Feature Flags | Skills (ClawHub) + 50+ 通讯频道 |
| 前端交互 | React TUI (可选,后端可独立运行) | React + Ink 终端 UI (紧耦合) | WebChat + Control UI + 多平台 Bot |
| 部署模式 | 本地 CLI / 容器 | 终端 CLI / 企业托管 | 自托管 Gateway (Port 18789) / VPS |
| 安全治理 | 四级权限模式 + Hooks + 路径规则 | 六级权限模式 + 沙箱 + 分类器模型审核 | 基础沙箱 + 手动审批 (NanoClaw 提供强化版) |
| 目标用户 | AI 研究者、独立开发者、多 Agent 团队 | 专业开发者、企业团队 | 隐私优先用户、自动化需求者 |
| 成熟度 | v0.1.0 早期 (1,300 Stars) | 生产级 (数百万用户) | 250,000+ Stars,生态庞大 |
从对比中可以看出,OpenHarness在“轻量”、“灵活”和“学习成本”上找到了一个独特的平衡点,尤其适合希望深入Agent内部机制,或需要高度定制化、模型无关解决方案的开发者。
OpenHarness的应用场景
基于其特性,OpenHarness能在多个场景中发挥价值:
- AI Agent 研究与原型开发:其精简的代码库是研究Agent核心机制(如工具调用、记忆、多Agent协调)的理想沙盒,避免了从数十万行企业级代码中抽丝剥茧的复杂性。
- 本地私有化智能助手:结合Ollama等本地模型,可在完全离线环境中部署功能强大的代码助手,满足金融、医疗等行业对数据隐私的严苛要求。
- CI/CD 自动化流水线:其无头模式能输出结构化JSON,非常适合集成到GitHub Actions等CI/CD流程中,自动执行代码审查、生成测试用例或更新文档。
- 多 Agent 协作系统:Swarm模式使得构建能分解复杂任务、并行执行的智能团队成为可能,适用于竞品分析、多源信息调研等场景。
- 技能驱动的领域专用工具:通过加载现成或自建的Markdown技能,可快速打造精通特定领域(如数据分析、DevOps)的专属助手。
- 开发者 CLI 工作流增强:直接嵌入终端工作流,用自然语言替代复杂的Shell命令,处理文件批量操作、代码重构等日常开发任务,提升效率。
OpenHarness的出现,为AI Agent领域提供了一个“小而美”的新选项。它未必适合所有场景,但对于追求可控性、轻量化和模型自由的开发者及研究者而言,无疑是一个值得投入时间探索的框架。