文章

harness概念简介

harness概念简介

harness概念简介

本文梳理 「Harness」一词在工程语境下的多义性,并结合 OpenAI 提出的 Harness Engineering、社区学习资料与若干开源项目,勾画 AI 编程时代「驭缰工程」相关脉络与延伸阅读方向。

先分清:两个常见的「Harness」

含义典型代表说明
智能体驭缰 / 约束工程OpenAI 文章、deusyu/harness-engineering、Harness Books、OpenHarness、revfactory/harness讨论的是:人类如何设计环境、规则与反馈回路,让代码智能体可靠工作
CI/CD 与 DevOps 平台(产品名同名)harness/harness开源端到端开发平台:代码托管、流水线、Gitspaces、制品库等;与「智能体 harness」是同名不同领域(可参考 deusyu 仓库中「云原生 Harness.io」脉络作对照)。

检索资料时若只用关键词 harness,容易把 DevOps 平台Agent Harness 混在一处;下文除特别说明外,harness 工程均指 智能体侧的约束与编排体系


一、范式层:Harness Engineering(驭缰工程)

OpenAI 将 Harness Engineering 概括为:工程师的产出从「手写代码」转向「设计约束系统」——通过 AGENTS.md、架构规则、自定义 linter、反馈回路等,让智能体在仓库内可持续、可纠错地执行任务。

一句话对比:

1
2
传统工程:人类写代码 → 机器执行代码
Harness Engineering:人类设计约束 → 智能体写代码 → 机器执行代码

社区项目 deusyu/harness-engineering 将原文拆解为 六大核心概念(仓库即真相、地图而非手册、机械化执行、智能体可读性、吞吐量改变合并理念、熵管理与垃圾回收),并整理 Ralph 循环 等实战模式与翻译、参考文献,适合作为 从概念到实践的索引型学习库


二、理念层:系统化叙述(Harness Books)

wquguru/harness-books 以两本书讨论同一问题:当会写代码的模型被放进终端、仓库、权限与团队协作流程之后,靠什么让整体系统有界、连续且能对后果负责

核心主张包括:harness 讨论的是 约束结构如何组织执行;提示、工具、权限、状态、恢复、验证与团队规范,不是系统的「配件」,而是同一套控制结构中的器官

  • 第一册:以 Claude Code 为观察对象,讲运行时结构(控制面、Query Loop、权限、上下文治理、错误恢复、多智能体验证等)。
  • 第二册:Claude Code 与 Codex 并排对比,讨论控制面差异与自建 harness 时可优先学习的层次。

在线阅读:https://harness-books.agentway.dev/en/


三、运行时与产品:OpenHarness / ohmo

HKUDS/OpenHarness 提供偏 轻量的智能体基础设施:工具调用、Skills、记忆、多智能体协同等;其上的 ohmo 定位为 内置个人助理型智能体(飞书/Slack/Telegram 等接入,分支、写码、测、提 PR 等长会话任务),强调在现有 Claude Code 或 Codex 订阅上运行等特性。

文档中常用 oh 命令 拉起 OpenHarness,并与 OpenClaw、nanobot、Cursor 等 CLI 生态集成,体现「一套 Harness 底座 + 多种上层入口」的路线。


四、生成层:把「领域一句话」变成智能体编队(revfactory/harness)

revfactory/harness 面向 Claude Code,是一个 Meta-Skill / 插件:通过自然语言(如 “build a harness for this project”)把领域描述转成 智能体团队架构对应 Skills,内置多种团队模式(Pipeline、Fan-out/Fan-in、Expert Pool、Producer-Reviewer、Supervisor、层级委派等),并带有演进机制(如 /harness:evolve 把实录与初始架构的 差分 反馈回工厂)。

在生态分层叙述上,该项目自定位为 「团队架构工厂」(L3 Meta-Factory 的一类),与侧重确定性运行时配置的 Archon、侧重 Codex 运行时的 meta-harness 等形成 互补而非简单替代

  • 安装示例:/plugin marketplace add revfactory/harness,再 /plugin install harness@harness
  • 要求:需启用 Agent Teams 等 Claude Code 实验能力(见项目 README)。

五、自治演进:AutoAgent(元智能体改 harness)

kevinrgu/autoagent 的口号接近 「自动科研,但对象是 agent engineering」:人类主要编辑 program.md(目标与元智能体指令),由元智能体在夜间迭代修改 agent.py(单文件 harness:配置、工具、编排等),对接 Harbor 格式的评测任务,以 benchmark 分数 为优化目标,保留高分变更、丢弃低分变更。

体现的趋势是:** harness 不仅是手写静态规则,也可以是「评测闭环驱动的自我迭代」**,与 Ralph / 机械化门禁等思路可对照阅读。


参考链接汇总

项目地址侧重
Harness Engineering 学习指南https://github.com/deusyu/harness-engineeringOpenAI 范式拆解、Ralph、译文与文献
Harness Bookshttps://github.com/wquguru/harness-books两册设计理念与 Claude/Codex 对比
OpenHarnesshttps://github.com/HKUDS/OpenHarness轻量底座与 ohmo
Harness(Claude Code 插件)https://github.com/revfactory/harness团队架构工厂、六种模式
AutoAgenthttps://github.com/kevinrgu/autoagentHarbor 评测驱动的元智能体迭代
Harness Open Source(DevOps 平台)https://github.com/harness/harnessCI/CD 与代码托管等同名不同义
本文由作者按照 CC BY 4.0 进行授权