Harness Engineering(驾驭工程)

2026 年初兴起的 AI 工程新范式,关注如何让 Agent 可靠、持续、不失控地运行。

核心理念

“Agent = Model + Harness。模型是引擎,Harness 是缰绳、护栏和高速公路。”

Harness Engineering 不试图让模型"变聪明",而是通过工程手段,让一个"已经很聪明但不可预测"的模型在约束和反馈中稳定工作。

范式演进

阶段 时间 核心问题 类比
Prompt Engineering 2023-2024 如何让模型理解你的意图 对马喊话的技巧
Context Engineering 2025 如何给模型正确的知识边界 给马看地图
Harness Engineering 2026- 如何让 Agent 可靠、持续、不失控 造高速公路,配护栏和限速牌

六大支柱

1. 上下文架构 🗺️

精准设计进入模型上下文的信息。研究表明,当上下文窗口利用率超过 40% 时,模型推理质量显著下滑。

关键技术

  • 四级压缩管道:Snip Compact → Micro Compact → Context Collapse → Auto Compact
  • 分层记忆系统:PROJECT.md → memdir/ → Session 记忆 → Repo 级知识
  • 按需注入:技能系统通过 SkillTool 按需发现和注入

2. 架构约束 ⛓️

用代码和工具强制执行规则,而非依赖 prompt 的"软约束"。

关键技术

  • Fail-Closed 默认值:isConcurrencySafe 默认 falseisReadOnly 默认 false
  • 五层权限纵深防御:Deny Rules → Tool-level Permissions → Generic Rules → Permission Mode → Auto Classifier

3. 自验证循环 🔄

在执行流程中内置验证检查点,防止死循环与静默失败。

关键技术

  • query() 循环的 16 个步骤中,只有 1 个是"调用模型"
  • transition 字段记录"为什么继续",形成可断言的状态机

4. 上下文隔离 🧊

多 Agent 协作时保持每个 Agent 的上下文纯净。

关键技术

  • 进程级隔离:子 Agent 拥有独立的上下文窗口和 AbortController
  • 通信接口化:通过 SendMessageTool 传递结构化消息
  • Coordinator 模式:控制面/数据面分离

5. 熵治理 ♻️

对抗系统状态的自然熵增。

关键技术

  • 上下文蒸馏:/compact + Auto Compact
  • 知识沉淀:memdir/ 持久化写入
  • 后台整合:AutoDream 梦境系统

6. 可拆卸性 🔌

模块化设计,使 Harness 能随模型迭代优雅适配。

关键技术

  • 依赖注入:QueryDeps 只有 4 个字段
  • Skills = Markdown:零代码门槛,不绑定模型
  • MCP 标准协议:外部工具通过 Model Context Protocol 接入

性能工程

技术 节省时间 实例
Fast Path ~100ms --version 零导入直接退出
并行预取 ~65ms MDM + Keychain + GrowthBook 并行
延迟加载 ~1.1MB OTel + gRPC 按需 import
编译时 DCE 整个代码块 feature() + Bun bundler
API 预连接 ~50ms TLS 预握手

与相关概念的关系

  • [[deep-agents]] — Harness Engineering 是构建深度代理的基础设施
  • [[agent-tool-design]] — 工具设计是 Harness 的核心组成部分
  • [[context-engineering]] — Harness Engineering 的演进形态
  • [[multi-agent-coordination]] — 多 Agent 协调需要 Harness 提供隔离和通信机制

引用

“Agent 的每一次失败,都是环境设计不完善的信号。正确的回应不是换更强的模型,而是重新设计它运行的环境。” — Cassie Kozyrkov

“LangChain 做了一个实验:同一个模型,仅改变外部 Harness,TerminalBench 排名从第 30 跃升到第 5。瓶颈从来不在模型智能,而在基础设施。” — LangChain Blog, 2026