Harness Engineering(驾驭工程)
2026 年初兴起的 AI 工程新范式,关注如何让 Agent 可靠、持续、不失控地运行。
核心理念
“Agent = Model + Harness。模型是引擎,Harness 是缰绳、护栏和高速公路。”
Harness Engineering 不试图让模型"变聪明",而是通过工程手段,让一个"已经很聪明但不可预测"的模型在约束和反馈中稳定工作。
范式演进
| 阶段 | 时间 | 核心问题 | 类比 |
|---|---|---|---|
| Prompt Engineering | 2023-2024 | 如何让模型理解你的意图 | 对马喊话的技巧 |
| Context Engineering | 2025 | 如何给模型正确的知识边界 | 给马看地图 |
| Harness Engineering | 2026- | 如何让 Agent 可靠、持续、不失控 | 造高速公路,配护栏和限速牌 |
六大支柱
1. 上下文架构 🗺️
精准设计进入模型上下文的信息。研究表明,当上下文窗口利用率超过 40% 时,模型推理质量显著下滑。
关键技术:
- 四级压缩管道:Snip Compact → Micro Compact → Context Collapse → Auto Compact
- 分层记忆系统:PROJECT.md → memdir/ → Session 记忆 → Repo 级知识
- 按需注入:技能系统通过 SkillTool 按需发现和注入
2. 架构约束 ⛓️
用代码和工具强制执行规则,而非依赖 prompt 的"软约束"。
关键技术:
- Fail-Closed 默认值:
isConcurrencySafe默认false,isReadOnly默认false - 五层权限纵深防御:Deny Rules → Tool-level Permissions → Generic Rules → Permission Mode → Auto Classifier
3. 自验证循环 🔄
在执行流程中内置验证检查点,防止死循环与静默失败。
关键技术:
query()循环的 16 个步骤中,只有 1 个是"调用模型"transition字段记录"为什么继续",形成可断言的状态机
4. 上下文隔离 🧊
多 Agent 协作时保持每个 Agent 的上下文纯净。
关键技术:
- 进程级隔离:子 Agent 拥有独立的上下文窗口和 AbortController
- 通信接口化:通过 SendMessageTool 传递结构化消息
- Coordinator 模式:控制面/数据面分离
5. 熵治理 ♻️
对抗系统状态的自然熵增。
关键技术:
- 上下文蒸馏:
/compact+ Auto Compact - 知识沉淀:
memdir/持久化写入 - 后台整合:AutoDream 梦境系统
6. 可拆卸性 🔌
模块化设计,使 Harness 能随模型迭代优雅适配。
关键技术:
- 依赖注入:
QueryDeps只有 4 个字段 - Skills = Markdown:零代码门槛,不绑定模型
- MCP 标准协议:外部工具通过 Model Context Protocol 接入
性能工程
| 技术 | 节省时间 | 实例 |
|---|---|---|
| Fast Path | ~100ms | --version 零导入直接退出 |
| 并行预取 | ~65ms | MDM + Keychain + GrowthBook 并行 |
| 延迟加载 | ~1.1MB | OTel + gRPC 按需 import |
| 编译时 DCE | 整个代码块 | feature() + Bun bundler |
| API 预连接 | ~50ms | TLS 预握手 |
与相关概念的关系
- [[deep-agents]] — Harness Engineering 是构建深度代理的基础设施
- [[agent-tool-design]] — 工具设计是 Harness 的核心组成部分
- [[context-engineering]] — Harness Engineering 的演进形态
- [[multi-agent-coordination]] — 多 Agent 协调需要 Harness 提供隔离和通信机制
引用
“Agent 的每一次失败,都是环境设计不完善的信号。正确的回应不是换更强的模型,而是重新设计它运行的环境。” — Cassie Kozyrkov
“LangChain 做了一个实验:同一个模型,仅改变外部 Harness,TerminalBench 排名从第 30 跃升到第 5。瓶颈从来不在模型智能,而在基础设施。” — LangChain Blog, 2026