Harness Engineering（驾驭工程）

2026 年初兴起的 AI 工程新范式，关注如何让 Agent 可靠、持续、不失控地运行。

核心理念

“Agent = Model + Harness。模型是引擎，Harness 是缰绳、护栏和高速公路。”

Harness Engineering 不试图让模型"变聪明"，而是通过工程手段，让一个"已经很聪明但不可预测"的模型在约束和反馈中稳定工作。

范式演进

阶段	时间	核心问题	类比
Prompt Engineering	2023-2024	如何让模型理解你的意图	对马喊话的技巧
Context Engineering	2025	如何给模型正确的知识边界	给马看地图
Harness Engineering	2026-	如何让 Agent 可靠、持续、不失控	造高速公路，配护栏和限速牌

六大支柱

1. 上下文架构 🗺️

精准设计进入模型上下文的信息。研究表明，当上下文窗口利用率超过 40% 时，模型推理质量显著下滑。

关键技术：

四级压缩管道：Snip Compact → Micro Compact → Context Collapse → Auto Compact
分层记忆系统：PROJECT.md → memdir/ → Session 记忆 → Repo 级知识
按需注入：技能系统通过 SkillTool 按需发现和注入

2. 架构约束 ⛓️

用代码和工具强制执行规则，而非依赖 prompt 的"软约束"。

关键技术：

Fail-Closed 默认值：isConcurrencySafe 默认 false，isReadOnly 默认 false
五层权限纵深防御：Deny Rules → Tool-level Permissions → Generic Rules → Permission Mode → Auto Classifier

3. 自验证循环 🔄

在执行流程中内置验证检查点，防止死循环与静默失败。

关键技术：

query() 循环的 16 个步骤中，只有 1 个是"调用模型"
transition 字段记录"为什么继续"，形成可断言的状态机

4. 上下文隔离 🧊

多 Agent 协作时保持每个 Agent 的上下文纯净。

关键技术：

进程级隔离：子 Agent 拥有独立的上下文窗口和 AbortController
通信接口化：通过 SendMessageTool 传递结构化消息
Coordinator 模式：控制面/数据面分离

5. 熵治理 ♻️

对抗系统状态的自然熵增。

关键技术：

上下文蒸馏：/compact + Auto Compact
知识沉淀：memdir/ 持久化写入
后台整合：AutoDream 梦境系统

6. 可拆卸性 🔌

模块化设计，使 Harness 能随模型迭代优雅适配。

关键技术：

依赖注入：QueryDeps 只有 4 个字段
Skills = Markdown：零代码门槛，不绑定模型
MCP 标准协议：外部工具通过 Model Context Protocol 接入

性能工程

技术	节省时间	实例
Fast Path	~100ms	`--version` 零导入直接退出
并行预取	~65ms	MDM + Keychain + GrowthBook 并行
延迟加载	~1.1MB	OTel + gRPC 按需 import
编译时 DCE	整个代码块	`feature()` + Bun bundler
API 预连接	~50ms	TLS 预握手

与相关概念的关系

[[deep-agents]] — Harness Engineering 是构建深度代理的基础设施
[[agent-tool-design]] — 工具设计是 Harness 的核心组成部分
[[context-engineering]] — Harness Engineering 的演进形态
[[multi-agent-coordination]] — 多 Agent 协调需要 Harness 提供隔离和通信机制

引用

“Agent 的每一次失败，都是环境设计不完善的信号。正确的回应不是换更强的模型，而是重新设计它运行的环境。” — Cassie Kozyrkov

“LangChain 做了一个实验：同一个模型，仅改变外部 Harness，TerminalBench 排名从第 30 跃升到第 5。瓶颈从来不在模型智能，而在基础设施。” — LangChain Blog, 2026