Harness 实战:让 Agent 流水线可信的五层工程骨架
Harness 不是让 Agent 更聪明,而是让 Agent 的工作更可信。本文基于一个真实的 Agent 研发流水线,拆解五层工程化骨架:定义层、运行层、产物层、门禁层、恢复层,以及如何用 workflow-plan.json 把"流程定义"和"运行实例"彻底分开。
Latest Notes
Harness 不是让 Agent 更聪明,而是让 Agent 的工作更可信。本文基于一个真实的 Agent 研发流水线,拆解五层工程化骨架:定义层、运行层、产物层、门禁层、恢复层,以及如何用 workflow-plan.json 把"流程定义"和"运行实例"彻底分开。
深入分析 Claude Code 2.1.156 版本的 Workflow 实现原理。它不是"让模型自己记住步骤",而是一个可编译、可持久化、可恢复的多阶段 Agent 编排引擎。从 SDK 类型定义、二进制字符串痕迹到运行时行为,逐层拆解 workflow 的 DSL 设计、任务注册、phase 调度和恢复机制。
以 Hermes Agent 源码为主线进行深度架构剖析,从运行时形态、工具系统、长期记忆、任务编排、可插拔性、可观测性、安全模型、社区生态八个工程化维度与 OpenClaw 进行结构化对比。面向工程师、架构师和研究者,侧重讲清架构意图与设计取舍。
最近一周在排查 OpenClaw 的 cron 和 delivery 问题时,我越来越确信:Agent 系统最难的不是成功路径,而是失败路径。本文从表面成功、失败语义、边界设计和可观测性四个角度,聊聊为什么 Agent 时代真正稀缺的不是能力,而是值得信任的失败。
从 AI Coding Agent 的落地现实出发,解释 Harness Engineering 为什么会在最近迅速升温。文章从定义、背景、关键能力、与 Tool Calling 的区别,以及它对 Agent 产品竞争格局的影响几个角度展开,讨论为什么当模型能力逐渐拉平后,真正决定 Agent 可用性的,往往是它背后的执行系统工程。
拆解 Claude Code /btw(side question):feature flag、maxTurns=1、deny tools、skipCacheWrite,为什么它能做到“问完就算,不污染主对话”。