把 Orca 的 DeepSeek 缓存命中率打到 99%,我做了九轮优化
这篇文章复盘 Orca 针对 DeepSeek Prefix Cache 的九轮缓存优化:从 budget hint 破坏 system prefix,到 volatile 上下文、wire 等价 token 计算、summary state、extractive compaction、remote summary 0% 命中,再到最后用真实 API 评测把主链路稳定到 99% 左右。
Latest Notes
这篇文章复盘 Orca 针对 DeepSeek Prefix Cache 的九轮缓存优化:从 budget hint 破坏 system prefix,到 volatile 上下文、wire 等价 token 计算、summary state、extractive compaction、remote summary 0% 命中,再到最后用真实 API 评测把主链路稳定到 99% 左右。
Orca 是一个用 Rust 编写、围绕 DeepSeek 推理与工具调用语义打造的终端 Coding Agent。它实现了多轮 Agent 循环、SSE 流式、1M 上下文自动压缩、审批策略、子 Agent、工作流、持久化目标模式与会话历史。本文聊聊我为什么押注 DeepSeek 生态,以及 Orca 的设计与用法。
Harness 不是让 Agent 更聪明,而是让 Agent 的工作更可信。本文基于一个真实的 Agent 研发流水线,拆解五层工程化骨架:定义层、运行层、产物层、门禁层、恢复层,以及如何用 workflow-plan.json 把"流程定义"和"运行实例"彻底分开。
深入分析 Claude Code 2.1.156 版本的 Workflow 实现原理。它不是"让模型自己记住步骤",而是一个可编译、可持久化、可恢复的多阶段 Agent 编排引擎。从 SDK 类型定义、二进制字符串痕迹到运行时行为,逐层拆解 workflow 的 DSL 设计、任务注册、phase 调度和恢复机制。
以 Hermes Agent 源码为主线进行深度架构剖析,从运行时形态、工具系统、长期记忆、任务编排、可插拔性、可观测性、安全模型、社区生态八个工程化维度与 OpenClaw 进行结构化对比。面向工程师、架构师和研究者,侧重讲清架构意图与设计取舍。
最近一周在排查 OpenClaw 的 cron 和 delivery 问题时,我越来越确信:Agent 系统最难的不是成功路径,而是失败路径。本文从表面成功、失败语义、边界设计和可观测性四个角度,聊聊为什么 Agent 时代真正稀缺的不是能力,而是值得信任的失败。
Explore