把 Orca 的 DeepSeek 缓存命中率打到 99%,我做了九轮优化
这篇文章复盘 Orca 针对 DeepSeek Prefix Cache 的九轮缓存优化:从 budget hint 破坏 system prefix,到 volatile 上下文、wire 等价 token 计算、summary state、extractive compaction、remote summary 0% 命中,再到最后用真实 API 评测把主链路稳定到 99% 左右。
共 5 篇文章
这篇文章复盘 Orca 针对 DeepSeek Prefix Cache 的九轮缓存优化:从 budget hint 破坏 system prefix,到 volatile 上下文、wire 等价 token 计算、summary state、extractive compaction、remote summary 0% 命中,再到最后用真实 API 评测把主链路稳定到 99% 左右。
从 AI Coding Agent 的落地现实出发,解释 Harness Engineering 为什么会在最近迅速升温。文章从定义、背景、关键能力、与 Tool Calling 的区别,以及它对 Agent 产品竞争格局的影响几个角度展开,讨论为什么当模型能力逐渐拉平后,真正决定 Agent 可用性的,往往是它背后的执行系统工程。
深度解析IDE Agent与CLI Agent的差异与互补关系。从Cursor Agent Mode到Windsurf Cascade,IDE已经进化成Agent,但CLI依然有其不可替代的价值:Headless运行、模型自由切换、Unix哲学组合、透明可控。本文探讨为什么在AI Coding时代,CLI和IDE不是替代关系,而是工具箱里的不同工具。
基于 MIT Technology Review、OpenAI、Google DeepMind 等权威机构最新研究的深度调研报告。剖析 2026 年 Coding Agent 五大核心趋势:AI 代码占比达 90%、SWE-bench 性能突破 70%、多智能体协作系统、Vibe Coding 自然语言编程兴起、开发者角色从编码者转型为智能体编排者。涵盖 Claude Code、Cursor、Devin、GitHub Copilot、Amazon Q 等主流产品深度对比,以及生产力提升 25-55% 背后的代码质量与技术债务隐患分析。
从"Copilot"(军师)到"Coding Agent"(实习生)的范式转变,揭秘 AI 如何从提供建议进化为自主执行任务。文章通过作者自研工具 Blade Code 深度解析 Agent 的核心公式(LLM + Prompt + Context + Tools),探讨 MCP、多智能体协作及自我进化闭环,展示 AI 驱动开发的未来图景。