DeepSeek DSpark:重点不是新模型,而是推理系统能力
这篇文章从生产系统视角解读 DeepSeek DSpark:半自回归草稿生成、置信度调度验证、线上吞吐和单用户速度提升,以及为什么它应该被理解成推理服务能力,而不是模型能力升级。
Latest Notes
这篇文章从生产系统视角解读 DeepSeek DSpark:半自回归草稿生成、置信度调度验证、线上吞吐和单用户速度提升,以及为什么它应该被理解成推理服务能力,而不是模型能力升级。
这篇文章从 Coding Agent 的真实执行场景出发,解释 Harness Engineering 的本质:它不是 Prompt Engineering 的升级版,而是围绕 Agent 执行生命周期建立的一套权限、环境、状态、观测、验证和恢复系统。
这篇文章从一个运行超过 1 天 19 小时的 Codex goal 任务出发,解释 Loop Engineering 为什么不是 while true,并结合 boss-skill 与 orca 两个实践,拆解 Agent 长任务闭环里的目标、状态、验证、失败恢复和退出条件。
「教员语录」上线 5 天后的复盘:1000+ 用户、5000+ 对话、小红书 6w+ 阅读。本文不谈增长方法论,而是记录做这件事的初心——为什么是教员、为什么是现在、20G 全阶段作品语料如何让思想回到原文、以及评论区那些"被击中""被治愈""思想永存"的真实反馈如何反过来鼓励了我。公益平台,传播教员思想方法,帮年轻人对抗内耗、看清方向。
这篇文章复盘 Orca 针对 DeepSeek Prefix Cache 的九轮缓存优化:从 budget hint 破坏 system prefix,到 volatile 上下文、wire 等价 token 计算、summary state、extractive compaction、remote summary 0% 命中,再到最后用真实 API 评测把主链路稳定到 99% 左右。
Orca 是一个用 Rust 编写、围绕 DeepSeek 推理与工具调用语义打造的终端 Coding Agent。它实现了多轮 Agent 循环、SSE 流式、1M 上下文自动压缩、审批策略、子 Agent、工作流、持久化目标模式与会话历史。本文聊聊我为什么押注 DeepSeek 生态,以及 Orca 的设计与用法。
Explore