为什么 Harness Engineering 最近突然变热了?
从 AI Coding Agent 的落地现实出发,解释 Harness Engineering 为什么会在最近迅速升温。文章从定义、背景、关键能力、与 Tool Calling 的区别,以及它对 Agent 产品竞争格局的影响几个角度展开,讨论为什么当模型能力逐渐拉平后,真正决定 Agent 可用性的,往往是它背后的执行系统工程。
从 AI Coding Agent 的落地现实出发,解释 Harness Engineering 为什么会在最近迅速升温。文章从定义、背景、关键能力、与 Tool Calling 的区别,以及它对 Agent 产品竞争格局的影响几个角度展开,讨论为什么当模型能力逐渐拉平后,真正决定 Agent 可用性的,往往是它背后的执行系统工程。
拆解 Claude Code /btw(side question):feature flag、maxTurns=1、deny tools、skipCacheWrite,为什么它能做到“问完就算,不污染主对话”。
OpenClaw 最近很火,但它真正值得讨论的,不只是为什么会火,而是它暴露出来的产品形态、信任边界和系统复杂度问题。本文从产品、架构和方向判断三个层面,聊聊我对这类 Agent 系统的看法。
Agent Skill 是黑盒。你调用一个 Skill,不知道它做了什么、为什么失败、能不能信任。STOP(Skill Transparency & Observability Protocol)是一个开放规范,把 SRE 级别的可观测性引入 Skill 层——Manifest 声明能力、Trace 追踪执行、Assertion 验证结果。
AI 助理用过就忘?我给 OpenClaw Agent 写了一个 learning-system skill,让它能系统化地积累经验。包含知识图谱、深度笔记、健康检查和每周回顾,从"能查到"变成"学会了"。
Blade Agent SDK 是从 Blade Code(类 Claude Code 的 AI 编程助手)中抽取出来的核心能力集合。提供 send/stream 会话模式、会话恢复与分叉、文件检查点、沙箱执行、MCP 集成、上下文压缩、插件系统等经过实战验证的功能,帮助开发者快速构建多轮会话 AI Agent 应用。