浅谈最近爆火的 OpenClaw

最近 OpenClaw 很火。

我觉得这事不奇怪。

它火，不是因为它已经成熟到可以直接成为“下一代 Agent 标准答案”，而是因为它第一次把很多人脑子里那个比较模糊的想象，做得很具体：Agent 不只是一个聊天框，它还可以继续往系统层演化。

以前大家聊 Agent，很多时候其实还是在聊一个更强一点的助手。会聊天、会写代码、会调工具，差不多也就到这了。

但 OpenClaw 给人的感觉不太一样。它不是单纯“会回复”，而是更像一个挂着跑的系统：能接消息、能调工具、能跑浏览器、能控设备、能多 session、还能多 agent 协同。你一看就知道，它想表达的不是“我是个更聪明的 AI 助手”，而是“我可能是一种新的系统形态”。

这也是它为什么会火。

为什么 OpenClaw 会火？

第一，它满足了很多人对“真正 Agent”的想象。

过去很多 AI 产品，本质上还是一个对话框。模型再强，用户的感知依然是“我在和一个会说话的程序交互”。

OpenClaw 不一样。它把 Agent 从“对话能力”往“系统能力”推了一步。这个变化非常关键，因为它会让开发者立刻想到一个更大的问题：如果 Agent 不再只是聊天界面，而是一个可以接环境、调资源、持续运行的系统，那下一代软件形态会不会变？

第二，它把“可编排”和“可折腾”这件事做得很明显。

很多现成 AI 产品的问题，不是模型不够强，而是太封闭：很难接自己的工具，很难按自己的工作流组织，也很难接进真实环境。OpenClaw 对开发者的吸引力，很大程度上就在于它看起来不像一个封闭产品，而像一个可以继续往上搭东西的底座。

第三，它非常适合做 demo。

这是很多人低估的一点。你让它盯群消息、点网页、接飞书、接 Discord、接设备，甚至像真人助理一样挂着跑，那个“未来感”一下就出来了。很多产品能力并不弱，但不容易被展示；OpenClaw 刚好相反，它天然容易产出传播素材。

第四，它踩在了“Agent 化”的趋势上。

这两年大家对 AI 的关注点，已经不只是模型本身有多强，而是模型怎么接进真实环境、怎么跑长链任务、怎么进入组织工作流、怎么长期在线。OpenClaw 刚好把这些东西做得足够可见，所以它的热度其实也吃到了整个方向的红利。

但它真正的问题，也恰恰在这里

如果只看能力，OpenClaw 的问题并不是“不够强”。

相反，它的问题恰恰是：能力很多，系统很猛，但产品形态和信任边界还没有完全收住。

1. 产品定位还不够收敛

OpenClaw 现在同时像很多东西：个人助手、多渠道消息中枢、本地自动化框架、Agent runtime，甚至某种远程控制平台。

这会带来一个很典型的问题：第一眼看很猛，第二眼就会问——我到底为什么一定要用它？

因为如果需求是单点的，其实每一类都有更专的替代品：

写代码，有 Codex、Claude Code、Cursor
自动化流程，有 n8n、Zapier、脚本
browser agent，有 Playwright、browser-use
bot，有各种消息机器人框架
企业级 AI，也有飞书、Slack、Microsoft、Google 自带能力

所以 OpenClaw 的综合能力，一方面是优势，另一方面也是认知成本来源。对极客来说，这叫自由度高；对产品来说，这通常意味着核心价值还不够聚焦。

2. “个人助手”叙事和平台级能力缠在一起

这是我觉得它最值得警惕的一点。

OpenClaw 的外部叙事，很容易让人把它理解成一个懂你、帮你做事的个人助手。但你往里看，它又明显不只是助手。它有文件系统、shell、browser、设备控制、外发消息、知识库和云盘访问能力，甚至还有更高权限的执行入口。

问题就在这里。

如果它真的是个人助手，那为什么天然挨着这么多高风险能力？如果它本质上更像一个 Agent runtime 或 control plane，那它就不能只靠“助手”这层叙事轻轻带过去，而必须正面回答权限、隔离、审计和治理这些问题。

说白了，它现在有一点“助手的脸，平台的身体”。

这两个东西如果不拆清楚，用户的信任边界就会很模糊。

3. 消息入口离执行入口太近

这也是很多 message-first agent 都会遇到的风险。

一句话下去，系统就能读文件、调 shell、开浏览器、发消息、控设备，这体验当然很爽。但从系统设计角度看，这其实非常危险，因为它要求边界设计极其清晰。

系统必须回答清楚：

谁能触发？
在哪个 channel 里触发？
是私聊还是群聊？
哪些能力默认开放？
哪些必须审批？
是否可回放、可审计、可追责？

这些问题只要有一层没有处理清楚，系统就很容易从“助手”滑向“披着聊天皮的高权限执行器”。

4. 灵活，但不够可预期

OpenClaw 很强的一点，是它的自由度确实很高。prompt、skill、tool policy、workspace memory、session、subagent、runtime、plugin、gateway、channel，这些层都能调。

这对 hardcore developer 来说很有吸引力，因为系统足够灵活，能插手的地方很多。

但灵活的另一面，就是复杂度。

一旦行为同时受很多层影响，debug 成本就会迅速抬上去。出了问题以后，很容易不知道到底是 prompt、skill、tool policy，还是 runtime / gateway / channel 哪一层出了问题。

所以我现在会觉得，OpenClaw 更像一个很强的系统底座，或者说一个超级工具箱，加上一套很灵活的编排机制。这个东西对爱折腾的人当然很香，但离“边界明确、行为稳定、结果可预期”的产品，还有距离。

真正的机会，不是复制 OpenClaw

我觉得很多人接下来会自然地产生一个念头：既然 OpenClaw 火了，那我也做一个类似的。

但真正值得做的，往往不是复制它已经呈现出来的“未来感”，而是补它还没有补完的那些关键部分。

这里最关键的，不是“再做一个同类产品”，而是把几个基础问题答清楚。

第一，产品形态到底是什么？

它到底是：

个人 Agent OS
团队 Agent runtime / control plane
开发者 Agent framework

这三条路都能走，但逻辑完全不同。如果不先收敛产品身份，后面的能力建设、用户预期和商业模式都会一起发散。

第二，信任边界怎么设计？

Agent 一旦进入真实环境，问题就不只是“能不能做”，而是：谁能触发、能做到哪一步、哪些能力默认开放、哪些必须审批、整个过程是否可回放、可审计、可追责。

谁把这个问题答清楚，谁才有机会从 demo 走到组织级使用。

第三，结果能不能稳定交付给用户？

这个问题听起来最朴素，但其实最难。

很多系统都能偶尔跑出很惊艳的效果，但用户很难长期信任它。真要让人敢用，背后其实需要一整套评测、反馈、约束和治理机制去兜底。

简单说，问题不只是“能不能跑起来”，而是能不能稳定、可靠地把结果交付给用户。

这也是我最近一直在做的一条线。像 blade-code、blade-agent-sdk、blade-cowork 和 blade-agent-runtime 这些项目，我关心的都不只是“怎么把模型接进来”，而是 Agent 真正进入真实环境之后的问题：怎么接工具、怎么接工作流、怎么做运行时隔离、怎么做执行审计，以及多 Agent / 多 Session 怎么变成真正可用的协作能力。

所以我看 OpenClaw，不只是看它有多火，而是更关注这类系统下一步怎么收敛产品形态、定义信任边界，以及怎么把结果稳定交付给用户。

最后

如果一定要用一句话概括我对 OpenClaw 的看法，那就是：

它的火，证明了方向；但它真正的问题，不是能力不够，而是产品身份、权限边界和系统复杂度还没有收住。

OpenClaw 的意义，不只是它自己火了，而是它把“Agent 可以往系统层走”这件事提前摊开给大家看了。

但接下来更有机会的，不一定是最早把未来感做出来的那个，反而可能是那个把产品形态、信任边界、结果交付和商业闭环都真正做扎实的人或团队。