青雲的博客

浅谈最近爆火的 OpenClaw

· 12 分钟阅读

最近 OpenClaw 很火。

我觉得这事不奇怪。

它火,不是因为它已经成熟到可以直接成为“下一代 Agent 标准答案”,而是因为它第一次把很多人脑子里那个比较模糊的想象,做得很具体:Agent 不只是一个聊天框,它还可以继续往系统层演化。

以前大家聊 Agent,很多时候其实还是在聊一个更强一点的助手。 会聊天、会写代码、会调工具,差不多也就到这了。

但 OpenClaw 给人的感觉不太一样。它不是单纯“会回复”,而是更像一个挂着跑的系统:能接消息、能调工具、能跑浏览器、能控设备、能多 session、还能多 agent 协同。你一看就知道,它想表达的不是“我是个更聪明的 AI 助手”,而是“我可能是一种新的系统形态”。

这也是它为什么会火。

为什么 OpenClaw 会火?

第一,它满足了很多人对“真正 Agent”的想象。

过去很多 AI 产品,本质上还是一个对话框。模型再强,用户的感知依然是“我在和一个会说话的程序交互”。

OpenClaw 不一样。它把 Agent 从“对话能力”往“系统能力”推了一步。这个变化非常关键,因为它会让开发者立刻想到一个更大的问题:如果 Agent 不再只是聊天界面,而是一个可以接环境、调资源、持续运行的系统,那下一代软件形态会不会变?

第二,它把“可编排”和“可折腾”这件事做得很明显。

很多现成 AI 产品的问题,不是模型不够强,而是太封闭:很难接自己的工具,很难按自己的工作流组织,也很难接进真实环境。OpenClaw 对开发者的吸引力,很大程度上就在于它看起来不像一个封闭产品,而像一个可以继续往上搭东西的底座。

第三,它非常适合做 demo。

这是很多人低估的一点。你让它盯群消息、点网页、接飞书、接 Discord、接设备,甚至像真人助理一样挂着跑,那个“未来感”一下就出来了。很多产品能力并不弱,但不容易被展示;OpenClaw 刚好相反,它天然容易产出传播素材。

第四,它踩在了“Agent 化”的趋势上。

这两年大家对 AI 的关注点,已经不只是模型本身有多强,而是模型怎么接进真实环境、怎么跑长链任务、怎么进入组织工作流、怎么长期在线。OpenClaw 刚好把这些东西做得足够可见,所以它的热度其实也吃到了整个方向的红利。

但它真正的问题,也恰恰在这里

如果只看能力,OpenClaw 的问题并不是“不够强”。

相反,它的问题恰恰是:能力很多,系统很猛,但产品形态和信任边界还没有完全收住。

1. 产品定位还不够收敛

OpenClaw 现在同时像很多东西:个人助手、多渠道消息中枢、本地自动化框架、Agent runtime,甚至某种远程控制平台。

这会带来一个很典型的问题:第一眼看很猛,第二眼就会问——我到底为什么一定要用它?

因为如果需求是单点的,其实每一类都有更专的替代品:

  • 写代码,有 Codex、Claude Code、Cursor
  • 自动化流程,有 n8n、Zapier、脚本
  • browser agent,有 Playwright、browser-use
  • bot,有各种消息机器人框架
  • 企业级 AI,也有飞书、Slack、Microsoft、Google 自带能力

所以 OpenClaw 的综合能力,一方面是优势,另一方面也是认知成本来源。对极客来说,这叫自由度高;对产品来说,这通常意味着核心价值还不够聚焦。

2. “个人助手”叙事和平台级能力缠在一起

这是我觉得它最值得警惕的一点。

OpenClaw 的外部叙事,很容易让人把它理解成一个懂你、帮你做事的个人助手。但你往里看,它又明显不只是助手。它有文件系统、shell、browser、设备控制、外发消息、知识库和云盘访问能力,甚至还有更高权限的执行入口。

问题就在这里。

如果它真的是个人助手,那为什么天然挨着这么多高风险能力? 如果它本质上更像一个 Agent runtime 或 control plane,那它就不能只靠“助手”这层叙事轻轻带过去,而必须正面回答权限、隔离、审计和治理这些问题。

说白了,它现在有一点“助手的脸,平台的身体”。

这两个东西如果不拆清楚,用户的信任边界就会很模糊。

3. 消息入口离执行入口太近

这也是很多 message-first agent 都会遇到的风险。

一句话下去,系统就能读文件、调 shell、开浏览器、发消息、控设备,这体验当然很爽。但从系统设计角度看,这其实非常危险,因为它要求边界设计极其清晰。

系统必须回答清楚:

  • 谁能触发?
  • 在哪个 channel 里触发?
  • 是私聊还是群聊?
  • 哪些能力默认开放?
  • 哪些必须审批?
  • 是否可回放、可审计、可追责?

这些问题只要有一层没有处理清楚,系统就很容易从“助手”滑向“披着聊天皮的高权限执行器”。

4. 灵活,但不够可预期

OpenClaw 很强的一点,是它的自由度确实很高。prompt、skill、tool policy、workspace memory、session、subagent、runtime、plugin、gateway、channel,这些层都能调。

这对 hardcore developer 来说很有吸引力,因为系统足够灵活,能插手的地方很多。

但灵活的另一面,就是复杂度。

一旦行为同时受很多层影响,debug 成本就会迅速抬上去。出了问题以后,很容易不知道到底是 prompt、skill、tool policy,还是 runtime / gateway / channel 哪一层出了问题。

所以我现在会觉得,OpenClaw 更像一个很强的系统底座,或者说一个超级工具箱,加上一套很灵活的编排机制。这个东西对爱折腾的人当然很香,但离“边界明确、行为稳定、结果可预期”的产品,还有距离。

真正的机会,不是复制 OpenClaw

我觉得很多人接下来会自然地产生一个念头:既然 OpenClaw 火了,那我也做一个类似的。

但真正值得做的,往往不是复制它已经呈现出来的“未来感”,而是补它还没有补完的那些关键部分。

这里最关键的,不是“再做一个同类产品”,而是把几个基础问题答清楚。

第一,产品形态到底是什么?

它到底是:

  • 个人 Agent OS
  • 团队 Agent runtime / control plane
  • 开发者 Agent framework

这三条路都能走,但逻辑完全不同。如果不先收敛产品身份,后面的能力建设、用户预期和商业模式都会一起发散。

第二,信任边界怎么设计?

Agent 一旦进入真实环境,问题就不只是“能不能做”,而是:谁能触发、能做到哪一步、哪些能力默认开放、哪些必须审批、整个过程是否可回放、可审计、可追责。

谁把这个问题答清楚,谁才有机会从 demo 走到组织级使用。

第三,结果能不能稳定交付给用户?

这个问题听起来最朴素,但其实最难。

很多系统都能偶尔跑出很惊艳的效果,但用户很难长期信任它。真要让人敢用,背后其实需要一整套评测、反馈、约束和治理机制去兜底。

简单说,问题不只是“能不能跑起来”,而是能不能稳定、可靠地把结果交付给用户。

这也是我最近一直在做的一条线。像 blade-codeblade-agent-sdkblade-coworkblade-agent-runtime 这些项目,我关心的都不只是“怎么把模型接进来”,而是 Agent 真正进入真实环境之后的问题:怎么接工具、怎么接工作流、怎么做运行时隔离、怎么做执行审计,以及多 Agent / 多 Session 怎么变成真正可用的协作能力。

所以我看 OpenClaw,不只是看它有多火,而是更关注这类系统下一步怎么收敛产品形态、定义信任边界,以及怎么把结果稳定交付给用户。

最后

如果一定要用一句话概括我对 OpenClaw 的看法,那就是:

它的火,证明了方向;但它真正的问题,不是能力不够,而是产品身份、权限边界和系统复杂度还没有收住。

OpenClaw 的意义,不只是它自己火了,而是它把“Agent 可以往系统层走”这件事提前摊开给大家看了。

但接下来更有机会的,不一定是最早把未来感做出来的那个,反而可能是那个把产品形态、信任边界、结果交付和商业闭环都真正做扎实的人或团队。

相关文章

评论