刘贺
返回首页

用Hermes一周,它自动生成了4个直接运行的Skill

分钟阅读
🐙 GitHub
龙虾哥打工日记

1. 背景

这周我一直在用 Hermes Agent。用着用着,发现它自己沉淀了 4 个 Skill。这个点很有意思,因为它不是你手动建出来的,而是你多跑几次任务之后,它自己慢慢长出来的。作为程序员,我很想知道这套东西到底怎么工作的。

刚好 OpenClaw 我也用了几个月。我们这边其实也在做类似的事,只是路径不太一样。Hermes 更像把“学习”直接塞进了运行时,OpenClaw 则更像一套偏工程化、偏人工把关的沉淀流程。现在我把这两种路子放在一起对比下。

2. 核心内容

2.1 Hermes自动创建Skill机制

Hermes自动创建Skill流程图

从源码里的 SKILLS_GUIDANCE 看,Hermes 对 Skill 的处理其实分成两段:一段是“什么时候该沉淀”,另一段是“用坏了就立刻修”。

它的提示词里写得很直接:完成复杂任务(5+ tool calls)、修复棘手错误、发现非平凡工作流程后,就应该用 skill_manage 把这套做法保存成 Skill,方便下次复用。反过来,如果使用某个 Skill 时发现它过时、不完整或有错误,就要立刻用 skill_manage(action='patch') 修补它,不要等用户再提醒。

按 Hermes Agent v0.10.0 的源码,这套闭环由两个工具分工完成:skill_manage 负责创建与 patch,skill_view 负责加载复用,两者配合形成从沉淀到复用再到回修的完整链路。

2.2 OpenClaw Skill沉淀实践

OpenClaw 这几个月也慢慢把一套半自动的 Skill 沉淀流程跑出来了。思路和 Hermes 有相通的地方,但落地方式明显更偏可控:

  1. 触发层:目前更接近「人工触发 + Agent 主动提议」的混合模式。用户可以显式要求创建或改进 Skill,Agent 也可以在会话里识别出重复劳动、踩坑或非平凡工作流程,然后建议把经验沉淀下来。
  2. 沉淀层:一旦决定沉淀,Skill 资产会尽量收敛到标准目录结构里,通常是「SKILL.md + 可执行 scripts + references」,避免经验只停留在聊天记录和一次性脚本里。
  3. 反哺层:新 Skill 或已有 Skill 的改动,走的是显式 review 和本地落盘链路,优先保证结构透明、可解释、能二次维护,而不是追求全自动黑盒入库。
  4. 迭代层:OpenClaw 的优化方式更像「基于真实会话摩擦点做小步修补」。重点不是后台自动吃运行指标,而是把具体报错、用户纠正和绕路经验,翻译成更稳的 Skill 指令或脚本。

说白了,OpenClaw 这套机制已经能稳定支持 Skill 沉淀,但它走的不是“让系统自己长”,而是“把经验整理成结构化资产,再慢慢磨”。代价是没有 Hermes 那么丝滑,换来的好处是更容易 review,也更容易长期维护。

2.3 核心差异对比

两种模式核心差异如下: OpenClaw 与 Hermes 模式对比图

维度OpenClaw模式Hermes模式
触发方式人工触发为主,Agent 可基于会话信号主动提议官方定位更偏运行时自动学习与沉淀
透明度强调显式 review、结构透明和可维护性先沉淀再迭代,内部过程更黑盒
Skill结构偏工程化约束,常见形态是 SKILL.md + scripts + references官方强调 SKILL.md 为核心,附属资源按需扩展
迭代闭环基于真实摩擦点做小步修补官方明确支持从反馈和后续使用中持续打磨
适用场景适合对稳定性、可控性、可审计性要求更高的团队场景更适合希望低门槛获得自动沉淀体验的个人场景

3. 总结

目前的体感是:Hermes 更适合想直接上手的人。它的学习闭环确实很顺,用着用着就会自己沉淀 Skill;但缺点也明显,就是有点黑盒,我不太知道它每次具体为什么沉淀、沉淀了什么。

所以我现在把 Hermes 工作空间 ~/.hermes 放到了 Git 里,每天早晨让它自动提交一次,再让它告诉我过去一天到底改了什么。这样至少能把这个黑盒稍微掰开一点。 用 Hermes 创建每日自动提交与复盘的 cron 任务 相比之下,OpenClaw 没有 Hermes 那种“自己长出来”的丝滑感,但掌控感更强,结构也更清楚。你能看到 Skill 是怎么写的,脚本放在哪里,经验是怎么被沉淀进去的。

不过话说回来,Hermes 这种自动迭代、把学习闭环塞进运行时的思路,可能正是它最近让人觉得有意思的原因。