Hermes用了有一段时间,发现很多人都用错了

三个月前我每天晚上都在调 prompt。换模型、改措辞、调温度参数,同一个问题翻来覆去问四五遍,对比哪个回答更像人话。结果第二天写文章的时候,该卡还是卡。

我不太喜欢「调教AI」这个词,好像你多跟它说几句话,它就能变聪明,换个模型就能比别人的好使。但三个月调下来,我发现不是那么回事。

直到我翻了 Hermes 三个月的使用记录:从48行规则长到88行,从0条 pitfall 积累到13条,才发现问题出在哪。

你不是用得不好,是投入错了方向。

. . .

大多数人用 AI 工具的路径高度一致,画出来就是一条闭环:效果不好,觉得配置没调对,找教程、调参数、换模型,效果还是不好,那就换个工具重新来一遍。

这个循环我走过,三个月前我刚开始用 Hermes 的时候,想法一模一样:”是不是我没写好 prompt?是不是配置不对?要不要换个框架?”

但三个月后回头看,我发现问题不是你有没有调对,是几万个人都在调同一个东西。

当前主流大模型的基础能力已经高度同质化了。Claude、GPT、Gemini,它们在通用对话、代码生成、文本理解上的差距,远小于你跟一个陌生人之间的差距。你花一周研究 prompt 工程调出来的效果,跟隔壁用默认配置问出来的结果,差距可能不到10%。

所有人调工具,都是在争抢同一套出厂通用能力。你觉得,真正拉开差距的东西还能从哪来?

我复盘了自己用 Hermes 三个月的全过程,从第一篇文章的4个阅读走到现在最高单篇1014。数据摆在面前的时候,我发现了一个让自己都意外的结论:

你花在调工具上的每一分钟,都是在跟几万个用户做同一件事。而你花在养系统上的每一分钟,是唯一能拉开差距的地方。

AI 效果这件事,用公式拆开看是这样的:

20% = 模型基础能力 + 工具对话能力 你装好那天就有了,所有人一样。

80% = 你的行业判断标准 + 你的私有资料库 + 你的案例复盘 出厂时为零,只能自己喂。

有一个很直接的例子:我写第三篇文章的时候,发现开头段落的节奏跟第二篇几乎一模一样,不是 Hermes 故意的,是它不觉得这有什么问题。于是我加了一条规则:开篇过渡句式不跨篇重复。下篇文章的开篇,果然换了路子。一条规则,五分钟,之后每篇文章都受益。

这就是那80%在起作用。

那80% Claude 出厂时没有,GPT 出厂时也没有。你在任何一个模型里都找不到它们。因为它们只存在于你的脑子里,除非你主动把它们喂进系统里。

这就是 Hermes 真正该用的方式,不是当 ChatGPT 用,是当你的私有系统来养。

具体怎么养,我三个月的实践下来,答案分三个层面。每个层面缺一条,系统都站不稳。

. . .

第一个层面:规则层:把判断标准写进系统

我刚开始用的时候,SOUL.md 只有48行,大概就是一段人格描述加几条基础规则。三个月后再看,88行。每增加一行,都是因为我在某篇文章里踩了一个坑,然后回头补了进去。

写作框架从2种变成了12种,Pitfall 规则从0条积累到13条。

你会发现,这些规则不是 Hermes 自带的,是你用自己的试错成本换来的。而它们,恰恰是你在几万个 Hermes 用户之间拉开差距的地方。

有意思的是,6月发布的新工具也在往这个方向走。Coze 3.0 支持了多人多Agent协作,Codex 推出了插件市场让你挂载特定角色能力。它们都在做同一件事:把人的判断标准插件化、规则化。

它们给你的是空壳子,你得自己把判断标准装进去。装了就当用好了,那装跟没装一个样。

真正的功夫不在装好的那一天,在每踩一次坑就补一条规则的那五分钟里。

Skill 文件不是写出来的,是长出来的。

每一次踩坑都是在给系统喂数据,只是这个数据不是信息,是你的判断标准。

你不必一次性写完美。每次踩完坑,打开文件加一行就行。三个月累积下来,你就有了一份别人拿不走的判断标准。

第二个层面:知识层:把资料编译成网

大多数人处理知识的方式是收藏。看到一篇好文章,存进文件夹,心想以后会用,然后就没有然后了。

我换了一个思路:不让知识等着被检索,而是每进来一份新资料,就让系统把它编译进一个持续生长的 Wiki 里。

三个月的数据是这样的:

  • 186篇文章全量拆解:99篇来自缸之脑,11篇来自卡兹克,76篇来自 Infinite
  • 25张概念卡片
  • 19张洞见卡

每一篇都做了标准的四步处理:提取关键信息,更新相关概念页,补充交叉引用,标记新旧矛盾。

你会发现,每一份资料进来的时候都是零散的。但经过拆解、提炼、关联之后,它们织成了一张网。下次写文章时,系统读到的不再是一堆零散文件,而是一个已经被消化过的知识网络。

这就是6月新工具在做的事。天工3.1的 Dynamic Workflows 在做多智能体交叉校验,Adobe Firefly AI 把智能体嵌入全系 Creative Cloud。它们的共同方向是:让信息不再被动存放,而是主动参与生产。

天工和 Adobe 给你搭好了水管,水得你自己接。框架可以复制,但框架里装的那些概念卡片和洞见卡,那是别人抄不走的。

第三个层面:迭代层:每次发布都是系统升级

前两个层面决定了系统现在能做什么。第三个层面决定了它以后能做成什么,也是大多数人做不到的部分。

很多人把 Hermes 当成了一个静态工具,配置一次,用到天荒地老。但真正让它值钱的,是你每一次使用之后做的事。

我的写作流水线有11步,最后一步叫反馈闭环。写完一篇文章,发布了,不是结束。数据要回填到框架效果表里,经验要沉淀成洞见卡,系统要更新对应的规则和知识页。每一次发布,系统就变聪明一点点。

三个月前我刚动笔的时候,最高一篇阅读只有4,三个月后,最高到了1014。不是 Hermes 会自己变强,是我喂进去的那些东西让它变强了。

你会发现,微软 Build 大会上发的 OpenClaw、天工的 Dynamic Workflows、还有那个能自己复盘失败在深夜改自己 Skill 文件的 Hermes Agent,所有这些功能,核心逻辑跟你每天往系统里加一条规则、拆一篇文章、记一次复盘,本质上是一回事。

这些公司花了大力气做给你用的功能。你只需要花15分钟,做一个给自己用的习惯。

. . .

回到开头那句话。

你不是用得不好,你是投入错了方向。

所有人拿到的都是同一套模型底层能力,比拼配置只是无差别内卷。只有持续搭建专属 AI 系统,才能建立别人复刻不了的个人优势。

调工具只能抹平基础下限,养自己的私有系统,才能拉高别人追不上的上限。

而养系统这件事,不需要你每天花几小时。但你需要每天做三件事中的一件:

层级
问自己一句
花多久
规则层
今天踩了什么坑?标准写进系统了吗?
5分钟,加一条 pitfall
知识层
今天读到了什么?关联了哪个已有节点?
10分钟,更新一张概念卡片
迭代层
今天干了什么?反馈到系统了吗?
15分钟,更新数据+记一条复盘

你每天调工具花的那一小时,如果用来往系统里加一条规则、拆一篇文章、记一次复盘,三个月后,你的 Hermes 跟别人的 Hermes,会是两个完全不同的东西。

因为差距从来不在装好的那一天,差距在每一天。

. . .

我会把我的学习过程、踩过的坑、找到的方法,都分享给你。

我们一起,慢慢来,但别停下。

Hermes用了有一段时间,发现很多人都用错了
© 版权声明
为这篇文章评分
10.0/ 10
5 人评价
点击⭐️进行评分

相关文章

暂无评论

none
暂无评论...