Hermes用了有一段时间，发现很多人都用错了

AI世界漫游指南14小时前更新文明旁观者

8 00

三个月前我每天晚上都在调 prompt。换模型、改措辞、调温度参数，同一个问题翻来覆去问四五遍，对比哪个回答更像人话。结果第二天写文章的时候，该卡还是卡。

我不太喜欢「调教AI」这个词，好像你多跟它说几句话，它就能变聪明，换个模型就能比别人的好使。但三个月调下来，我发现不是那么回事。

直到我翻了 Hermes 三个月的使用记录：从48行规则长到88行，从0条 pitfall 积累到13条，才发现问题出在哪。

你不是用得不好，是投入错了方向。

. . .

大多数人用 AI 工具的路径高度一致，画出来就是一条闭环：效果不好，觉得配置没调对，找教程、调参数、换模型，效果还是不好，那就换个工具重新来一遍。

这个循环我走过，三个月前我刚开始用 Hermes 的时候，想法一模一样：”是不是我没写好 prompt？是不是配置不对？要不要换个框架？”

但三个月后回头看，我发现问题不是你有没有调对，是几万个人都在调同一个东西。

当前主流大模型的基础能力已经高度同质化了。Claude、GPT、Gemini，它们在通用对话、代码生成、文本理解上的差距，远小于你跟一个陌生人之间的差距。你花一周研究 prompt 工程调出来的效果，跟隔壁用默认配置问出来的结果，差距可能不到10%。

所有人调工具，都是在争抢同一套出厂通用能力。你觉得，真正拉开差距的东西还能从哪来？

我复盘了自己用 Hermes 三个月的全过程，从第一篇文章的4个阅读走到现在最高单篇1014。数据摆在面前的时候，我发现了一个让自己都意外的结论：

你花在调工具上的每一分钟，都是在跟几万个用户做同一件事。而你花在养系统上的每一分钟，是唯一能拉开差距的地方。

AI 效果这件事，用公式拆开看是这样的：

20% = 模型基础能力 + 工具对话能力你装好那天就有了，所有人一样。

80% = 你的行业判断标准 + 你的私有资料库 + 你的案例复盘出厂时为零，只能自己喂。

有一个很直接的例子：我写第三篇文章的时候，发现开头段落的节奏跟第二篇几乎一模一样，不是 Hermes 故意的，是它不觉得这有什么问题。于是我加了一条规则：开篇过渡句式不跨篇重复。下篇文章的开篇，果然换了路子。一条规则，五分钟，之后每篇文章都受益。

这就是那80%在起作用。

那80% Claude 出厂时没有，GPT 出厂时也没有。你在任何一个模型里都找不到它们。因为它们只存在于你的脑子里，除非你主动把它们喂进系统里。

这就是 Hermes 真正该用的方式，不是当 ChatGPT 用，是当你的私有系统来养。

具体怎么养，我三个月的实践下来，答案分三个层面。每个层面缺一条，系统都站不稳。

. . .

第一个层面：规则层：把判断标准写进系统

我刚开始用的时候，SOUL.md 只有48行，大概就是一段人格描述加几条基础规则。三个月后再看，88行。每增加一行，都是因为我在某篇文章里踩了一个坑，然后回头补了进去。

写作框架从2种变成了12种，Pitfall 规则从0条积累到13条。

你会发现，这些规则不是 Hermes 自带的，是你用自己的试错成本换来的。而它们，恰恰是你在几万个 Hermes 用户之间拉开差距的地方。

有意思的是，6月发布的新工具也在往这个方向走。Coze 3.0 支持了多人多Agent协作，Codex 推出了插件市场让你挂载特定角色能力。它们都在做同一件事：把人的判断标准插件化、规则化。

它们给你的是空壳子，你得自己把判断标准装进去。装了就当用好了，那装跟没装一个样。

真正的功夫不在装好的那一天，在每踩一次坑就补一条规则的那五分钟里。

Skill 文件不是写出来的，是长出来的。

每一次踩坑都是在给系统喂数据，只是这个数据不是信息，是你的判断标准。

你不必一次性写完美。每次踩完坑，打开文件加一行就行。三个月累积下来，你就有了一份别人拿不走的判断标准。

第二个层面：知识层：把资料编译成网

大多数人处理知识的方式是收藏。看到一篇好文章，存进文件夹，心想以后会用，然后就没有然后了。

我换了一个思路：不让知识等着被检索，而是每进来一份新资料，就让系统把它编译进一个持续生长的 Wiki 里。

三个月的数据是这样的：

186篇文章全量拆解：99篇来自缸之脑，11篇来自卡兹克，76篇来自 Infinite
25张概念卡片
19张洞见卡

每一篇都做了标准的四步处理：提取关键信息，更新相关概念页，补充交叉引用，标记新旧矛盾。

你会发现，每一份资料进来的时候都是零散的。但经过拆解、提炼、关联之后，它们织成了一张网。下次写文章时，系统读到的不再是一堆零散文件，而是一个已经被消化过的知识网络。

这就是6月新工具在做的事。天工3.1的 Dynamic Workflows 在做多智能体交叉校验，Adobe Firefly AI 把智能体嵌入全系 Creative Cloud。它们的共同方向是：让信息不再被动存放，而是主动参与生产。

天工和 Adobe 给你搭好了水管，水得你自己接。框架可以复制，但框架里装的那些概念卡片和洞见卡，那是别人抄不走的。

第三个层面：迭代层：每次发布都是系统升级

前两个层面决定了系统现在能做什么。第三个层面决定了它以后能做成什么，也是大多数人做不到的部分。

很多人把 Hermes 当成了一个静态工具，配置一次，用到天荒地老。但真正让它值钱的，是你每一次使用之后做的事。

我的写作流水线有11步，最后一步叫反馈闭环。写完一篇文章，发布了，不是结束。数据要回填到框架效果表里，经验要沉淀成洞见卡，系统要更新对应的规则和知识页。每一次发布，系统就变聪明一点点。

三个月前我刚动笔的时候，最高一篇阅读只有4，三个月后，最高到了1014。不是 Hermes 会自己变强，是我喂进去的那些东西让它变强了。

你会发现，微软 Build 大会上发的 OpenClaw、天工的 Dynamic Workflows、还有那个能自己复盘失败在深夜改自己 Skill 文件的 Hermes Agent，所有这些功能，核心逻辑跟你每天往系统里加一条规则、拆一篇文章、记一次复盘，本质上是一回事。

这些公司花了大力气做给你用的功能。你只需要花15分钟，做一个给自己用的习惯。

. . .

回到开头那句话。

你不是用得不好，你是投入错了方向。

所有人拿到的都是同一套模型底层能力，比拼配置只是无差别内卷。只有持续搭建专属 AI 系统，才能建立别人复刻不了的个人优势。

调工具只能抹平基础下限，养自己的私有系统，才能拉高别人追不上的上限。

而养系统这件事，不需要你每天花几小时。但你需要每天做三件事中的一件：

层级	问自己一句	花多久
规则层	今天踩了什么坑？标准写进系统了吗？	5分钟，加一条 pitfall
知识层	今天读到了什么？关联了哪个已有节点？	10分钟，更新一张概念卡片
迭代层	今天干了什么？反馈到系统了吗？	15分钟，更新数据+记一条复盘