三个月前我每天晚上都在调 prompt。换模型、改措辞、调温度参数,同一个问题翻来覆去问四五遍,对比哪个回答更像人话。结果第二天写文章的时候,该卡还是卡。
我不太喜欢「调教AI」这个词,好像你多跟它说几句话,它就能变聪明,换个模型就能比别人的好使。但三个月调下来,我发现不是那么回事。
直到我翻了 Hermes 三个月的使用记录:从48行规则长到88行,从0条 pitfall 积累到13条,才发现问题出在哪。
你不是用得不好,是投入错了方向。
. . .
大多数人用 AI 工具的路径高度一致,画出来就是一条闭环:效果不好,觉得配置没调对,找教程、调参数、换模型,效果还是不好,那就换个工具重新来一遍。
这个循环我走过,三个月前我刚开始用 Hermes 的时候,想法一模一样:”是不是我没写好 prompt?是不是配置不对?要不要换个框架?”
但三个月后回头看,我发现问题不是你有没有调对,是几万个人都在调同一个东西。
当前主流大模型的基础能力已经高度同质化了。Claude、GPT、Gemini,它们在通用对话、代码生成、文本理解上的差距,远小于你跟一个陌生人之间的差距。你花一周研究 prompt 工程调出来的效果,跟隔壁用默认配置问出来的结果,差距可能不到10%。
所有人调工具,都是在争抢同一套出厂通用能力。你觉得,真正拉开差距的东西还能从哪来?
我复盘了自己用 Hermes 三个月的全过程,从第一篇文章的4个阅读走到现在最高单篇1014。数据摆在面前的时候,我发现了一个让自己都意外的结论:
你花在调工具上的每一分钟,都是在跟几万个用户做同一件事。而你花在养系统上的每一分钟,是唯一能拉开差距的地方。
AI 效果这件事,用公式拆开看是这样的:
20% = 模型基础能力 + 工具对话能力 你装好那天就有了,所有人一样。
80% = 你的行业判断标准 + 你的私有资料库 + 你的案例复盘 出厂时为零,只能自己喂。
有一个很直接的例子:我写第三篇文章的时候,发现开头段落的节奏跟第二篇几乎一模一样,不是 Hermes 故意的,是它不觉得这有什么问题。于是我加了一条规则:开篇过渡句式不跨篇重复。下篇文章的开篇,果然换了路子。一条规则,五分钟,之后每篇文章都受益。
这就是那80%在起作用。
那80% Claude 出厂时没有,GPT 出厂时也没有。你在任何一个模型里都找不到它们。因为它们只存在于你的脑子里,除非你主动把它们喂进系统里。
这就是 Hermes 真正该用的方式,不是当 ChatGPT 用,是当你的私有系统来养。
具体怎么养,我三个月的实践下来,答案分三个层面。每个层面缺一条,系统都站不稳。
. . .
第一个层面:规则层:把判断标准写进系统
我刚开始用的时候,SOUL.md 只有48行,大概就是一段人格描述加几条基础规则。三个月后再看,88行。每增加一行,都是因为我在某篇文章里踩了一个坑,然后回头补了进去。
写作框架从2种变成了12种,Pitfall 规则从0条积累到13条。
你会发现,这些规则不是 Hermes 自带的,是你用自己的试错成本换来的。而它们,恰恰是你在几万个 Hermes 用户之间拉开差距的地方。
有意思的是,6月发布的新工具也在往这个方向走。Coze 3.0 支持了多人多Agent协作,Codex 推出了插件市场让你挂载特定角色能力。它们都在做同一件事:把人的判断标准插件化、规则化。
它们给你的是空壳子,你得自己把判断标准装进去。装了就当用好了,那装跟没装一个样。
真正的功夫不在装好的那一天,在每踩一次坑就补一条规则的那五分钟里。
Skill 文件不是写出来的,是长出来的。
每一次踩坑都是在给系统喂数据,只是这个数据不是信息,是你的判断标准。
你不必一次性写完美。每次踩完坑,打开文件加一行就行。三个月累积下来,你就有了一份别人拿不走的判断标准。
第二个层面:知识层:把资料编译成网
大多数人处理知识的方式是收藏。看到一篇好文章,存进文件夹,心想以后会用,然后就没有然后了。
我换了一个思路:不让知识等着被检索,而是每进来一份新资料,就让系统把它编译进一个持续生长的 Wiki 里。
三个月的数据是这样的:
186篇文章全量拆解:99篇来自缸之脑,11篇来自卡兹克,76篇来自 Infinite 25张概念卡片 19张洞见卡
每一篇都做了标准的四步处理:提取关键信息,更新相关概念页,补充交叉引用,标记新旧矛盾。
你会发现,每一份资料进来的时候都是零散的。但经过拆解、提炼、关联之后,它们织成了一张网。下次写文章时,系统读到的不再是一堆零散文件,而是一个已经被消化过的知识网络。
这就是6月新工具在做的事。天工3.1的 Dynamic Workflows 在做多智能体交叉校验,Adobe Firefly AI 把智能体嵌入全系 Creative Cloud。它们的共同方向是:让信息不再被动存放,而是主动参与生产。
天工和 Adobe 给你搭好了水管,水得你自己接。框架可以复制,但框架里装的那些概念卡片和洞见卡,那是别人抄不走的。
第三个层面:迭代层:每次发布都是系统升级
前两个层面决定了系统现在能做什么。第三个层面决定了它以后能做成什么,也是大多数人做不到的部分。
很多人把 Hermes 当成了一个静态工具,配置一次,用到天荒地老。但真正让它值钱的,是你每一次使用之后做的事。
我的写作流水线有11步,最后一步叫反馈闭环。写完一篇文章,发布了,不是结束。数据要回填到框架效果表里,经验要沉淀成洞见卡,系统要更新对应的规则和知识页。每一次发布,系统就变聪明一点点。
三个月前我刚动笔的时候,最高一篇阅读只有4,三个月后,最高到了1014。不是 Hermes 会自己变强,是我喂进去的那些东西让它变强了。
你会发现,微软 Build 大会上发的 OpenClaw、天工的 Dynamic Workflows、还有那个能自己复盘失败在深夜改自己 Skill 文件的 Hermes Agent,所有这些功能,核心逻辑跟你每天往系统里加一条规则、拆一篇文章、记一次复盘,本质上是一回事。
这些公司花了大力气做给你用的功能。你只需要花15分钟,做一个给自己用的习惯。
. . .
回到开头那句话。
你不是用得不好,你是投入错了方向。
所有人拿到的都是同一套模型底层能力,比拼配置只是无差别内卷。只有持续搭建专属 AI 系统,才能建立别人复刻不了的个人优势。
调工具只能抹平基础下限,养自己的私有系统,才能拉高别人追不上的上限。
而养系统这件事,不需要你每天花几小时。但你需要每天做三件事中的一件:
你每天调工具花的那一小时,如果用来往系统里加一条规则、拆一篇文章、记一次复盘,三个月后,你的 Hermes 跟别人的 Hermes,会是两个完全不同的东西。
因为差距从来不在装好的那一天,差距在每一天。
. . .
我会把我的学习过程、踩过的坑、找到的方法,都分享给你。
我们一起,慢慢来,但别停下。

© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



