admin
Bookskill 管线系统:5 阶段确定性小说生产线的架构与实现
Bookskill 管线系统:5 阶段确定性小说生产线的架构与实现
开篇:什么是 Bookskill?
在 AI 辅助创作的浪潮中,自动化小说生产管线是一个被反复尝试的方向。但大多数方案止步于简单的「用 AI 写一段文字」——质量不可控、风格不稳定、前后矛盾频发。
Bookskill 是一个完全不同的方案。它不是简单的 AI 写作工具,而是一条确定性小说生产管线,由 Python 驱动,每章仅调用 2 次 LLM(Plan + Draft),其余全部由纯 Python 引擎自动完成。它带有 4 道质量门禁(CP1-CP4)、112 维自动审计引擎(零 token 消耗)、10+ 维度的 Truth 一致性检查系统,以及 5 级去 AI 味润色引擎。
本文将全面解析 bookskill 管线系统的功能架构、设计哲学和核心特性。
一、5 阶段确定性管线(5-Phase Deterministic Pipeline)
这是 bookskill 的核心架构。每章的生产流程被拆分为 5 个严格的阶段,依次执行,每个阶段都有明确的输入、输出和质量标准。
Phase1_Plan:章节规划
由 LLM 执行,但输入不是简单的提示词——系统会加载 Truth 数据(角色档案、世界观设定、时间线、道具清单、关系图谱、技术设定等)和上一章的情节摘要,生成结构化的章节规划 JSON。
规划文件包含:章节类型(A/B/C/D 四选一)、场景数量(≥2)、情感弧线、叙事目标(≥5 条)、红线约束、禁止事件清单、伏笔设计、每个场景的时间/地点/角色/核心事件/字数目标/感知焦点/感官锚点/场景进出场等 20+ 个字段。
场景级字段有严格的最小长度要求:scene_entry ≥50 字符、perception_focus ≥200 字符、sensory_anchor ≥50 字符。这些约束在写入阶段就强制满足,避免后期反复修补。
Phase2_Validate:Truth 预检与 CP1
这是第一个门禁阶段,完全由 Python 自动化执行,零 token 消耗。核心功能包括:
- 角色预检:检查本章出场角色是否在 Truth 档案中已注册,状态是否正确(已故角色不能出场)
- 世界观预检:检查场景地点是否在 Truth 世界设定中有记录
- 设定预检:检查本章涉及的技术设定、力量体系设定是否与已有设定一致
- 红线检查:逐一验证规划中的「不能做的事情」是否在情节设计中体现
- 写作简报生成:自动汇总 Truth 数据、伏笔状态、角色状态,生成结构化的写作简报 HTML
CP1 门禁标准:11 项 Truth 预检全部通过。
Phase3_Draft:场景级并行起草
由 LLM 执行,但做了关键优化——场景级并行起草。系统将规划中的 N 个场景自动分拆,可以并行调用 LLM 分别起草,再由 Orchestrator 汇聚。每个场景作为独立单元编写,格式为带完整场景信息的 JSON 结构。
同时 CP2 硬性门槛在此阶段检验:
- 全章 CJK 字数 ≥5000
- 对话比 5%-30%(「」内 CJK / 总 CJK)
- 破折号 —— 不超过 2 个
- 零容忍禁用词:仿佛、似乎、好像、深吸一口气、瞳孔骤缩、嘴角勾起、某种、一股
- 零容忍句式:"不是{1,20}而是"
违反了任何一条即退回重写,不允许绕过。
Phase4_Review:112 维审计与 CP3
完全 Python 驱动,零 token 消耗。审计引擎从 12 个组(A-L)共 112 个子维度对章节文本进行评分,满分 1120 分。评分结果精确到小数点后一位。
CP3 门禁标准:总分 ≥878/1120。不达标时系统自动尝试 PolishEngine L2 润色后重审,仍失败则退回 Phase3 重写。
Phase5_Release:加权终审与 HTML 发布
CP4 门禁采用加权公式计算:
````
最终得分 = 审计得分 × 0.40 + Truth 一致性 × 0.25 + 连贯性 × 0.20 + 风格 × 0.15
即使 CP3 审计得分接近但未达标,如果 Truth 一致性和连贯性分数高(这是确定性管线的强项),CP4 加权后的总分通常仍能达到 ≥878 的门禁线,体现了「写对比写好更重要」的设计理念。
通过 CP4 后,系统自动生成 1120px 衬线字体的发布版 HTML,包含排版样式、章节信息元数据和可选的阅读器首页刷新功能。
二、112 维审计引擎(112-Dimension Audit Engine)
这是 bookskill 最具技术特色的组件——一个完全纯 Python 实现的、零 token 消耗的、覆盖 12 组共 112 个子维度的文本质量审计系统。
12 个审计组
| 组 | 权重 | 审计内容 | 核心指标 |
|---|---|---|---|
| A 角色 | 10 | 角色名交替频率、动作描写密度、对话风格差异度、角色弧线完整性 | 角色名/他 比例、动作动词密度、性格特征词频率 |
| B 逻辑 | 10 | 时间标记密度、因果链覆盖率、矛盾检测、过渡自然度 | 时间词频率、因果连词频率、前后矛盾数量 |
| C 情节 | 8 | 悬念设计、伏笔呼应、高潮结构、节奏曲线 | 悬念词频率、转折词频率、章节内部冲突阶梯 |
| D 意象 | 8 | 通感使用、比喻密度、氛围描写、象征元素 | 通感句式数量、比喻频率、环境描写占比 |
| E 语言 | 10 | 标点多样性、「的」字密度、句式丰富度、冗余修饰词 | 句尾标点分布、的/总字数比、平均句长方差 |
| F 体验 | 10 | 情感词覆盖、沉浸感描写、细节密度、内心活动 | 情感词频率(喜怒哀乐悲惊恐)、沉浸类词汇数 |
| G 题材 | 10 | 题材特征词密度、题材专属概念使用率 | 按 7 类题材分别匹配关键词(都市/仙侠/科幻/言情/奇幻/游戏/悬疑) |
| H 视觉 | 8 | 视角清晰度、画面感、远景/特写交替、外形描写 | 视觉描写占比、视角转换标记、外形相关词 |
| I 行业 | 6 | 行业术语密度、专业场景描写、技术准确度 | 行业词频率(代码/系统/数据/算法等) |
| J 时代 | 6 | 时代标志物使用、年代感、文化背景呈现 | 时代词频率(微信/抖音/内卷/网约车等) |
| K AI味 | 10 | 禁止句式检测、模糊词密度、套路化描写标记 | "不是…而是" 句式数量、或许/也许/可能/大概 频率、套路词(瞳孔骤缩/嘴角勾起/深吸一口气) |
| L Truth | 4 | 角色名一致性、地名一致性、道具状态、已故角色排除 | 与 Truth 档案的字符级匹配度、道具状态错误数、已故角色出场次数 |
每个维度的评分逻辑是预定义的 Python 函数——使用正则表达式、频率统计、比率计算等纯计算手段,不存在任何 LLM 调用的黑盒,结果 100% 确定和可复现。
关键词系统
审计关键词外部配置在 config/audit_keywords.json 中,覆盖 12 组 × 10 维的关键词库。同时配置了 JSON Schema 校验文件确保格式正确。系统支持运行时热加载和缓存失效。
外部化的关键词配置意味着用户可以通过修改 JSON 文件来调整审计标准,无需修改 Python 代码——这为非技术背景的内容创作者提供了定制审计的能力。
三、质量门禁系统(CP1-CP4)
bookskill 的质量门禁不是简单的阈值检查,而是一个带自动回退路径的分级控制系统。
| 门禁 | 所在阶段 | 标准 | 失败处理 |
|---|---|---|---|
| CP1 | Phase2_Validate | 11 项 Truth 预检通过 | 回到 Phase1 修正 Plan |
| CP2 | Phase3_Draft | ≥5000 CJK + 对话比 5-30% + 零禁用词 | 重写 Draft |
| CP3 | Phase4_Review | 审计得分 ≥878/1120 | Polish L2 重审 → 仍失败则回 Phase3 |
| CP4 | Phase5_Release | 加权综合 ≥878 | 条件精修后强制发布 |
每个门禁的失败处理是自动化的,不需要人工介入。系统会自动选择回退路径,执行修复,然后重新提交检查。
门禁的容错机制设计体现了「写对比写好更重要」的工程哲学——在无法达到 S 级质量时,保持 A 级质量并通过缓存 Truth 一致性来弥补,是比无限循环更务实的选择。
四、Truth 一致性系统
Truth 是 bookskill 最具差异性的设计之一。它不是简单的角色档案,而是一个多维度的结构化世界知识库。
10+ Truth 维度
Truth 系统以 JSON 文件存储在项目的 truth/ 目录中,包含:
- truth_characters.json — 角色档案:姓名、首次出场章节、角色类型、当前状态(存活/死亡/失踪)、别名、性格标签、角色弧线记录
- truth_world.json — 世界观设定:地理、组织、势力、特殊规则
- truth_timeline.json — 时间线:每章的时间坐标、标题、情节摘要
- truth_tech.json — 技术设定:AI 能力树、技术水平、关键技术节点
- truth_power.json — 力量体系:等级、技能树、增强人分类
- truth_props.json — 道具清单:重要物品、状态、出场章节
- truth_plot.json — 情节弧线:大纲、伏笔、伏笔激活状态
- truth_relationships.json — 关系图谱:角色间关系、亲密度、变化历史
- truth_concepts.json — 核心概念:定义和引用关系
- voice_fingerprints.json — 角色声纹:各角色的语言风格参数
Truth 在管线中的使用
Truth 数据在每一个阶段都发挥关键作用:
- Phase1 Plan 阶段:Truth 数据作为上下文注入 LLM 提示词,确保规划符合已有设定
- Phase2 Validate 阶段:对比本章出场角色、地点、道具与 Truth 的一致性
- Phase4 Review 阶段:L 组(Truth)审计检测角色名拼写、道具状态、已故角色等问题
- Phase5 Release 阶段:Truth 一致性作为 CP4 加权公式的 25% 权重
Truth 变更跟踪
管线执行过程中,系统会自动记录本章对 Truth 的变更——新增角色、状态变更、关系变化——输出到 truth_changes 字段。这些变更为后续章节的 Truth 更新提供了依据,实现了跨章的知识积累和一致性维护。
五、润色引擎(PolishEngine)
PolishEngine 是一个纯 Python 5 级去 AI 味检测 + 3 级自动润色系统,无需 LLM 调用。
5 级检测
| 级别 | 检测内容 | 示例 |
|---|---|---|
| L1 词汇级 | 禁用词库匹配 | 仿佛/似乎/好像、某种、一股、不禁 |
| L2 句式级 | 正则模式匹配 | "不是…而是"、连串排比、"的" 字堆叠 |
| L3 语义级 | 套路化模式识别 | "嘴角勾起一抹弧度"、"眼神深邃" |
| L4 段落级 | 叙事节奏异常 | 连续 3 段以上同一句式开端 |
| L5 篇章级 | 整体结构评估 | 缺少收尾段落、对话比例异常 |
3 级自动润色
- L1 自动替换:禁用词一键替换(仿佛 → 像是,深吸一口气 → 缓缓吸了一口气)
- L2 句式重构:简化"不是…而是"句式,优化排比结构(潜在风险:可能去除过多叙事内容)
- L3 深度精修:段落级重写,调整叙事节奏(仅限紧急情况)
注意:PolishEngine 的 L2-L4 深度精修对于写实题材类小说有时会降低审计得分,因为它可能移除叙事性的对话模式。因此推荐的策略是优先使用 L1 替换 + 手动关键词注入,而不是依赖自动润色整体提分。
六、闭环编排系统(Loop Orchestrator)
基于《Loop Engineering 到底是什么?看这一篇就够了》的核心理念,bookskill 管线升级为完整的 Closed Loop 系统,这是使管线能够「无人值守运行」的关键组件。
核心原则
| 原则 | 实现方式 |
|---|---|
| 把循环体从人换成 Agent | LoopOrchestrator 完全接管管线执行,用户仅设定目标 |
| Memory 活在对话之外 | 迭代历史持久化到 chXX_loop_state.json + 跨章长时记忆 |
| 有界目标 | 以 CP1-CP4 为验收标准,达标 Ship,不达标 Iterate |
| Self-prompting | Agent 根据失败根因自写修正 Prompt |
| 有预算的重试 | 每阶段 1-3 次,全管线 ≤10 次总重试 |
| Fan-out/Fan-in | 场景级并行起草 + 汇聚 |
迭代记录
每次迭代的完整状态写入 0_runtime/chXX_loop_state.json:
- iterations:各阶段迭代历史(尝试次数、状态、时间戳)
- retry_counts:重试计数
- failed_gates:门禁失败详情(哪个维度的哪项检查未通过)
- budget:全局重试预算使用情况
- decisions:自动决策日志(含逃逸触发记录)
逃逸机制
当重试预算耗尽时,系统执行预定义的逃逸策略:
- Phase1 失败 → 简化 Plan 结构(减少场景数)后重试
- Phase3 失败 → 降低字数门槛后重试
- Phase4 失败 → 使用 PolishEngine L3 深度精修后重审
逃逸机制确保管线不会因单章的质量瓶颈而无限循环。
七、语言配置文件系统(Language Profiles)
Bookskill 支持多语言写作场景,通过 config/language_profiles.json 配置不同语言的字数阈值、对话标记符号和句尾标点模式。
可配置参数
| 参数 | 作用 | 默认(zh-CN) |
|---|---|---|
| cjk_min_chapter | 每章最低 CJK 字数 | 5000 |
| dialogue_min/max_ratio | 对话比范围 | 5%-30% |
| dialogue_open/close | 对话标记符号 | 「」 |
| sentence_ends | 句尾标点集合 | 。!?;… |
运行时工作方式
系统通过 LanguageProfileManager 单例管理配置的加载和缓存:
``python``
from bookskill.pipeline import get_default_profile, set_active_language
zh = get_default_profile() # zh-CN 默认
en = get_profile("en") # English profile
set_active_language("en") # 切换全局语言
缺失的字段自动回退到 constants.py 中的硬编码默认值,保证向后兼容。新增配置只需在 language_profiles.json 中添加条目,然后运行 pytest tests/test_language_profiles.py 验证。
八、全书级功能
除了单章管线,bookskill 还提供了多个全书级的功能,支撑长篇小说的宏观管理。
全书审计
pl.run_full_book_audit(start_ch=1, end_ch=30)
跨章节一致性诊断。检查内容:角色名在各章中是否一致、时间线是否有跳跃矛盾、道具状态是否跨章衔接、伏笔是否被妥善回收。
设定协调
pl.run_setting_coordination()
当小说中期的设定发生变更时,自动回溯已写章节中所有可能受影响的场景,标记需要更新的部分。这解决了长篇小说创作中最头痛的问题之一:「前面写的设定和中期的设定冲突了,人工回溯成本极高」。
关系图谱生成
pl.generate_relationship_graph(format="mermaid")
# 或 format="ascii"
自动从 Truth 关系数据中生成角色/势力关系图。支持 Mermaid 格式(可直接嵌入 Markdown 文档渲染)和 ASCII 格式(纯文本环境使用)。
跨章记忆系统
RecurrentGPT 风格的双重记忆架构:
- 短时记忆:最近 3 章的情节摘要和角色状态
- 长时记忆:跨章累积的设定事实和角色变化记录
短时记忆在每个新章节启动时自动加载,长时记忆通过 Truth 变更记录逐步累积。每章执行完成后,系统自动将本章新增的 Truth 变更合并到长时记忆中,后续章节启动时自动加载变更后的完整 Truth 数据。
伏笔跟踪系统
伏笔是长篇小说创作中最难控制的元素之一。Bookskill 的 Truth 系统支持伏笔的生命周期管理:每个伏笔在创建时记录 ID、类型(技术伏笔/人物伏笔/情节伏笔等)、预期回收章节。审计引擎的 C 组(情节)在评分时会检查伏笔是否在合理范围内被提及和使用。全书审计功能则标记出即将达到回收章节但未曾出现的伏笔。
场景插图系统
在每个场景的规划阶段,系统自动生成场景的可视化描述——包含场景布局、角色位置、光线方向、色彩基调等信息的文本描述,可用于后续 AI 图像生成。这是从文本到视觉的桥接设计,目前支持以 ASCII 布局图的形式输出场景的空间关系。
技能系统
5 个可插拔的写作技能模块:节奏控制、对话设计、感官描写、悬念设置、节奏编排。每个技能是一组预定义的写作规则和关键词库,在 Phase1 规划阶段注入 LLM 提示词。
九、协议与契约(Agent Behavior Contract)
Bookskill 为 AI Agent 执行者设定了一套严格的 「铁律」 约束,确保管线执行的稳定性和可预测性。
核心禁止行为
- 禁止提问:绝对不允许向用户产生「需要继续吗」「要推进吗」「是否确认」等任何形式的确认性问题
- 禁止暂停:一旦管线启动,不允许中途停下来等待用户
- 禁止绕过失败:不允许手动修改 review.json 的 passed_cp3 字段欺骗门禁
- 禁止盲 rerun:任何修复后必须用本地断言验证,确认修好后再提交下一阶段
执行规则
- 全自动闭环:执行链启动后必须按序执行到终点或不可恢复的异常
- 读规则再行动:任何 Agent 必须先完整阅读 SKILL.md 全文再开始执行
- 失败自动恢复:按预定义的回退路径执行
- 修复→验证→提交:任何修复后,本地断言确认达标再提交
规则优先级
| 优先级 | 来源 | 作用 |
|---|---|---|
| 1(最高) | 用户本轮的明文指令 | 覆盖以下所有规则 |
| 2 | SKILL.md 的 Agent Behavior Contract | Agent 行为准则,不可违反 |
| 3 | config/pipeline.yaml | 管道阶段定义、执行序列、回退路径 |
| 4 | pipeline/ 下 Python 源码 | 具体实现逻辑 |
十、脚本工具链
Bookskill 配备了一套完善的工具脚本,覆盖开发、测试、部署全流程。
| 脚本 | 功能 |
|---|---|
scripts/sync.py |
同步主仓库修改到子项目 |
scripts/verify.py |
CP2 合规检查(CJK 字数、对话比、禁用词) |
scripts/merge_draft.py |
合并场景级草稿 |
scripts/bump_version.py |
版本号升级 + git tag |
pytest tests/ |
运行全量测试套件 |
测试套件
测试覆盖了 bookskill 的所有核心功能:
- test_audit_keywords.py — 审计关键词加载和校验
- test_audit_groups_gij.py — 题材/行业/时代维度评分
- test_audit_utils_extended.py — 审计工具函数
- test_loop_orchestrator.py — 闭环编排器
- test_language_profiles.py — 语言配置系统
- test_polish_levels.py — 润色引擎各级别检测
- test_release_integration.py — 发布引擎集成测试
- test_e2e.py — 端到端管线测试
十一、题材支持系统
Bookskill 支持 7 种小说题材,每种题材有专属的关键词库和审计标准。
| 题材 | 关键词示例 | 适用场景 |
|---|---|---|
| 都市 urban | 手机/微信/公司/地铁/网约车/加班 | 现实职场、情感 |
| 仙侠 xianxia | 飞升/道心/机缘/悟道/剑意 | 修仙传统题材 |
| 玄幻 xuanhuan | 灵气/修炼/突破/境界/功法 | 东方玄幻 |
| 科幻 scifi | 星际/量子/虫洞/机甲/意识上传 | 硬科幻、赛博朋克 |
| 言情 romance | 心动/告白/恋爱/重逢/婚姻 | 都市婚恋、古风言情 |
| 奇幻 fantasy | 魔法/咒语/龙/精灵/剑与魔法 | 西方奇幻 |
| 游戏 game-lit | 副本/技能/装备/等级/经验值 | 游戏异界、电竞 |
| 悬疑 mystery | 线索/嫌疑人/调查/推理/密室 | 侦探推理、犯罪悬疑 |
题材选择影响 G 组审计的评分标准——都市题材侧重手机/微信等现代生活词汇,仙侠题材侧重修炼/突破等修行词汇。不同题材的关键词库通过 audit_keywords.json 外部配置,支持运行时扩展。
值得注意的是,对于写实题材(如都市职场类),G 组(题材)和 H 组(视觉)、D 组(意象)的天然得分会低于仙侠玄幻类——因为写实题材的视觉画面感和意象密度本就不如幻想题材高。Bookskill 的审计系统对此有预期,不要求所有组都达到高分,而是通过高权重组的补偿来维持总分。实战中,写实题材的 A 组(角色)、B 组(逻辑)、E 组(语言)、K 组(AI味)可以冲高到 80-90 分以上,这些组的权重合计 40 分,足以拉平 D/H/G/J 等低分组的差值。
十二、发布与输出
管线最终输出是一个标准的 1120px 衬线字体 HTML 文件。
发布版 HTML 特点
- 使用 "Noto Serif SC" / "Source Han Serif SC" 衬线字体
- 最大宽度 1120px,符合中文阅读的最佳行长
- 行高 2 倍,字号 17px,针对小说阅读优化的排版
- 深色/浅色主题支持
- 每段首行缩进 2 字符(中文出版标准)
- 包含章节编号、标题、审计得分的元数据
- 自动生成或刷新阅读器首页(index.html)
阅读器首页
generate_reader.py 脚本生成一个完整的 HTML 阅读器首页,以表格形式列出所有已发布章节,包含章节号、标题、审计得分、CP3/CP4 通过状态、字数。这是全书阅读的入口。
CP4 加权公式详解
final = audit_score × 0.40 + truth_consistency × 0.25 + continuity × 0.20 + style × 0.15
- audit_score:112 维审计引擎的原始得分(/1120),权重 40%
- truth_consistency:本章 Truth 变更次数决定的得分——变更越少、一致性越高,权重 25%
- continuity:连贯性问题数量决定的得分——问题越少、连贯性越高,权重 20%
- style:E 组(语言)得分 × AUDIT_SCALE_FACTOR,权重 15%
这种加权设计使得审计得分接近但不达标(如 870/1120)的章节,仍然可以通过 Truth 高一致性(通常接近满分)和连贯性高质量通过 CP4。
十三、架构设计原则
回顾 bookskill 的整个设计,可以看到几个核心的架构哲学:
确定性优先
管线的核心原则是「确定的比不确定的好」。只有 Phase1 和 Phase3 使用 LLM(非确定性),其余全部由 Python 实现(可复现、可测试、零 token 成本)。112 维审计引擎没有任何黑盒——每个分数都可以追溯到具体的 Python 函数调用。
质量内建(Quality Built-in)
系统不依赖后置修补,而是在每个阶段强制要求前置质量。Plan 阶段的字段有最小长度要求,写入时就达标;Draft 阶段的硬约束(CJK 字数、禁用词)在同一阶段验证。这种设计避免了最昂贵的「写好再改」模式。
知识外化
Truth 系统将世界设定和角色数据外化为结构化 JSON,使管线中的每个阶段都能引用和检查。语言配置和审计关键词外部化为 JSON 文件,用户无需修改 Python 代码即可定制系统的行为。
有预算的迭代
闭环编排器支持有限次数的自动重试,而不是无限循环。重试预算耗尽时执行逃逸策略——这是工程系统而非学术实验的务实选择:在无法达到完美时,接受足够好。
结语
Bookskill 不是一个通用的 AI 写作工具,而是一条为长篇连续性小说定制的确定性生产线。它将质量控制的工程方法引入创意写作领域——门禁系统保证基线质量、Truth 系统消除一致性悲剧、审计引擎提供客观可量化的反馈、闭环编排器实现无人值守的章节生产。
这套系统最适合的场景:长篇类型小说(都市、科幻、仙侠、悬疑等)、需要严格前后一致性的系列作品、以及追求稳定输出节奏的内容生产。
最大的特色在于它所体现的工程思维——写对比写好更重要,一致性比惊艳更持久。在一个套路一眼就会被识破的时代,能够始终如一地讲好一个没有破绽的故事,本身就是一种稀缺能力。
Hermes Agent 77 个命令完全指南:按功能分类的权威参考
Hermes Agent 77 个命令完全指南:按功能分类的权威参考
开篇:什么是 Hermes Agent?
在 AI 智能体工具快速演进的 2026 年,开源的 Hermes Agent 正以它独特的开放性和灵活性赢得越来越多开发者的青睐。由 Nous Research 开发的这款 AI 智能体框架,可以运行在终端、桌面应用、消息平台和 IDE 中,与 Claude Code(Anthropic)、Codex(OpenAI)、OpenCode 等工具同属一个品类——但 Hermes 有几个核心差异化特性让它脱颖而出。
Hermes 最大的特色是提供商无关。你可以随时切换 OpenRouter、Anthropic、OpenAI、DeepSeek、Google Gemini、xAI Grok、HuggingFace、本地模型等 20 多家提供商,而工作流完全不变。这是业界少有的真正实现「模型无关」的智能体框架。它还支持凭证池化——同一个提供商可以配置多个 API Key,自动轮换使用,当某个 Key 耗尽时自动跳过。
另一大特色是自我进化的技能系统。Hermes 会从每次交互中学习,将可复用的工作流保存为技能文档(SKILL.md)。当你解决了一个复杂问题、发现了一个工作流、或者被纠正了错误,这些知识可以固化为技能,在未来的会话中自动加载。技能会随时间积累,让代理越来越擅长你的特定任务和场景。
跨会话持久记忆让 Hermes 记住你是谁、你的偏好、环境细节和经验教训。记忆后端可插拔(内置 SQLite、Honcho、Mem0 等),你可以自由选择。
还有多平台消息网关——同一个智能体实例可以同时运行在 Telegram、Discord、Slack、WhatsApp、iMessage、Signal、Matrix、Teams、Email 等 20 多个平台上,拥有完整的工具调用能力,不只是聊天机器人。
Hermes 的能力部分来自于它丰富而精细的命令体系。本文全面梳理 Hermes Agent 的 77 个核心命令,按功能分类一一解读。
一、基础交互命令
这是 Hermes 最常用的命令组。Hermes 默认进入交互式聊天模式,但同时也提供了丰富的非交互式选项,方便脚本调用和 CI/CD 集成。
hermes — 启动交互式对话
无参数启动,进入交互式聊天界面。这是最常用的入口。启动后可以持续对话,Hermes 会跨轮次保持上下文。用户每输入一条消息,Hermes 会调用 LLM 并执行工具调用,然后返回结果。这个循环持续进行,直到用户退出。
hermes chat — 精细化聊天控制
显式启动聊天模式。支持多种子选项:
-q, --query TEXT — 单次查询模式,非交互式。这是脚本调用的主力选项。例如 hermes chat -q "列出当前目录下的所有 Python 文件并统计行数" 会返回结果后自动退出。适合集成到 Makefile、CI 流水线、定时任务中。
-m, --model MODEL — 指定模型,覆盖配置中的默认设置。例如 hermes chat -m anthropic/claude-sonnet-4 使用 Claude Sonnet 4,或者 hermes chat -m openai/gpt-4o 使用 GPT-4o。模型名称格式为 提供商/模型名。
-t, --toolsets LIST — 指定启用的工具集,逗号分隔。例如 -t terminal,file,web 只加载终端、文件和网络搜索三个工具集。这可以减少 Token 消耗、提升专注度。
--provider PROVIDER — 强制指定提供商,不依赖默认配置。例如 --provider openrouter。
-v, --verbose — 详细输出模式,显示模型调用详情、工具执行过程、API 耗时等调试信息。
-Q, --quiet — 静默模式。隐藏启动横幅、旋转动画、工具调用预览等非必要输出。适合在终端输出需要被其他程序解析的场景。
--checkpoints — 启用文件系统检查点。Hermes 会在关键操作前自动创建快照,可以用 /rollback 命令回滚到之前的文件状态。这是实验性操作的防护网。
--source TAG — 设置会话源标签。默认值为 cli。当你从不同入口(CLI、桌面、Web、Telegram)使用 Hermes 时,这个标签帮助区分会话来源,方便后续统计和分析。
会话恢复与分支
hermes --resume, -r SESSION — 按会话 ID(如 20260228_143052_a1b2c3)恢复历史会话。适合工作中断后精确回到之前的上下文。
hermes --continue, -c [NAME] — 按名称恢复最近会话。不传名称时恢复最近一个会话。比 --resume 更方便快捷。
hermes --worktree, -w — 隔离的 git worktree 模式。适用于并行运行多个代理分别处理不同分支,避免 git 文件冲突。每个 worktree 有独立的文件系统视图。
启动预配置
hermes --skills, -s SKILL — 预加载技能列表。可重复使用或逗号分隔。例如 hermes -s python-debugging,git-workflow 在启动时即加载调试和 Git 工作流两个技能。技能中包含的提示会注入系统提示,指导 Hermes 的行为。
hermes --profile, -p NAME — 使用指定的配置启动。配置文件有独立的 skills/、plugins/、cron/、memories/ 目录。适合在同一台机器上运行多个用途不同的 Hermes 实例。
hermes --yolo — 跳过所有危险命令的审批提示。默认情况下 Hermes 会在执行 rm -rf、git reset --hard 等破坏性命令前请求用户确认。--yolo 跳过这个保护层,谨慎使用。
hermes --pass-session-id — 在系统提示中包含当前会话 ID。某些高级场景下,子代理或外部系统需要知道自己所属的会话上下文。
二、配置管理命令
配置是 Hermes 的基础层。面向新用户和需要精细化控制的高级用户分别提供了不同层次的命令。
交互式向导
hermes setup [section] — 交互式配置向导,是新手最友好的入口。不加参数时启动全流程向导,引导用户逐步完成模型选择、终端配置、API Key 设置等步骤。
分模块设置:
- hermes setup model — 仅配置模型和提供商
- hermes setup terminal — 仅配置终端后端(本地/Docker/SSH/Modal)
- hermes setup gateway — 仅配置消息网关
- hermes setup tools — 仅配置工具启用/禁用
- hermes setup agent — 仅配置代理行为参数
每个子向导都是独立的 curses TUI,支持方向键选择、空格键切换、回车确认。
hermes model — 交互式模型/提供商选择器。打开一个列表界面,显示所有支持的提供商和可用的模型。可以选择模型后自动测试连通性。支持 20 多家主流提供商:OpenRouter、Anthropic、OpenAI、Nous Portal、GitHub Copilot、Google Gemini、DeepSeek、xAI Grok、HuggingFace、Z.AI/GLM、MiniMax、Kimi/Moonshot、阿里 DashScope、小米 MiMo、Kilo Code、OpenCode Zen/Go、Qwen OAuth 等。此外还支持自定义端点。
配置文件操作
hermes config — 查看当前配置摘要,包括模型、提供商、上下文长度、终端类型、工具状态等关键信息。
hermes config edit — 在系统默认编辑器中打开 config.yaml。在 CLI 模式下会使用 $EDITOR 环境变量指定的编辑器。
hermes config set KEY VAL — 直接设置配置项,无需编辑器。支持点号分隔的层级键名:
- hermes config set model.default deepseek/deepseek-chat
- hermes config set display.interface tui
- hermes config set security.redact_secrets true
- hermes config set approvals.mode smart
hermes config path — 打印 config.yaml 的完整文件路径。
hermes config env-path — 打印 .env 文件的完整路径。API Key 和安全凭据存储在此文件中。
配置健康检查
hermes config check — 检查当前配置是否存在缺失的必填项、已废弃的选项、或格式不正确的值。生成检查报告,列出问题和修复建议。
hermes config migrate — 升级配置文件的必要工具。当 Hermes 新版本引入新的配置选项时,migrate 会将缺失的选项以默认值添加到现有配置中,保证配置文件的完整性。
诊断命令
hermes doctor [--fix] — 全面的健康检查命令。诊断范围包括:
- Python 环境和依赖版本
- 模型提供商连通性
- 终端后端可用性
- 工具集依赖完整性
- API Key 有效性
- 配置文件完整性
- 技能目录结构
- 数据库状态
带 --fix 参数时会尝试自动修复发现的问题。
hermes status [--all] — 显示各组件运行状态。默认显示摘要:模型状态、工具状态、网关状态、存储状态。--all 显示全部组件的详细状态。
三、工具与技能管理命令
Hermes 的核心能力来自可插拔的工具系统和可积累的技能库。工具决定了代理能做什么,技能决定了代理知道怎么做。
工具管理
Hermes 的工具系统采用「工具集」架构。每个工具集包含一组相关的工具。例如 terminal 工具集包含 shell 命令执行、进程管理、后台任务等工具;web 工具集包含网页抓取、搜索引擎、内容提取等工具。所有工具集定义在 toolsets.py 的 TOOLSETS 字典中。
hermes tools — 交互式工具启用/禁用界面。基于 curses 的 TUI,左侧显示所有工具集,右侧显示选中工具集的详细工具列表。支持按平台分别配置——例如在 Telegram 上禁用 browser 工具集,在 CLI 上保留。
hermes tools list — 以文本列表形式输出所有工具集及其状态(启用/禁用/按平台启用),便于脚本解析。
hermes tools enable NAME — 启用指定工具集。例如启用图像分析能力:hermes tools enable vision。启用后需要 /reset 新会话才能生效。
hermes tools disable NAME — 禁用指定工具集。例如在安全敏感场景中禁用网络访问:hermes tools disable web。
技能管理
技能是 Hermes 最独特的机制。每个技能是一个包含 YAML 前置元数据和 Markdown 正文的 SKILL.md 文件。技能可以包含精确的指令、命令示例、陷阱警告、验证步骤。当技能加载到会话中时,其内容注入系统提示,指导模型的行为。
hermes skills list — 列出所有已安装技能,显示名称、描述、版本、作者、安装来源。
hermes skills search QUERY — 在官方技能中心搜索可用但尚未安装的技能。搜索范围覆盖社区贡献的数百个技能。
hermes skills install ID — 安装技能。ID 可以是中心注册的标识符,也可以直接是一个 HTTPS 链接指向 SKILL.md 文件。后者支持私有仓库中的技能。使用 --name 参数可以覆盖技能在元数据中定义的名字。
hermes skills inspect ID — 预览技能内容和元数据,但不实际安装。用于评估技能是否适合自己使用。
hermes skills config — 按平台配置技能的启用/禁用状态。例如可以让 git-workflow 技能仅在 CLI 中加载,而在 Telegram 中禁用。
hermes skills check — 检查所有已安装技能是否有可用的更新版本。
hermes skills update — 批量更新所有过时的技能到最新版本。
hermes skills uninstall N — 通过索引号移除已安装的技能。
hermes skills publish PATH — 将本地开发的技能发布到官方技能注册中心。
hermes skills browse — 浏览全部分类下的所有公开技能。支持按分类、评分、安装量排序。
hermes skills tap add REPO — 添加 GitHub 仓库作为技能来源。技能将从指定仓库中自动发现和同步。
四、MCP 服务器管理命令
Model Context Protocol 是 AI 工具互操作的标准协议。Hermes 既可以作为 MCP 客户端连接外部服务,也可以作为 MCP 服务器暴露自身能力。
hermes mcp serve — 将 Hermes 自身作为 MCP 服务器运行,暴露其工具给其他 MCP 客户端(如 VS Code、Zed、JetBrains 等 IDE)。
hermes mcp add NAME — 添加一个 MCP 服务器连接。支持两种连接模式:
- --url 参数连接到远程 HTTP MCP 服务器
- --command 参数运行本地 MCP 服务器进程(stdio 模式)
例如 hermes mcp add filesystem --command "npx @modelcontextprotocol/server-filesystem /path" 添加文件系统 MCP 服务器。
hermes mcp remove NAME — 移除已配置的 MCP 服务器。
hermes mcp list — 列出所有已配置的 MCP 服务器及其状态(连接/断开)。
hermes mcp test NAME — 测试指定 MCP 服务器的连通性,返回工具列表和执行测试。
hermes mcp configure NAME — 切换 MCP 暴露的工具的选择——可以选择将哪些工具暴露给模型使用,哪些隐藏。
五、消息网关命令
Hermes 的网关支持 20 多种消息平台,这意味着你可以在 Telegram 上命令 Hermes 编写代码、在 Slack 中让它分析数据、在 WhatsApp 上让它查询数据库——所有平台共享同一个智能体核心,但走不同的安全策略和审批流程。
hermes gateway run — 前台运行消息网关。日志直接打印到终端,适合调试和验证配置。按 Ctrl+C 停止。
hermes gateway install — 将网关安装为后台服务。Linux 下使用 systemd user service,Windows 下使用 Windows Service。
hermes gateway start / stop — 手动启动/停止已安装的网关服务。
hermes gateway restart — 重启网关服务。在修改配置或更新后使用。
hermes gateway status — 检查网关运行状态,显示是否正在运行、启动时间、连接的平台列表、消息统计。
hermes gateway setup — 交互式配置消息平台。引导用户完成 Telegram Bot Token 配置、Discord Bot 权限设置、WhatsApp 二维码扫描等各平台特有的认证流程。
支持平台列表:Telegram、Discord、Slack、WhatsApp(Baileys 桥接 + 官方 Business Cloud API)、iMessage(Photon 协议,无需 Mac 中介服务器)、Signal、Email(IMAP/SMTP)、SMS、Matrix、Mattermost、Microsoft Teams、LINE、SimpleX、ntfy、Google Chat、Home Assistant、钉钉、飞书、企业微信、微信、Raft 代理网络、API Server、Webhooks。Open WebUI 可以通过 API Server 适配器连接。
六、会话管理命令
Hermes 的会话系统基于 SQLite + FTS5(全文搜索 5)引擎。所有对话记录持久化到本地,支持高效检索、导出和管理。
hermes sessions list — 列出最近的会话列表。每个条目显示会话 ID、标题(自动生成或用户设置)、开始时间、消息数量、使用的模型。输出按时间倒序排列。
hermes sessions browse — 交互式会话浏览器。支持搜索关键词筛选、时间范围过滤、模型筛选。选中会话后可以查看摘要或继续对话。
hermes sessions export OUT — 将会话导出为 JSONL(JSON Lines)格式文件。每行一个 JSON 对象,包含消息角色、内容、时间戳、工具调用记录。适合数据分析和模型微调。
hermes sessions rename ID T — 重命名指定会话。让你的会话列表更有条理。
hermes sessions delete ID — 永久删除指定会话。不可恢复,谨慎操作。
hermes sessions prune — 清理旧会话。支持 --older-than N days 参数指定天数阈值。超出阈值的会话将被删除。适合定期清理以节省磁盘空间。
hermes sessions stats — 显示会话存储统计:会话总数、消息总数、存储空间占用、平均每会话消息数等。帮助你了解使用规模和增长趋势。
七、定时任务命令
Hermes 内置的 cron 调度器支持从简单的间隔定时到复杂的 cron 表达式,每个任务可以加载技能、覆盖模型、指定工作目录、启用多平台投递。
hermes cron list — 列出所有定时任务。--all 参数同时显示已禁用的任务。每个条目显示任务 ID、名称、调度表达式、下次执行时间、执行次数、状态。
hermes cron create SCHED — 创建新定时任务。调度格式非常灵活:
- 持续时间:"30m"(每30分钟)、"2h"(每2小时)
- 自然语言:"every monday 9am"、"every weekday at 18:00"
- 标准 cron:"0 9 *"(每天上午9点)
- ISO 时间戳:一次性执行
创建时可以指定提示词、技能列表、模型/提供商、投递平台、工作目录等。
hermes cron edit ID — 编辑定时任务的配置。可以修改调度表达式、提示词内容、技能列表、投递方式、工作目录等。
hermes cron pause ID / resume ID — 暂停/恢复定时任务。暂停的任务不会触发执行,但保留配置和调度信息。
hermes cron run ID — 立即触发任务执行,不等候下一个调度周期。可以在测试时使用。
hermes cron remove ID — 删除定时任务。删除后不可恢复。
hermes cron status — 查看 cron 调度器的整体状态:是否在运行、任务总数、待执行任务数、历史执行统计。
每个任务支持丰富的配置:技能预加载、模型提供商覆盖、前置数据收集脚本(输出自动注入提示词上下文)、链式引用(将任务 A 的输出传递到任务 B)、工作目录挂载(自动加载该目录的 AGENTS.md/CLAUDE.md)、跨平台投递(同时发送到 Telegram 和邮件)。
八、Webhook 命令
Webhook 系统允许外部服务通过 HTTP POST 请求触发 Hermes 执行任务。与 cron 的时间驱动不同,webhook 是事件驱动的。
hermes webhook subscribe N — 注册 Webhook 路由。在 /webhooks/ 路径上创建一个新的端点。可以配置请求体模板、响应格式、认证方式。
hermes webhook list — 列出所有已注册的 Webhook 订阅。显示端点路径、创建时间、触发次数、最后触发时间。
hermes webhook remove NAME — 移除指定 Webhook 订阅。端点立即失效。
hermes webhook test NAME — 向指定 Webhook 发送测试 POST 请求,验证端点的连通性和响应。
Webhook 的典型应用场景:GitHub 推送事件触发代码检查、GitLab MR 事件触发自动测试、Zapier/Make 集成触发工作流、Prometheus 告警触发自动排障。
九、配置文件管理命令
配置文件(Profile)是 Hermes 支持多实例运行的基础设施。每个配置文件拥有完全独立的环境。
hermes profile list — 列出所有已有配置。显示名称、创建时间、使用的模型、技能数量、插件数量。默认配置高亮显示。
hermes profile create NAME — 创建新配置。支持克隆现有配置:
- --clone 从当前配置克隆
- --clone-all 克隆全部配置
- --clone-from NAME 从指定配置克隆
克隆时可以选择性地复制 skills/、plugins/、cron/、memories/ 目录。
hermes profile use NAME — 设置指定配置为系统默认。之后启动 Hermes 时自动使用该配置。
hermes profile delete NAME — 删除指定配置及其数据。
hermes profile show NAME — 显示配置详情:模型配置、工具集状态、技能列表、插件列表、记忆状态等。
hermes profile alias NAME — 管理配置的快捷包装脚本。创建类似 hermes-work、hermes-personal 的快捷命令。
hermes profile rename A B — 将配置 A 重命名为 B。
hermes profile export NAME — 将配置导出为 tar.gz 存档。适合备份或在机器间迁移。
hermes profile import FILE — 从存档导入配置。
十、凭证与密钥池管理命令
对于使用多个 API Key 或 OAuth 提供商的企业用户,Hermes 提供了强大的凭证管理功能。
hermes auth — 交互式凭证管理器,支持添加、列出、移除、重置各种提供商凭证。基于 curses 的 TUI 界面。
hermes auth add [PROVIDER] — 添加指定提供商的凭证。支持的提供商包括:
- nous — Nous Portal OAuth
- openai-codex — OpenAI Codex OAuth
- qwen-oauth — 通义千问 OAuth
- anthropic — Anthropic API Key
凭证添加后会自动加入对应提供商的凭证池。
hermes auth list [PROVIDER] — 列出指定提供商的凭证池。显示每个凭证的状态(有效/耗尽/错误)、添加时间、最后使用时间。不指定提供商时列出所有。
hermes auth remove P INDEX — 通过提供商名称和凭证索引移除单个凭证。
hermes auth reset PROVIDER — 清除指定提供商的费率限制或密钥耗尽状态。当 API Key 的限速解除后使用此命令恢复使用。
多凭证池化的核心价值:同样的提供商,配置多个 Key 后 Hermes 自动轮换使用;当某个 Key 因超出速率限制或消费额度耗尽而失败时,自动跳过并切换到下一个,保证了服务的高可用性。
十一、其他管理命令
这些命令覆盖了使用分析、桌面体验、IDE 集成、数据迁移等场景。
hermes insights [--days N] — 使用分析仪表盘。展示 API 调用量趋势、Token 消耗统计、模型使用分布、工具调用频率、会话时长分布等。默认显示近 30 天数据,可通过 --days 参数调整。
hermes update — 升级到最新版本的 Hermes Agent。从官方源拉取最新代码或 PyPI 包。
hermes desktop / hermes gui — 启动原生 Electron 桌面应用。支持 macOS、Linux、Windows。功能包括:流式聊天、会话列表、拖拽上传、剪贴板粘贴图片、Cmd+K 快捷命令面板、状态栏模型切换器、可配置快捷键、原生通知、实时子代理监控窗口、VS Code Marketplace 主题、远程网关登录。
hermes dashboard — 启动 Web 管理面板。完全在浏览器中运行,可以配置所有消息渠道、MCP 目录、Webhook/钩子、记忆系统、配置构建器(模型 + 技能 + MCP 组合)。内嵌了 hermes --tui 聊天界面。面板通过 OAuth/Token 认证保护。
hermes proxy — 启动 OpenAI 兼容的本地代理服务器,运行在 http://localhost:端口。这个代理的后端连接到你的 OAuth 提供商(Claude Pro、ChatGPT Pro、SuperGrok)。也就是说,你可以将 Codex CLI、Aider、Cline、Continue 或其他任何 OpenAI 兼容客户端指向这个代理,而无需 API Key。
hermes portal — 快速登录 Nous Portal,通过 OAuth 完成身份认证,无需手动配置 API Key。
hermes kanban — 多代理协作看板系统。支持 20 多个子命令:
- init、create、list、show、assign、link、unlink
- comment、complete、block、unblock、archive
- tail、watch、stats、runs、log
- dispatch、daemon、gc
看板使用 SQLite 持久化,支持多配置/多工作者协作。调度器可以在网关中自动运行,回收过期任务、推动就绪任务、分配工作者。
hermes pairing list/approve/revoke — 管理 DM 授权。控制哪些用户可以发送私信给代理。防止未经授权的用户访问代理能力。
hermes plugins list/install/remove — 插件管理。插件是扩展 Hermes 能力的轻量级方式,可以在 ~/.hermes/plugins/ 中安装自定义插件。
hermes secrets bitwarden ... — 集成 Bitwarden Secrets Manager 作为外部密钥存储。支持从 Bitwarden 读取 API Key 和配置文件。
hermes memory setup/status/off — 配置持久记忆系统。支持的后端包括:
- 内置 SQLite(默认,零配置)
- Honcho(开源记忆服务器)
- Mem0(记忆管理平台)
- Memory-based 工具调用
记忆系统包括两个维度:用户画像(用户偏好、角色、习惯)和工作记忆(环境细节、工具技巧)。关闭记忆:hermes memory off。
hermes send — 通过消息网关发送一条独立消息到指定平台。适合脚本调用:hermes send -p telegram "Deployment complete"。
hermes completion bash|zsh — 生成 shell 自动补全脚本。安装后可以在终端中输入 hermes 后按 Tab 查看命令和选项的自动补全提示。
hermes acp — 启动 ACP 服务器。ACP(Agent Communication Protocol)是 IDE 集成的标准协议。VS Code、Zed、JetBrains 等 IDE 可以通过 ACP 连接到 Hermes。
hermes claw migrate — 从 OpenClaw 迁移配置、会话和技能到 Hermes。简化了工具迁移的流程。
hermes uninstall — 完全卸载 Hermes Agent,包括配置、会话数据和技能。
十二、会话内斜杠命令
在交互式会话中,斜杠命令是最高频率的操作方式。输入 / 即可看到完整列表和提示。
会话控制命令
/new(/reset) — 开启全新会话,清除所有上下文和历史。当你需要从一个完全干净的状态开始时使用。
/clear — CLI 模式下清屏并新建会话。界面上的旧内容消失,但对话历史仍在会话数据库中。
/retry — 重新发送上一条消息。当模型生成失败、结果不符合预期或出现工具调用错误时使用。不会重置上下文,只是重试最后一次交互。
/undo — 撤销最近一次问答交换。删除模型最后一次回复和你的上一条消息,回到之前的状态。
/title [name] — 为当前会话命名。好的命名方便后续通过 --resume 或 --continue 快速找回。不传参数时自动生成标题。
/compress — 手动触发上下文压缩。当会话较长、接近模型上下文窗口限制时,Hermes 会自动压缩。手动压缩可以在你感觉响应变慢时使用。
/stop — 终止所有后台运行的子代理进程和长时间任务。
/rollback [N] — 恢复到之前的文件系统检查点。时间机器功能,当实验性操作破坏了文件时使用。
/snapshot [sub] — 创建或恢复 Hermes 配置和状态的快照。方便在重大配置变更前备份。
/background — 在后台运行一个提示词任务。适合耗时操作,不阻塞当前会话。
/queue — 将提示词排入队列,在当前任务完成后自动执行。
/steer — 在不打断当前工具调用流程的情况下注入一条消息。消息会在下一次工具调用结果返回后插入。
/agents(/tasks) — 显示所有活跃的子代理和待执行/正在执行的任务。
/resume [name] — 恢复之前命名的会话。
/goal [text|sub] — 设置常驻目标。Hermes 会在多轮对话中持续努力完成。支持 status(查看目标状态)、pause(暂停)、resume(恢复)、clear(清除)子命令。适合设定长期任务目标。
/redraw — 刷新 TUI 界面。当界面显示异常时使用。
配置控制命令
/config — 在会话中查看当前配置关键项。
/model [name] — 显示当前模型,或切换模型。不传参数时显示当前模型,传名称时在会话中切换。
/personality [name] — 设置或切换代理人格设定。人格定义影响回复风格和语气。
/reasoning [level] — 设置推理链可见级别。从 none(完全隐藏)到 xhigh(极度详细)。show 显示推理、hide 隐藏。
/verbose — 循环切换详细信息输出级别:off → new → all → verbose。
/voice [on|off|tts] — 语音模式控制。on 开启语音输入(自动语音识别)+ 语音输出(TTS);tts 仅开启语音输出;off 关闭。
/yolo — 在会话中切换危险命令审批绕过。相当于 --yolo 标志的运行时版本。
/busy [sub] — 控制 Hermes 工作时 Enter 键的行为:queue(将输入排入队列)、steer(在不中断的情况下输入)、interrupt(中断当前工作)、status(查看队列状态)。
/indicator [style] — 选择 TUI 忙碌指示器的风格:kaomoji(颜文字)、emoji(表情符号)、unicode(Unicode 符号)、ascii(ASCII 字符)。
/footer [on|off] — 切换消息网关在最终回复底部显示的运行时元数据脚注。
/skin [name] — 切换界面主题风格。
/statusbar — 切换 CLI 模式下的状态栏显示。
工具与技能命令
/tools — 在会话中查看和切换工具启用/禁用状态。
/toolsets — 列出所有可用的工具集。
/skills — 搜索和安装技能,无需退出当前会话。
/skill — 将指定技能加载到当前会话。
/reload-skills — 重新扫描 ~/.hermes/skills/ 目录,加载新增的技能、卸载已删除的技能。
/reload — 重新加载 .env 文件中的环境变量到当前运行的会话中。修改了 API Key 后无需重启。
/reload-mcp — 重新加载 MCP 服务器连接。添加或修改 MCP 服务器配置后使用。
/cron — 管理定时任务。支持列出、查看状态、暂停、恢复。
/curator [sub] — 后台技能生命周期维护。子命令:status(状态)、run(执行)、pin(固定)、unpin(解除固定)、archive(归档)、restore(恢复)、prune(修剪)、backup(备份)、rollback(回滚)。
/kanban [sub] — 多配置协作看板。支持查看任务、链接、评论。
/plugins — 列出当前会话中已加载的插件。
网关命令
/approve — 批准待审批的命令执行。在消息平台中使用时,Hermes 执行危险命令前会等待用户确认。
/deny — 拒绝待审批的命令执行。
/restart — 重启消息网关服务。
/sethome — 将当前聊天设置为默认频道。所有系统通知将发送至此。
/update — 升级 Hermes 到最新版本。
/topic [sub] — 管理 Telegram DM 话题会话功能。
/platforms(/gateway) — 显示所有已连接的消息平台状态。
实用工具命令
/branch(/fork) — 基于当前会话创建一个独立的副本。分支可以独立发展,不影响原会话。
/handoff — 将正在进行的会话转移到指定消息平台继续。例如从 CLI 切换到 Telegram。
/fast — 切换优先级/快速处理模式。在快速模式下,Hermes 使用更小的模型或更简化的推理链。
/browser — 打开 CDP(Chrome DevTools Protocol)浏览器连接,用于网页自动化。
/history — 在当前终端中回放整个对话历史。
/save — 将当前对话保存到指定文件中。
/copy [N] — 将最近 N 条(默认 1 条)回复复制到系统剪贴板。
/paste — 从剪贴板粘贴图片到当前会话。
/image — 从本地文件系统上传图片。
信息查询命令
/help — 显示当前版本的完整命令帮助。是最权威的参考来源。
/commands [page] — 分页浏览所有可用的斜杠命令及其说明。
/usage — 显示当前会话的 Token 使用统计——输入 Token、输出 Token、总计、成本估算。
/insights [days] — 跨会话的使用行为分析——调用频率、Token 趋势、工具使用分布。
/status — 实时会话状态——模型、提供商、上下文长度、Token 使用。
/profile — 显示当前配置信息。
/debug — 收集系统信息和日志,上传并返回可分享的调试链接。
退出命令
/quit(/exit、/q) — 退出 Hermes CLI,结束当前会话。所有未保存的上下文将丢失(但会话记录已在数据库中持久化)。
十三、全局标志
这些标志适用于任何子命令之前,影响整个 Hermes 实例的行为:
--version, -V— 显示版本号--resume, -r SESSION— 按 ID 恢复会话--continue, -c [NAME]— 按名称恢复最近会话--worktree, -w— 隔离工作目录,并行代理不冲突--skills, -s SKILL— 预加载指定技能--profile, -p NAME— 使用指定配置--yolo— 跳过所有命令审批--pass-session-id— 在系统提示中包含会话 ID--ignore-rules— 跳过项目上下文文件(.hermes.md、AGENTS.md、CLAUDE.md、.cursorrules)和 SOUL.md 的自动注入
结语:命令体系的哲学
Hermes Agent 的 77 个命令背后体现了一种独特的设计哲学:分层抽象 + 渐进暴露。
对于日常用户,只需记住 hermes 启动对话就够了。单次查询用 hermes chat -q。遇到问题用 hermes doctor。更换模型用 hermes model。这些核心命令覆盖了 80% 的使用场景。
对于进阶用户,模型切换、工具管理、技能安装、会话恢复提供了深度定制能力。你可以为不同的工作场景创建不同的配置,每个配置拥有独立的模型、工具、技能和记忆。
对于 DevOps 和团队场景,网关消息平台集成、cron 定时任务编排、看板多代理协作、配置管理、凭证池化,支撑起完整的工作流自动化体系。
这不是一份需要从头背诵的命令列表,而是一份参考手册——当你遇到特定需求时,找到对应的功能分类,定位到具体命令。每一条命令都针对一个明确的场景设计,只需要一次使用就能记住。
最后,记住三个黄金入口:
- 设置系统:hermes setup 或 hermes model
- 诊断问题:hermes doctor 或 hermes config check
- 探索所有能力:在终端运行 hermes --help 或在会话中输入 /help
Hermes Agent 的核心信念是:工具应该适应人,而不是人适应工具。这套命令体系正是这一理念的最好体现——它不要求你记住一切,但当你需要时,它总在那里。