Book-Agent：Hermes Agent 的工业级小说生产 skill——六位智能体 × 十四道工序完整解析

引言：当 Hermes Agent 遇上小说创作

Book-Agent 是 Hermes Agent（由 Nous Research 开发的开源 AI 智能体框架）的一个内置技能（skill）。在 Hermes 生态中，skill 是可加载的知识包——每个 skill 包含完整的配置、prompt、工作流程和参考文件。加载 skill 后，Hermes Agent 获得该领域的全套能力。目前 Hermes 拥有 50+ 技能，覆盖软件开发、数据科学、创意写作、DevOps 等领域。

Book-Agent 就是 Hermes 创意类技能中最复杂的一个。它不是一个独立的应用程序，而是一套定义在 SKILL.md 中的 6 Agent × 14 Flow 管线模板。在 Hermes Agent 的对话界面中，通过 skill_view(name='book-agent') 加载后，Hermes 立刻获得完整的"小说工厂"能力——所有智能体角色、工序流程、质量体系、Truth 数据库全部就绪。这套系统已经在《峡谷至尊》（1020 章超长篇网文）中完整落地。

在AI辅助创作领域，大多数工具停留在"生成文本"层面——给一个提示，产出一段文字。但长篇小说创作是一个极其复杂的系统工程：世界观一致性、角色弧光、情节逻辑、伏笔埋设与回收、节奏控制、文风统一、跨章矛盾检测、AI味去除……任何一个环节出问题，整部作品就会崩塌。传统写作依赖作者一个人记住所有设定，在几万字的短篇中可行，但在百万字甚至千万字的超长篇中几乎不可能——人的记忆是有极限的。一个人可以记住100个设定，但1000个呢？10000个呢？当角色从10个增长到100个，当章节从10章增长到1000章，大脑的"缓存"一定会溢出。

Book-Agent 正是为解决这个问题而生的。它不是一个简单的"AI写作助手"，而是一套完整的 6 Agent × 14 Flow 超工业小说生产管线——从大纲到多格式发布，全流程 AI 辅助，零外部依赖。这套系统已经在《峡谷至尊》（1020 章超长篇网文，3020 年游戏穿越·电竞题材）中完整落地，12 章全部通过 14 道工序的严格验证，单章产出 17 个文件约 140KB 的创作档案。本文将详细介绍 Book-Agent 的架构设计、核心机制、质量保障体系，以及从 13 维到 120 维的进化之路。

一、六位智能体的角色与分工

在 Hermes Agent 中，Book-Agent 的核心由六个智能体（Agent）构成，每个智能体有专属的 prompt、flow 定义、配置文件和工作流程，各自负责不同的工序：

1. Director（导演 🎬）

负责工序 0（大纲）、11（修改闭环）、13（发布）。Director 是整条管线的总指挥，制定每章的"导演笔记"——这是管线中最长的元数据文件，通常在 4000-6000 字。导演笔记包含 12 个标准章节：一、章节定位——本章在卷中的位置（如"V01觉醒卷觉醒期中后段"）、与前章衔接方式（如"ch10是第一次高潮、ch11是消化沉淀、ch12是主动行动"）、情节功能列表（如"行动章、主动探索转折点、iPhone 新功能展示、林小雅首次出场"）。二、调性指令——一句话说清楚本章的情感基调（如"战斗结束后的寂静，比战斗本身更重"）加具象解释。三、色彩光线设计——每个场景的主色调、光线强度、情感关联的对照表。四、情绪曲线——用 ASCII 图画出情感走向波形，配合分段表说明每段的情绪和节奏控制方式（缓/中/紧/缓收）。五、意象系统——核心意象表（意象名称、象征意义、具体使用方式、出现次数要求），以及意象升级路径（从"被动映照"到"被识别"到"主动分析"的连续递进）。六、角色聚焦——每个出场角色的本章状态、身心递变线、关键行动列表、红线。七、伏笔管理——前章伏笔的兑现（全额/半额/未兑现）和新伏笔的埋入（目标章节标注）。八、写作禁令——绝对不能写的项和需要克制的项的详细说明。九、字数分配——每段的汉字数预估和总目标。十、Truth 引用——本章需要引用的 Truth 条目及引用方式。十一、衔接检查清单——章节间的连续性逐项检查。十二、排版与格式指令——闪回段落的处理方式、对话节奏要求、感官描写优先级等。在实际项目中，导演笔记的质量直接决定了整章的质量——导演笔记写得好，后续的 Writer 和 Polisher 几乎不会出大问题。反之，如果导演笔记模糊或矛盾，后续所有工序都会受影响。导演笔记的另一个关键功能是定义章节"禁区"——第12章明确了6条绝对不能写（不写战斗、不让林小雅发现峡谷、不给"她"新台词动作、不写系统弹窗UI、不写升级等级概念、不让老陈出现）和5条需要克制的内容（林小雅对话不超过1500字、iPhone探索不是说明书、解谜过程不直白、内心独白不超过12%）。这些禁令来自前章经验——每发现一个问题就新增一条禁令。

2. Screenwriter（编剧 🎭）

负责工序 1（世界构建）。Screenwriter 将导演笔记转化为具体的剧本结构。它的产出包括：场景表（每个场景的地点、时间、主要角色、核心动作、场景目标、局限）、世界观对标检查表（已有体系的深化使用情况、新引入的世界观元素及其设计意图、与已存在设定的冲突检查结果）、角色关系动态分析、章节弧线设计。Screenwriter 做的核心判定是：本章是否需要新建世界观体系？在《峡谷至尊》第 12 章中，新概念"次通道"被判定为对已有"峡谷多维性"设定的自然扩展——不需要新建体系。这个判定避免了"每章一个新设定"的设定膨胀问题。每章结束时，Screenwriter 输出"变与不变"对照表——明确哪些世界观元素在本章中发生了变化、哪些维持不变——为后续的连贯性检查提供基准。

3. Lore Keeper（设定守护者 📚）

负责工序 2、3、4、7、8、12——共六道工序，是管线中任务最重的智能体。它的职责贯穿整个创作流水线：角色调研（分析每个出场角色的内心状态、性格特征在本章中的呈现方式、关键决策点、与 Truth 角色档案的一致性检查）；设定弧线设计（主线弧推进的阶段性分析、伏笔网络的状态追踪——哪些在推进、哪些在等待回收、本章新埋了哪些、每伏笔标注目标回收章节编号）；Truth 预检（11 项预检清单全部通过才能进入写作——T1 角色一致性、T2 世界设定一致性、T3 情节逻辑、T4 前章连续性、T5 新概念引入合规性、T6"她"的一致性、T7 林小雅红线、T8 AI 味检测、T9 Truth 引用完整性、T10 写作禁令合规、T11 跨章伏笔对齐）；120 维审计（12 组 × 10 维 × 10 分，每组有完整的评分标准和具体评语）；连贯性检查（跨 5 章检查道具状态连续性、角色关系一致性、碎片进度合理性）；终审（G4 门禁判定）。Lore Keeper 是小说的数据库管理员和首席质检员——它的话就是最终裁定。

4. Writer（主笔 ✍️）

负责工序 5（正文写作），管线的核心产出者。Writer 基于前面四道工序的成果——导演笔记确定"写什么"、剧本结构确定"怎么写"、角色调研确定"谁在写"、Truth 预检确定"什么不能写"——产出每章 6000-8500 汉字的正文。写作风格由项目配置的 writing_style 字段决定。以《峡谷至尊》为例：第三人称限制视角（读者知道的不能比主角多，不进入其他角色的内心）、短句节奏为主（不超过 40 字的长句，用破折号和逗号控制节奏）、身体感知优先于情感直述（不写"他感到恐惧"，写"他的手指不自觉地收紧了"；不写"他很困惑"，写"这个问题不适合用嘴问——写在纸上"）、自嘲式内心独白（"算了。这个问题写在'不知道'那一栏里"）。不同题材有不同的风格配置——悬疑节奏更快、句式更短，言情感官描写比例更高。

5. Polisher（润色师 ✨）

负责工序 6（精修润色）。Polisher 在初稿基础上做精细打磨：去除 AI 味词汇（"仿佛""似乎""某种""一股""一种"等 19 个禁用词，零容忍）、优化句式节奏（打破 AI 偏好的中等均长句，制造长短交替）、增强感官描写（补全五感中缺失的维度）、检查禁用句式（"不是X是Y"结构、"命运的齿轮开始转动"、心中涌起、原来如此）。Polisher 的最低原则：精修润色不砍量，汉字数波动应小于 5%。这个原则来自一个教训——曾错误地将"精修"理解为"精简"，导致第 12 章精修版从 6144 汉字砍到 4671 字（-24%），发布版仅剩 2564 字（-58%）。精修状态报告会记录每次修改的类别和数量——包括 AI 味词汇替换数量、节奏优化数量、感官增强数量、逻辑清晰化数量、去冗余数量。

6. Feedback（试读师 💬）

负责工序 9 和 10（试读反馈 + 场景设计）。Feedback 的设定是一个 25 岁的电竞玩家，每周打 10 局排位。试读报告不像审计那样结构化——而是像跟朋友吐槽一本书。报告包含六个部分：最喜欢（引用原文并说明原因——"这段我读了两遍。不是因为文笔好——是因为太真实了"）、最无聊（想跳过的段落及原因）、如果不确定（边缘情况的处理建议）、角色感觉（对每个角色的真实感受——"这一章的李继祖让我觉得他越来越像他自己了"）、如果只能改一个地方（最重要的单个修改建议）、现场笔记（随手记录的想法和金句片段）。"如果只能改一个地方"是整条管线中最有价值的反馈——因为长篇的核心问题往往不是很多小问题，而是一个大问题。在第 12 章中这个建议是"调谐测试的解谜部分可以再精简一些"，直接命中审计发现的 D 组节奏问题。

二、十四道工序的完整路径

加载 Book-Agent skill 后，Hermes Agent 自身扮演全部六个智能体角色，按序执行每章的 14 道工序，不可跳过。分四个阶段：

规划阶段（工序 0-4）：0_outline（导演笔记）→ 1_world（剧本结构）→ 2_characters（角色调研）+ 3_arcs（设定弧线）+ 4_truth（Truth 预检）。后三道可并行执行。规划阶段不写正文——只做"能不能写"的确认。在长篇创作中，没有规划直接写作就像没有图纸盖房子。

创作阶段（工序 5-6）：5_drafts（正文初稿 6000-8500 汉字）→ 6_polished（精修润色，不做压缩）。创作阶段消耗的汉字数占整章总产出的 90% 以上。

验证阶段（工序 7-10）：7_feedback（120 维审计）→ 8_promotion（连贯性检查）→ 9_iteration（试读反馈）→ 10_illustration（场景设计）。第 12 章验证发现三个问题：调谐测试段认知负荷偏高（D 组 75 分）、眉心金纹缺乏铺垫（试读反馈）、找门过程可精简（试读反馈）。这些问题全记录在 11_notes。

发布阶段（工序 11-13）：11_notes（修改闭环）→ 12_beta（终审判定）→ 13_release（三格式：.md 排版版 + .txt 纯文本 + .html 带 CSS 支持暗色模式）。整章 17 个文件约 140KB。整章总耗时约 50-80 次工具调用，其中正文写作为消耗大头。

三、Truth 系统：九份 JSON 文件定义的小说世界

长篇小说最常崩坏的原因是"吃设定"——作者忘记了自己写过什么，导致前后矛盾。Book-Agent 用 Truth 系统从根本上解决这个问题。九份 JSON 文件构成小说世界观数据库，六位智能体共享同一数据库，永远不会出现"一个智能体认为角色 25 岁、另一个认为 26 岁"的矛盾。这从根本上解决了长篇创作中最头疼的问题：多个智能体同时工作时，如何保证对同一角色、同一道具、同一世界观的认知一致。答案就是共享同一个Truth数据库——所有智能体在写作前加载Truth数据，写作中引用Truth数据，写作后验证Truth数据。

truth_characters.json：全部角色的完整档案。以主角李继祖为例：年龄 25 岁、INTJ 性格、本命英雄杰斯、核心矛盾"完成家族使命 vs 个人自由"、完整的 10 级成长轨迹（初唤者 0 碎片→唤师 15→唤将 50→唤王 120→唤圣 200→唤神 350→唤主 500→唤源 700→唤道 900→唤极 1600）、与书中每个角色的关系动态（包含关系类型、动态描述、关系演变阶段）。如果 Writer 想写李继祖突然变得外向健谈——Truth 文件"性格：[理性、克制、自嘲、孤独、渴望突破]"会阻止它。

truth_world.json：3020 年的完整世界观。五个历史纪元：数字纪元（2000-2100，互联网时代）、大断联纪元（2100-2500，量子病毒摧毁全球网络）、重建纪元（2500-2800，家族制度复兴）、融合纪元（2800-3020，科技与传统融合）、觉醒纪元（3020年-，峡谷与现实边界模糊）。技术红线明确：只有生物荧光苔藓、磁悬浮农机、脑波通讯器、星稻被允许——手机（除圣物 iPhone）、电脑、互联网、数字娱乐是永久禁区。日常生活细节也被记录——每天 6 点起床、社区晨练、星稻粥加腌菜早餐、每周三赶集。

truth_plot.json：10 卷 × 1020 章剧情大纲。每卷有名称（如 V01"觉醒"、V02"深渊"）、章节范围（001-100）、主角等级区间（初唤者→唤师）、碎片范围（0→15）、核心弧线（从被动守护到主动探索）、高潮事件（第一场大型战斗——峡谷试炼场）、关键转折点（每个转折点标注触发章节号、事件描述、影响力说明）、BOSS 设计（三阶段机制、掉落物）。从第 1 章手机唤醒到第 1020 章新平衡达成。

truth_timeline.json：精确到天的时间控制——第 1 章 3020 年 4 月 5 日，第 12 章 4 月 13 日，8 天跨度精确记录。角色年龄追踪（李继祖 25→27 岁，全书跨 3020-3022 年）。

truth_concepts.json：核心概念的权威定义。第 12 章新增"次通道"词条时严格经过合规性检查——确认是对已有"峡谷多维性"设定的自然扩展。词条包含完整描述、特征列表、已知入口坐标。

四、120 维质量审计体系

12 组 × 10 维 × 10 分 = 1200 分。合格线 960（80%），优秀线 1080（90%），重写线 800。每组的 10 个维度都有明确的评分标准和 1-10 分的说明。这套审计体系的设计借鉴了软件工程中的代码审查和自动化测试理念——不是等到写完再"算总账"，而是在写作过程中逐层验证。从规划阶段的Truth预检到创作阶段的精修检测到验证阶段的120维评分，每道工序都在做"这件事是否符合标准"的检查。

A-世界观一致性（78/100）：设定自洽、科技一致、超自然规则清晰、新设定合理、时空逻辑一致。次通道引入自然但眉心裂纹缺铺垫。

B-角色一致性（83/100）：主角性格稳定、配角行为合理、关系动态自然、情感真实。林小雅的克制和观察力获得高分，李继祖说谎的陌生感处理细腻。

C-情节逻辑（81/100）：因果链完整、节奏得当、信息释放均匀。闪点→实验→找门→测试→返回的逻辑链完整。

D-节奏控制（75/100）：最低分组。调谐测试段描述密度偏高，认知负荷增加。这也是试读反馈建议精简的位置。

E-文笔质量（82/100）："保温状态""温度梯度"等设定内比喻精准，避免 AI 味修辞。"像一幅干了的水墨画，水和墨终于完成了分离"被标记为高质量具象描写。

F-对话自然度（77/100）：林小雅段的沉默厚度处理极佳——"天井里只有阳光慢慢移动的声音——事实上阳光没有声音，但沉默里有一种可以被测量的厚度"在第 12 章中同时获得审计和试读的高度评价。

G-情感张力（73/100）：非战斗章情感峰值偏低但符合呼吸章的自然定位。

H-信息密度（76/100）：通过实验发现而非旁白解释的展示方式——闪点的功能是李继祖自己实验发现的，不是系统通知的。

I-读者代入感（80/100）：调谐测试让读者同步推理——智力参与感 9/10。李继祖每次试错读者可以跟着想"为什么不行"。

J-钩子设计（72/100）：过渡型章节典型短板——中间段缺乏强钩子。"压住眉心那颗金纹"结尾有力但中间段的悬念可以更强。

K-AI味检测（85/100）：零禁用词残留。"仿佛""似乎"各 1 处在精修中清除。长短句交替节奏获改善。第 12 章精修前 AI 味指数偏高是因为初稿中的"仿佛"和"似乎"被标记——精修后清零。

L-Truth一致性（80/100）：9 个 Truth 文件全部一致验证通过——角色、世界、情节、时间线、概念、碎片规则、技术红线全部对齐。

审计的最终输出不是单个分数——而是一份完整的审计报告，包含概要、每组 10 维的详细评分和评语、评分总结表、关键发现（提升领域和下降领域）、最终判定。第 12 章总分 972 B 级，较第 11 章的 958 分上升 14 分。提升领域是"探索维度的新鲜感"和"智力参与感"，下降领域是"节奏控制"和"情感张力"和"钩子设计"——都因为第 12 章是过渡型探索章，节奏和钩子天然弱于战斗章。

五、五道质量门禁的实战运作

G0 字数门禁——正文汉字数 ≥ project.json 中 min_words_per_chapter（默认 5000）。5_drafts、6_polished、13_release 三种格式独立验证。波动小于 5%。第 12 章教训后新增。

G1 Truth 预检——11 项预检全通过才能进入写作。包括角色一致性、世界设定一致性、情节逻辑、前章连续性、新概念合规性、"她"的一致性、林小雅红线、AI 味检测、Truth 引用完整性、写作禁令合规、跨章伏笔对齐。第 12 章全部通过。

G2 审计分数——120 维 ≥ 900（B 级）。第 12 章 972 分通过。

G3 连贯性——跨 5 章无矛盾。金纹 ch10 脉冲→ch11 余温→ch12 温度梯度递进一致。

G4 终审——A 级 ≥ 1020/1200 才能正式发布。第 12 章 972/1200 B 级未通过——有条件通过发布。

六、版本演变：每一版都来自一个"坑"

v1.0（2025-10）：13 维 160 分基础版。只有逻辑、角色、语言三个维度。

v2.0（2025-11）：24 维 300 分。加入体裁适配和意象系统。

v3.0（2026-01）：33 维 400 分。加入行业技术和读者体验维度。

v4.0（2026-03）：120 维 1200 分。最大一次升级——增加 K 组 AI 味检测和 L 组 Truth 一致性。因为读者反馈作品"读起来像 AI 写的"。

v5.0（2026-06）：120 维标准结构——12 组 × 10 维统一格式。

v3.4.0（2026-06-10）：G0 字数门禁——来自第 12 章教训。精修版和发布版汉字数被系统强制验证。

每个版本对应一个真实的"坑"——不是凭空设计的。精修版被砍掉的 1473 汉字变成了 G0 门禁的强制验证。系统不是一次建成的，而是在持续使用中进化的。Book-Agent 从 13 维到 120 维的进化不是某个人坐在桌前画出来的——它来自每次创作中的实际痛感。当精修版被砍掉 1473 字时，才知道需要 G0；当读者说"读起来像 AI 写的"时，才知道需要 K 组 10 维去 AI 味检测。系统不是被设计出来的——是被教训出来的。每一次迭代都在让系统更可靠，让创作更顺畅，让作者的心血不被技术失误浪费。

七、核心理念

Book-Agent 的四个核心理念贯穿始终。

文件为王。每道工序产出必须是在磁盘上的实体文件，而不是对话中的"口头交付"。17 个文件每行都是可追溯的创作档案。从最初的想法到最终的作品，每一步都有记录可查。这个原则有一个直接的实践效果：如果某道工序出了问题，你可以精确地定位到具体是哪个文件、哪个段落、哪句话——而不是在对话历史里翻来翻去。

质量左移。在写作前就验证设定一致性，而不是写完后发现矛盾再改。Truth 预检的 11 项清单确保"写之前就知道什么不能写"。120 维审计不是事后的"算总账"，而是在每道工序中嵌入质量意识。这来自软件工程的最佳实践——把质量验证推向更早的阶段，缺陷发现得越晚修复成本越高。

从错误中学习。每一次教训都变成系统功能。第 12 章的精修压缩教训变成了 G0 字数门禁——从此精修版和发布版的汉字数被系统强制验证，低于 5000 或波动超过 5% 都会被标记为不通过。AI 味检测的 10 个维度来自读者反馈"读起来像 AI 写的"。跨章矛盾检测来自第一次设定冲突。每一个"坑"都变成了系统的"护城河"——这个模式值得所有 AI 辅助创作系统的设计者借鉴。

不替代人而是放大人的能力。AI 处理机械化重复性工作——120 维标准化评分、跨章矛盾检测、AI 味词汇扫描、Truth 一致性验证——把作者解放出来专注于真正需要创造力的部分：故事的核心创意、角色的情感厚度、那些意想不到的灵感时刻。Book-Agent 的目标不是让 AI 替代作者，而是让 AI 处理那些人类不擅长、不愿意做、或者做了会消耗太多精力的事情。

作为 Hermes Agent 的一个内置技能，Book-Agent 体现了 Hermes 的设计理念：skill 不仅仅是静态的文档，而是可执行的智能体工作流。加载一个 skill 就是加载一整套专家能力。目前这套系统已在《峡谷至尊》项目中验证了完整性和可靠性——从第 1 章到第 12 章，每章都完整走过了 14 道工序的严格验证。单章产出 17 个文件 140KB，核心正文 6000+ 汉字，全部通过 G0-G4 门禁。未来计划加入更多题材宪法（军事、历史、武侠）、更精细的跨卷一致性验证、更丰富的发布格式（PDF、EPUB）。不变的是核心理念：好的创作需要好的系统，好的系统从每一次教训中进化。