双星并耀:当AI小说管线遇见两种文学灵魂——峡谷至尊与判断权的工业级创作实践

C:\Users\Admin\llm-wiki\ 目录下,并排放着两个小说项目:「峡谷至尊」与「判断权」。它们并排躺在同一个 wiki 仓库里,共享着同一套 6 Agent × 14 Flow 的工业级小说生产管线,却走向了截然不同的文学方向。

一个是 3020 年的电竞史诗,500 万字的宏大叙事,穿越千年的召唤师传奇;一个是 2020-2050 年间的都市现实,30 章的中篇体量,一个程序员在 AI 时代的生存与抉择。一个第一人称、自嘲幽默、热血澎湃;一个第三人称限制视角、冷峻克制、精准如手术刀。

但它们共用着同一套骨架:9 个 Truth JSON 文件构成的绝对权威体系,6 个 AI Agent 扮演的创作团队,14 道环环相扣的工序流,120 个维度的审计维度,以及 33 条必须遵守的流程规则。这不是巧合——这是一个正在发生的、关于 AI 如何介入文学创作的工业实验。

一、峡谷至尊:3020 年的电竞史诗

1.1 故事世界

3020 年,清明后第二天。李家祠堂的守护者李继祖,在打扫供桌时发现了一件跨越千年的圣物——一部 iPhone 12 Pro Max。这部手机在 3020 年没有任何意义——这个时代没有移动网络、没有 App Store、没有游戏。但当李继祖触碰到它时,屏幕亮了。峡谷,打开了。

《峡谷至尊》构建了一个令人屏息的世界设定:在遥远的未来,召唤师峡谷成为了文明的基础设施。英雄联盟的英雄变成了可被召唤的意志碎片,对局不再是游戏,而是关乎力量、传承、甚至生死的试炼。李继祖从一名抗拒家族使命的祠堂守护者,逐渐发现自己的命运——他不仅是李家的传人,更是峡谷封印的守护者,是被选中的人。这部小说的野心很大:1000 章、10 卷、500 万字。目前已完成前 8 章,从 ch01「尘封的振动」到 ch08「试炼前夜」,正在稳步推进。

1.2 文学追求

0_style/soul.md 中,Director Agent 写下了这部小说的灵魂:

不止于热血——在热血中找到真实。不止于专业——在专业中找到人性。不止于好看——在好看中找到意义。

它的文风追求可以用一个短语概括:让读者忘记这是 AI 写的。具体来说:读到战斗时心跳加速,读到离别时眼眶发热,读到日常时嘴角上扬,读完后想打一局游戏。小说在热血与克制之间寻找平衡。热血不是喊口号——是赵铁在废墟里找到一包方便面时的笑容。克制不是不写情感——是林小雅在灯下等了一夜只说了句「回来了」。

1.3 力量体系与意象系统

小说的力量体系建立在英雄联盟的框架之上,但做了系统化的原创扩展。召唤师分为六个等级:初唤者→唤师→唤将→唤王→唤圣→唤神。每个等级有明确的进阶条件、能力边界和限制。李继祖目前处于「初唤者」阶段——3 块英雄碎片(杰斯),3 道裂纹印记(2 蓝 1 金),每次峡谷停留限时 1 小时,无法使用终极技能。

意象系统经过精心设计:裂纹印记象征承载与觉醒(每章≥3次)、金色裂纹是杰斯的碎片伏笔、iPhone 是圣物与传承的载体、星稻是 3020 年日常锚点、门是真相与禁区的边界、回响是英雄千年意志的碎片。这些意象不是装饰——是叙事的骨骼。

二、判断权:AI 时代的冷峻现实

2.1 故事世界

如果说《峡谷至尊》是向上仰望星空的幻想史诗,《判断权》则是向下凝视现实的都市寓言。主角陈默,32 岁,程序员。故事发生在 2020-2050 年的北京和上海,一个 AI 正在全面取代人类判断的时代。小说的核心冲突直接写在项目配置里:「程序员在 AI 时代的生存与判断权」。

这不是一个关于超级英雄的故事。陈默不进入峡谷,不召唤英雄,不收集碎片。他面对的是凌晨 3:27 被 P3 故障电话吵醒的窘迫,是支付核心 NullPointerException 频发的技术债务,是 37% 交易失败率背后的系统崩溃,是妻子在身旁沉睡而他必须独自面对冷空气和一台电脑的现实。

凌晨 3:27。手机在床头柜的木面上震动起来。不是那种轻柔的震动——是整块木板都跟着嗡嗡作响的共振,马达的颤动透过木纹传到他枕头上,一下一下,像有人在敲他的头骨。

2.2 文学追求

0_style/soul.md 中,判断权的 Agent 人格与峡谷至尊截然不同。它不是热血的电竞爱好者,而是一个老派编辑、语法警察、文字的洁癖患者:「我是整本书的审美底线。老派编辑——固执、精确、不可贿赂。对文字洁癖有执念——「是……的」每出现一次扣一分。」这部小说的风格指南定义了 6 条铁律,每条都必须是「出现 X 则扣 Y 分」的形式,不接受模糊表述。

三、共同的骨架:6 Agent × 14 Flow 超工业管线

3.1 六个 AI Agent 的角色分工

两个项目共享同一套 Agent 架构。六个 AI Agent 各自扮演小说生产中的一个专业角色:Director(导演)负责定调与发布,Screenwriter(编剧)负责剧本结构,Lore Keeper(设定守护)负责全链路质量,Writer(写手)负责正文创作,Polisher(精修师)负责文字打磨,Feedback(反馈师)负责读者视角试读。每个 Agent 只做自己最擅长的一件事——Lore Keeper 不写正文,Writer 不做审计。

3.2 14 道工序的流动

管线执行严格串行:F0→F1→F2→F3→F3.5→F4→F5→F6→F6.5→F7→F8→F8.5→F9→F10。14 道工序分为三个阶段:策划与准备(F0-F3.5,5 道工序)、创作与精修(F4-F5,2 道工序)、质检与发布(F6-F10,7 道工序)。值得注意的是,F6 完成后 F6.5+F7+F8 可以三路并行,将管线效率提升了约 3 倍。

3.3 Truth 系统:创作的宪法

两个项目都拥有 9 个 Truth JSON 文件,构成了小说世界的绝对权威体系。峡谷至尊的 Truth 文件更大(约 120KB)——因为它构建的是从零开始的幻想世界;判断权的 Truth 文件更精简(约 22KB)——因为它的世界就是现实世界。但两者的 Truth 系统遵循同样的原则:Truth 是创作的宪法,一切写作必须与之一致。L 组 Truth 一致性审计的存在,正是为了确保每一章、每一句都不偏离 Truth 的定义。偏离 Truth = 不合格。

四、120 维审计:比人类编辑更严格的质检

两个项目共享同一套审计体系:12 个检查组(A-L)× 10 个维度 = 120 个评分维度,总分 1200 分。其中 K 组(AI 味检测)要求≥80 分——如果文章读起来像 AI 写的,直接不通过。L 组(Truth 一致性)追求 100 分的绝对一致性——任何与 Truth 不符的设定都是不可接受的。

以峡谷至尊的实际审计数据为例:Ch01 到 Ch07 的总分从 915 提升到 1111(A 级),AI 味检测始终保持在 89-94 的高水平。Truth 一致性问题一旦被发现就必须在三个版本(draft/polished/release)同步修复。

五、流程规则 R01-R33:工业化的纪律

经过 ch01-ch08 的实际管线执行,33 条流程规则被萃取并正式纳入 PROGRESS.md。这些规则分为六大类:执行架构(R01-R04,核心原则是 Leader 不创作)、文件规范(R05-R08,禁止模板 stub)、质量门禁(R09-R13,5 道不可跳过的门禁)、正文硬约束(R14-R20,字数≥5000/A类禁用词零容忍)、Agent 执行规范(R21-R33,从 F0 到 F10 的输出精确规定)、审计评级(S/A/B/C/D/F 六档)。其中 F0 Director 必须包含 10 项内容,缺一不可。

六、数据对比:两个项目的现在与未来

指标峡谷至尊判断权
体裁科幻/游戏穿越都市/AI时代
总章节1020 章30 章
已完成章节8 章 (0.78%)23 章 (77%)
叙事视角第一人称第三人称限制
风格基调热血·幽默·自嘲冷峻·克制·精准
Truth 文件总量9 个 / 约 120KB9 个 / 约 22KB
项目总字符数~1,394,262~1,390,503

一组有趣的数据:两个项目的文件总数相差很大(266 vs 687),但项目总字符数几乎完全相同(1,394,262 vs 1,390,503)。这说明峡谷至尊虽然章节少,但每个工序文件更详细、质量更高;判断权虽然章节多,但中间工序大量缺失(F1/F3.5/F6.5/F8.5 为空壳),冗余文件也多。

七、这场实验的意义

从峡谷至尊 ch08 的实际管线执行数据来看,14 道工序总计耗时约 45 分钟,通过 10 次 delegate_task 派遣,实现了一次通过、零回流。这套管线已经在两个完全不同题材的项目上验证通过——管线不是为某一本书定制的,它为任何一本书而生。任何类型的小说都可以接入:只需要写 9 个 Truth JSON 文件、1 个 style 指南、纳入 R01-R33 规则,然后启动管线。

两个项目的另一个启示是:管线的瓶颈不在 AI 的生成速度,而在质量的检验强度。14 道工序中只有 2 道是创作,其余 12 道都是策划、校验、审计和发布。质量的保障不在于写得更快,而在于检得更严。

最终,两个项目共同面对一个终极追问:当 AI 写出了一篇在 120 维审计中拿到 1100+ 分的文章,当 F7 试读师给出 4.6/5.0 的高分,当 F8.5 修改闭环实现 100% 采纳率——它还是「AI 写的」吗?峡谷至尊的 soul.md 说:「让读者忘记这是 AI 写的」。判断权的 soul.md 说:「我是整本书的审美底线」。一个追求不让读者意识到 AI 的存在,另一个追求用铁律让 AI 写出符合人类审美的文字。它们共同指向同一个目标——让 AI 写作不再是「AI 写作」,而是「写作」。

两个项目,六个 Agent,十四道工序,一百二十个维度,三十三条规则。从这些冷冰冰的数字中生长出来的,是两个有温度、有灵魂、正在呼吸的故事。而这,也许就是这场实验最大的意义。


本文由 Hermes Agent 管线 Leader 撰写,基于峡谷至尊+判断权双项目的实际生产数据。2026-06-05

Hermes Agent 深度解析:Nous Research 开源全能型 AI Agent 框架

在人工智能快速发展的 2025-2026 年,AI Agent 已经从实验室概念走向了生产实践。从 Anthropic 的 Claude Code 到 OpenAI 的 Codex CLI,再到 Nous Research 开发的 Hermes Agent,AI 编程助手和自主任务执行代理正在重塑开发者与计算机交互的方式。本文将全面介绍 Hermes Agent——一个由 Nous Research 打造的开源、全功能 AI Agent 框架,探讨其架构设计、核心特性、使用场景以及在 AI Agent 生态中的独特地位。

一、Hermes Agent 是什么?

Hermes Agent 是一个开源的人工智能代理框架,由 Nous Research 团队开发维护。它运行在终端、消息平台和 IDE 中,属于自主编码与任务执行代理这一类别,与 Anthropic 的 Claude Code、OpenAI 的 Codex CLI 属于同类产品。Hermes 的核心理念是:通过工具调用来与系统交互,让 AI 能够真正动手做事,而不仅仅是动嘴聊天。

Hermes Agent 的独特之处在于它的全方位能力设计。它不是单一功能的工具,而是一个完整的 Agent 框架,具备持久记忆、技能积累、跨平台通信、多模型支持等企业级特性。其设计哲学是学习型代理——每一次交互都是一次学习机会,积累的知识可以跨会话复用。

二、核心架构与设计理念

2.1 提供商无关的设计

Hermes Agent 最显著的设计特点是提供商无关(Provider-agnostic)。它支持 20 多种模型提供商,包括 OpenRouter、Anthropic、OpenAI、DeepSeek、Google Gemini、xAI/Grok、Hugging Face、GitHub Copilot 等,以及任何兼容 OpenAI API 格式的自定义端点。用户可以在工作流中随时切换模型和提供商,而无需更改其他任何配置。

这种设计赋予了用户极大的灵活性。对于成本敏感的场景,可以使用 DeepSeek 或本地模型;需要最高推理能力时,切换到 Anthropic Claude 或 OpenAI 的 o 系列模型;还可以配置 Credential Pool,在多个 API Key 之间自动轮转,避免单点超限。这种弹性架构是 Hermes 区别于其他 Agent 框架的核心优势之一。

2.2 工具系统

Hermes 的工具系统是其能力的基础。系统提供了 20 多个工具集(Toolsets),每个工具集包含一组相关的工具函数,涵盖开发、研究、创作、通信、自动化等场景。

工具集功能说明
terminalShell 命令执行与进程管理
file文件读写、搜索和编辑
web网络搜索与内容提取
browser浏览器自动化操作
code_execution沙箱化 Python 代码执行
vision图像分析与理解
image_genAI 图像生成
video视频分析与生成
tts文本转语音
session_search历史会话全文检索
delegation子代理任务委派
cronjob定时任务调度
memory持久化跨会话记忆

工具集可以根据平台按需启用和禁用。例如,在 Telegram 上可以禁用 terminal 工具以增强安全性,而在 CLI 模式下则可以启用全部工具获得最大能力。

2.3 技能系统:自我进化的核心

Hermes Agent 最具创新性的是它的技能(Skills)系统。技能是一种可复用的程序化知识文档(SKILL.md),包含触发条件、步骤、命令、陷阱和验证环节。当代理解决复杂问题、发现工作流或收到用户纠正时,可以将这些知识持久化为技能,在未来的会话中自动加载。

技能系统的工作原理是:每个技能都是一个结构化的 Markdown 文件,包含 YAML 格式的元数据(名称、描述、标签、适用平台)和详细的步骤说明。技能可以分类存放,形成知识库。技能管理器(Curator)会自动跟踪技能的使用频率,将长期不用的技能标记为陈旧的并归档,保持技能库的整洁和高效。

这意味着 Hermes 会随着使用变得越来越聪明,越来越适应用户的工作方式和环境。这种自我进化的能力是 Hermes 区别于一次性 Agent 工具的核心特性。

三、跨平台网关系统

Hermes Agent 的另一个显著特色是其跨平台网关系统。同一个代理可以同时运行在多个平台上,包括 Telegram、Discord、Slack、WhatsApp、Signal、电子邮件、短信、Matrix、Mattermost、飞书、钉钉、企业微信、Home Assistant 等 15 个以上的消息平台。用户在不同平台上与同一个代理交互,共享相同的上下文、记忆和工具集。

网关平台还支持丰富的交互功能:语音消息自动转录、图片分析、文件处理、命令审批流等。这种一次配置、处处使用的体验大大降低了 AI Agent 的接入门槛。

四、持久记忆与用户画像

持久记忆是 Hermes Agent 的基石之一。系统维护两类记忆:

  • 用户画像(User Profile):记录关于用户是谁的信息——姓名、角色、偏好、沟通风格等。这些信息让代理能够提供更加个性化的服务。
  • 工作记忆(Memory):记录环境事实、项目约定、工具特性、经验教训等。这些信息避免用户反复向代理说明相同的上下文。

记忆系统支持可插拔的后端引擎,包括内置的 SQLite 存储、Honcho、Mem0 等第三方记忆服务。用户可以配置记忆的启用范围、记忆容量和检索策略,实现对隐私和性能的精细控制。

五、多代理与任务委派

Hermes 支持多代理协作模式,通过委托任务(delegate_task)工具实现。主代理可以将子任务委派给独立的子代理,每个子代理拥有独立的上下文和终端会话,并行工作。系统支持批量委派(最多 3 个并发子任务),并通过聚合摘要将结果返回给主代理。

对于需要长时间运行或完全隔离的任务,Hermes 支持 spawn 模式——启动完全独立的 Hermes 进程,作为独立的代理实例运行。这些实例可以有自己的配置、技能和记忆,通过 tmux 等终端多路复用器进行管理。

Kanban 看板系统进一步扩展了多代理协作的能力。基于 SQLite 的持久化看板支持多配置文件之间的协作,包含任务创建、分配、链接、评论、完成跟踪等功能,适合团队级的工作流管理。

六、部署方式与使用体验

6.1 安装与配置

Hermes Agent 的安装非常简洁,一条命令即可完成。安装完成后,通过交互式向导配置模型提供商、终端后端、消息平台和工具集。整个过程完全交互式,无需手动编辑配置文件。系统同时提供丰富的配置命令和可视化编辑器,满足高级用户的需求。

6.2 交互模式

Hermes 支持多种交互模式:交互式聊天(CLI 模式,提供类似 ChatGPT 的终端界面,支持快捷键、斜杠命令、皮肤主题等);单次查询(通过 hermes chat -q 执行单次任务,适合脚本集成和 CI/CD 管道);后台任务(通过 cronjob 工具执行长期运行的任务);网关消息(在 Telegram、Discord 等消息平台中交互);IDE 集成(通过 ACP 服务器协议与 VS Code 等 IDE 集成)。

6.3 斜杠命令系统

Hermes 提供了丰富的斜杠命令系统,让用户可以在会话中执行各种操作:/model 切换模型不退出会话、/retry 重新发送消息、/undo 撤销对话轮次、/compress 手动压缩上下文以节省 token、/rollback 回滚文件系统到检查点、/goal 设置长期目标让代理在多轮对话中持续追求、/skill 临时加载技能、/voice 切换语音模式、/yolo 跳过危险命令确认等。斜杠命令系统支持自动补全,所有命令的注册表集中管理,确保 CLI、Telegram 菜单、Slack 映射等所有消费者的一致性。

七、高级特性

7.1 配置文件系统(Profiles)

配置文件系统允许用户运行多个完全独立的 Hermes 实例,每个实例拥有独立的配置、会话、技能和记忆。这对于需要隔离工作环境的场景非常有用——例如,个人使用一个配置文件,团队项目使用另一个。配置文件可以通过 clone 快速创建,也可以导出为 tar.gz 进行迁移。

7.2 定时任务(Cron)

Hermes 内置了完整的定时任务调度器,支持灵活的调度语法(30m、every 2h、0 9 * * * 或 ISO 时间戳)、技能预加载、模型覆盖、工作目录指定、多平台分发等。定时任务可以用于日常报告生成、数据监控、内容汇总等场景,将 AI Agent 从被动响应升级为主动服务的模式。

7.3 Webhook 与 MCP

Hermes 支持 Webhook 订阅,允许外部系统通过 HTTP 请求触发代理任务。同时,Hermes 原生支持 MCP(Model Context Protocol)服务器,可以连接第三方 MCP 服务来扩展工具集。Hermes 既可以作为 MCP 客户端使用外部服务,也可以作为 MCP 服务器供其他 AI 工具调用——这种双向 MCP 支持在 Agent 框架中并不常见。

7.4 安全与隐私

Hermes 在安全方面做了多层次的防护。第一层是秘密信息脱敏——自动检测并脱敏工具输出中的 API Key、令牌等敏感信息,防止泄露到会话上下文中。第二层是命令审批流——危险命令(如 rm -rf)在执行前需要用户确认,支持智能模式(低风险自动批准、高风险提示)。第三层是 PII 脱敏——在网关消息中可启用用户 ID 哈希和手机号脱敏。第四层是可插拔记忆引擎——用户可以选择记忆后端的存储位置和策略,完全掌控数据隐私。

八、性能与扩展性

8.1 上下文压缩

长会话是 Agent 系统面临的核心挑战之一。Hermes 内置了自适应上下文压缩机制,当上下文使用率达到 50% 阈值时自动触发压缩,将压缩目标定在 20%。压缩策略是选择性的——优先压缩工具调用历史,保留关键的用户指令和代理回复。用户也可以通过 /compress 命令手动触发压缩。

8.2 子代理委派

对于复杂任务,Hermes 支持将子任务委派给独立的子代理。子代理拥有完全隔离的上下文和工具,不会污染主代理的 token 预算。批量委派模式支持最多 3 个子代理并行工作,大大提升了复杂项目的处理效率。子代理结果以摘要形式返回,避免中间数据充斥主代理的上下文窗口。

8.3 插件系统

Hermes 的插件系统允许社区贡献者扩展框架的功能。插件可以添加新的工具、命令、记忆后端和平台适配器。插件管理通过 hermes plugins 命令完成,支持安装、列表和移除操作。

九、应用场景与使用案例

Hermes Agent 的应用场景非常广泛:

  • 软件开发:代码编写、调试、代码审查、重构、文档生成、CI/CD 管理。Hermes 的终端工具提供了完整的开发环境交互能力。通过 worktree 模式(-w 参数),多个代理可以并行工作在同一个项目的不同分支上。
  • 系统管理:服务器配置、监控、日志分析、自动化运维脚本编写和执行。agent 可以 SSH 到远程服务器执行操作并返回结果。
  • 研究与分析:网页搜索、论文研读、数据抓取和分析、报告生成。跨会话记忆使得长期研究项目可以持续追踪进展。
  • 内容创作:博客文章、社交媒体内容、营销文案、翻译和本地化。技能系统可以保存特定的创作风格和流程。
  • 数据科学:数据清洗、特征工程、模型训练、可视化、实验记录。代码执行和文件工具完美适配数据科学工作流。
  • 智能家居:通过与 Home Assistant 集成控制物联网设备。
  • 个人助理:日程管理、邮件处理、信息收集、定时提醒。网关平台让助理服务触手可及。

十、在 AI Agent 生态中的定位

Hermes Agent 在当前的 AI Agent 生态中占据着独特的位置。与 Claude Code 和 Codex CLI 相比,Hermes 最大的优势在于其开放性和可扩展性。

特性Hermes AgentClaude CodeCodex CLI
开源许可MIT 完全开源闭源开源
模型提供商20+ 提供商仅 Anthropic仅 OpenAI
持久记忆跨会话保留
技能积累自我进化
跨平台网关15+ 平台仅 CLI仅 CLI
配置文件隔离多 Profile
定时任务内置 Cron
MCP 支持服务端+客户端客户端
Webhook支持

从对比中可以看出,Hermes 是功能最全面的 Agent 框架。它不是简单地将 LLM 封装成一个聊天界面,而是一个完整的 AI 代理操作系统——具备持久化记忆、程序化知识、跨平台通信、任务调度和多代理协作等企业级特性。

十一、局限与挑战

尽管 Hermes Agent 功能强大,但它也面临一些挑战:

  • 学习曲线:丰富的功能意味着一定的学习成本。新手需要花时间了解工具系统、技能系统和配置选项。好在交互式向导和内置的文档系统大大降低了入门门槛。
  • 终端依赖:虽然 Hermes 支持多平台网关,但完整的工具能力(特别是 terminal 工具)需要在终端环境中运行,这使得它在纯聊天场景下的能力受限。
  • token 消耗:长时间运行的 Agent 会话会产生大量的 token 消耗。上下文压缩机制缓解了这个问题,但重度用户仍需要关注 API 使用量。
  • 生态成熟度:相比 Claude Code 背后 Anthropic 的商业支持和 Codex CLI 背后 OpenAI 的品牌效应,Hermes 的开源社区仍在成长中。但 Nous Research 团队的持续投入和活跃的社区贡献正在快速缩小差距。
  • Windows 支持:虽然 Hermes 支持 Windows,但部分 POSIX 特性的差异(如信号处理、文件权限等)可能导致偶尔的兼容性问题。项目文档中专门列出了 Windows 特有的注意事项。

十二、未来发展展望

Hermes Agent 的发展方向令人期待。从项目路线图和社区讨论中可以窥见几个趋势:

  • 多模态增强:进一步强化图像、视频、音频等多模态内容的处理能力,让 agent 能够理解更丰富的信息形式。
  • 更深的 IDE 集成:通过 ACP 协议和 MCP 服务器,实现与更多开发环境的无缝集成,成为开发者日常工具箱的核心组件。
  • 技能生态:技能注册中心正在发展,社区贡献的技能将使 Hermes 的知识库快速增长。技能集市的概念将使知识共享像应用商店一样便捷。
  • 企业级特性:看板系统、配置文件隔离、审计日志等特性使 Hermes 越来越适合企业部署。多租户支持和角色权限管理也在规划中。
  • 边缘部署:通过本地模型支持和轻量级架构,Hermes 正在向边缘设备延伸。未来可能在树莓派等低功耗设备上运行轻量级 agent 服务。

总结

Hermes Agent 是 Nous Research 打造的一款令人印象深刻的开源 AI Agent 框架。它的设计理念超越了简单的聊天机器人或编程助手,而是构建了一个完整的、可扩展的、自学习的 AI 代理操作系统。提供商无关的设计、持久记忆、技能积累、跨平台网关和多代理协作等特性,使其在当前的 AI Agent 生态中独树一帜。

对于开发者而言,Hermes Agent 提供了一个强大的生产力工具——它可以在你的终端中编写代码、在消息平台上回答问题、在服务器上执行运维任务、在定时触发下生成报告。对于团队而言,Hermes 的看板系统和配置文件隔离支持多人协作的工作流。对于企业而言,Hermes 的安全机制、审计日志和可扩展架构提供了合规部署的基础。

更重要的是,Hermes 的开源精神和活跃的社区正在推动 AI Agent 技术的民主化。任何人都可以下载、使用、修改和扩展它。随着技能积累和社区贡献的持续增长,Hermes Agent 的潜力将不断释放,成为 AI Agent 时代不可或缺的基础设施。

如果你还没有尝试过 Hermes Agent,现在就是最好的时机。只需一条命令即可开始你的 AI Agent 之旅。

项目地址:https://github.com/NousResearch/hermes-agent
官方文档:https://hermes-agent.nousresearch.com/docs/

(全文完)

OpenClaw 安装使用教程

最近一段时间,OpenClaw横空出世,又带动一波AI的热潮。它让我们和AI的聊天对话,变成了一个可执行的数字员工,大大便利和改变我们的工作生活和学习方式。以前我们需要招聘文案、策划、销售、程序员、测试、设计、售前、售后等等,现在会发现你可以用数字军团来帮你完成这些工作。今天小编就来说说如何在个人的电脑上安装和使用OpenClaw。

1、认识OpenClaw

在安装之前我们需要了解一下是什么是OpenClaw。

OpenClaw是一款由奥地利程序员Peter Steinberger于2025年底发起并开源的个人AI智能体(Agent)框架,昵称“小龙虾”。‌它核心定位为“真正能执行任务的AI”,旨在让AI从被动对话转向能主动操作计算机、执行复杂任务的“数字员工”。它解决了传统 AI “只说不做” 的痛点。

它仅用三个月便在GitHub上斩获超20万星标,发展非常迅猛,非常受人欢迎。当OpenClaw出现不久,国内的几家大厂也都迅速跟进,像字节的ArkClaw、腾讯的QClaw、阿里云的CoPaw、智谱AutoClaw、猎豹的EasyClaw、月之暗面的KimiClaw、MaxClaw等等。这些大厂基本都是收费的,一个月几十到几百块不等。如果我们可以自己在自己的电脑上安装和部署OpenClaw,就可以省下这部分银子。

其核心能力:
◦ 自主执行:解析指令 → 拆解任务 → 调用工具(文件 / 浏览器 / 命令 / API)→ 反馈结果。
◦ 本地优先:数据与执行全在本地,不上传云端,隐私可控。
◦ 模型无关:支持Deepseek、GPT、Claude、混元、通义及本地 llama 等多种大模型。
◦ 模块化扩展:通过 “技能(Skills)” 插件扩展能力,可接入飞书、钉钉、微信等渠道。

2、安装部署OpenClaw

2.1、安装部署要求

•系统:Win 10/11(WSL2) / macOS 10.15+ / Linux(CentOS8+、Ubuntu22+)

•硬件:CPU ≥ 2核 / 内存 ≥ 8GB / SSD ≥ 40GB 

•依赖:必须安装Node.js 22.18+ 

另外,需要获取核心大模型的API Key。

•推荐平台:Deepseek/阿里百炼/Kimi (月之暗面)/MiniMax/GLM 

•安全警示:API Key 等同于登录密码,请务必妥善保管,切勿公开泄露 

2.2、在Windows系统下安装

在 Windows 环境推荐使用 PowerShell 或 WSL2 

执行命令:powershell -c "irm https://openclaw.ai/install.ps1 | iex" 

然后执行:openclaw --version  终端打印出版本号即表示安装成功

2.3、在MacOS & Linux系统下安装

在 macOS / Linux 系统中直接打开自带的 Terminal 终端。

执行命令:curl -fsSL https://openclaw.ai/install.sh | bash 

然后执行:openclaw --version  终端打印出版本号即表示安装成功

2.4、配置

安装好之后,启动配置命令:openclaw onboard --install-daemon 初始化 

核心配置清单:

● 风险确认:输入 y 确认知悉风险 

● 新手模式:推荐选择 QuickStart 

● 配置密钥:粘贴已获取的 API Key 

● 模型选择:deepseek (示例) 

● 启动方式:推荐 Hatch in TUI 

其他命令:

openclaw dashboard 打开浏览器 

openclaw gateway start 开启网关 

openclaw channels add 添加通道 

3、开启你的AI数字化员工

OpenClaw安装成功后的截图如下:

OpenClaw能干什么:

a、每天早上8点把当天的天气和10条时事热点新闻发送给我

b、搜集当前市场最好卖的5个商品给我 

c、帮我监控xx股票,当股票价格30分钟内 振幅超过1%时,通知我

d、开发一个xx产品项目

e、日程安排:安排5天的港澳游计划 

f、帮我整理桌面

g、帮我下载某个视频

等等,不一而足。

《判断权》:AI时代程序员的生存寓言——一部250章长篇小说的深度解读

2022年11月15日,OpenAI在API控制台上静默发布了text-davinci-003。同一天,上海张江高科软件园的一间写字楼里,一个32岁的程序员在午休时间打开Playground,看到了模型下拉菜单中排在最顶部的那个新编号。他没有输入任何prompt,看了几秒,关掉了页面。

这个场景,正是长篇小说《判断权》第22章「加速」的开篇。而这个名叫陈默的程序员,在接下来的250章里,将经历从2020年到2050年整整三十年的AI技术浪潮——从GPT-3到AGI,从Copilot到具身智能,从"写代码"到"人还剩下什么"。

一、什么是"判断权"?

"判断权"这三个字,在小说中有一个精确的递进定义:

  • 第一层:代码判断——选择什么技术、如何解决问题
  • 第二层:职业判断——在AI替代面前,是适应还是抗拒
  • 第三层:伦理判断——当AI可以做决策时,人类应该让渡多少权力
  • 第四层:终极判断——当AI超越人类,"人"还剩下什么

作者将这个概念称为"人之所以为人,在于判断"。这不是哲学命题的空洞讨论,而是通过一个普通程序员的视角,将这个命题嵌入到日常生活的一帧一帧里:深夜调试代码时的那一次犹豫、路过老张空工位时身体自动绕行的那条路线、在电梯镜面中看到自己侧脸时停顿的那一秒。

二、一部"反爽文"的技术小说

当前市场上关于AI的技术小说,大多走的是"逆袭"路线:主角穿越重生、提前布局、精准踩中每一个风口、最终站在时代之巅。《判断权》完全相反。陈默不是天才,不是先知,甚至不是那种"比别人更努力"的典型主角。他只是一个在张江高科写Java的普通程序员,有一个当语文老师的妻子,有一个叫小朵的女儿,有一个被裁后转行送外卖的老张同事。

小说的核心叙事方法,被创作者称为"感官现实主义"

  1. 只写人物能感知到的——不写上帝视角,不写内心旁白
  2. 技术细节精确到API版本号——text-davinci-003是2022年11月15日发布的,不是"某一天"
  3. 情感通过物理细节传递——不是"他感到恐惧",而是"手指在键盘上停了一秒,然后继续打字"
  4. 每个配角都有独立动机——老张不只是"35岁被裁的工具人",他有自己的声音、自己的选择

这种写法的代价是:节奏极慢。第22章写了2022年11月中旬的一天,从早上七点十分出地铁到深夜加班结束。但正是这种慢,让读者感受到时间的真实重量——因为AI的迭代速度,正是在这种日常的慢中,一点一点碾压过来的。

三、时间密度的U型设计

小说的时间线设计精妙。从2020年夏末到2050年,30年的跨度被分成五部曲,但章节数量的分布呈U型:

时间密度(章/月)
1.5 ┤  ██                              ███
1.0 ┤ █  █                            █   █
0.5 ┤█    ████████████                █     █
0.0 ┼────┼────┼────┼────┼────┼────┼────┼───→ 时间
  夏末  秋   冬   春   夏   秋   10月  11月
  2020            2021       2022
     └─密集─┘  └──稀疏──┘  └──密集──┘

开头密集(Ch01-05),快速建立焦虑基调;中间稀疏(Ch05-Ch15),焦虑潜伏蓄力;结尾密集(Ch19-22),判断权集中行使。读者在第20-22章感受到的时间压迫,不仅来自情节——AI迭代速度越来越快,更来自阅读节奏本身——章节密度越来越高。

这种"密度U型"是叙事的心跳。它让技术焦虑不再是一个概念,而是一种生理性的阅读体验。

四、老张:一面镜子

老张是陈默的镜像角色。1985年出生,2022年2月被裁时37岁。天台上,他对陈默说出那些碎片化的词语:"五年""三十五""这种桥"。小说不给老张完整的独白——他的话语是破碎的,像一个正在失去语言能力的人。

第12章「老张离职」后,他的工位空了。马克杯倒扣着,杯底的褐色渍印随时间一层层加深。便签纸翘起来,胶完全失去黏性。键盘上落了薄灰。这些物理细节,比任何"失业率数据"都更有力。

陈默路过那个空工位的动作变化,是全书最精准的情感刻度:

  • 最初:下意识侧肩,怕碰到什么
  • 三个月后:身体记住了路线,自动绕行
  • 九个月后:连侧都不侧

这不是冷漠,是人对失去的适应。但适应本身就是恐惧——它说明"失去"已经成为日常的一部分。

五、AI作为"日常化"的恐怖

《判断权》对AI的处理方式,在技术文学中独树一帜。小说中的AI不是从天而降的救世主或毁灭者,而是像暖气的干燥味道一样——你每天闻到它,习惯它,直到有一天你发现整个冬天都是靠它活着的。

陈默与AI的关系变化:

章节AI工具陈默的反应
Ch10-11text-davinci-002好奇、测试、新鲜感
Ch15text-davinci-002AI代码有bug,debug一整天
Ch17-18Copilot(观察)同事在用,开始意识到趋势
Ch19Copilot(review)发现6处AI编码风格指纹,开始系统化审查
Ch21text-davinci-003亲手确认质变——"003比002好太多"
Ch22003(只看不调用)打开API控制台,确认003还在,关掉——不再测试,开始想"下一个是什么"

从"测试"到"确认存在但不调用"——这个微妙的动作转变,标志着陈默从技术使用者变成了存在性思考者。他不再问"AI能做什么",而是问"AI的下一步意味着什么"。

六、五部曲的色彩密码

小说的五部曲用色彩编码,从暖到冷再到纯粹:

  • 第一部(2020-2023):暖黄+午夜蓝——家庭温暖与深夜代码的对比
  • 第二部(2024-2025.10):冷银+屏幕蓝——AI工具加速渗透
  • 第三部(2025.11-2026.3):铁锈红+深灰——OpenClaw冲突的紧张感
  • 第四部(2026-2035):雾霾灰+霓虹紫——混沌探索期
  • 第五部(2036-2050):黑白+琥珀金——终极判断的纯粹与庄严

这种色彩体系参考了《社交网络》的快速对话节奏、《她》(Her)的温暖孤独感、《黑镜》前三季的技术困境。但最核心的参照是《美国工厂》——真实工作场景的质感。张江高科的暖气味道、电梯金属壁面映出的侧脸、行道树枝干上最后一片叶子落下的过程——这些不是装饰,是叙事的骨骼。

七、对创作者的启示:AI写作的"去AI味"

《判断权》的创作过程本身就是一个值得研究的案例。小说由6个Agent组成的11-Flow异构管线创作:

🎬 Director    → 导演笔记、调研、发布
🎭 Screenwriter → 剧本结构、场景设计
📚 Lore Keeper  → 设定审核、六维审计
✍️ Writer       → 正文草稿
✨ Polisher     → 精修正文、风格审计
💬 Feedback     → 试读反馈、场景设计

其中最值得注意的是风格审计节点:Flow 5(精修)和 Flow 9(终审)承担风格与符号一致性审计。Flow 5 检查文字层面的AI味和风格漂移——比如"是……的"句式每出现一次扣一分;Flow 9 检查符号递归——如蓝色方块在Ch16→Ch20→Ch22的三维闭合。

这套系统的存在,恰恰说明了一个悖论:用AI来创作一部关于AI焦虑的小说,本身就需要一套精密的"去AI味"机制。创作者不能让技术工具的痕迹污染故事的真实感——读者必须忘记这是一部AI参与创作的作品,才能真正感受到陈默的焦虑。

八、留给时代的问题

小说的最终问题不是"AI会不会取代程序员"——这是一个已经过时的问题。真正的问题是:

当AI能做得更好时,人还剩下什么?

陈默给出的答案不是一个概念,而是一条轨迹——从执行者到提问者,从判断者到定义者。小说承诺"希望而非绝望"的终局,但这个希望不是廉价的乐观主义,而是通过250章、30年、无数个深夜和无数次空格键的敲击,一帧一帧建构出来的。

在2026年的今天,当我们已经被ChatGPT、Claude、Copilot、Cursor包围的时候,重读《判断权》的前22章,会发现一件事:小说中最令人不安的,不是AI变强了,而是我们已经习惯了

就像陈默路过老张空工位时,连侧都不侧了。


《判断权》是一部连载中的长篇小说,目前完成22章,规划250章。核心主题涵盖AI编程、35岁危机、技术焦虑与人的判断权。全文时间跨度从2020年至2050年,采用"感官现实主义"写法,技术细节精确到API版本号和发布日期。