概述

Hermes Agent 默认开启大模型的"思考模式"(reasoning mode),模型会在正式回答前先输出一段 <think> 推理过程。对于简单问答、命令补全等场景,这段思考既消耗 token 又会刷屏。本文记录关闭思考模式的三种方式,从临时到永久覆盖全场景。


一、3 种关闭方式对比

方式 命令/位置 生效范围 持久性 推荐场景
斜杠命令 /reasoning none 当前会话 临时 临时切换、调试
配置文件 display.show_reasoning: false 全局 永久 长期使用偏好
启动参数 hermes chat --reasoning none 单次启动 一次性 一次性任务、CI

二、方法一:斜杠命令(最常用)

在当前交互会话中直接输入:

/reasoning none

可选级别:

  • none —— 完全关闭思考(最省 token、响应最快)
  • minimal —— 最小化思考
  • low / medium / high / xhigh —— 思考强度递增
  • hide —— 思考但不在终端回显(视觉静音)
  • show —— 思考并显示(默认行为)

推荐组合:

  • 日常命令补全:/reasoning none
  • 既要质量又嫌刷屏:/reasoning hide

三、方法二:配置文件永久生效

编辑 ~/.hermes/config.yaml,在 display 段添加:

display:
  show_reasoning: false        # 关闭思考内容回显

部分 provider(如 OpenRouter)支持更细粒度控制,可在 model 段加:

model:
  reasoning_effort: none       # 直接关闭思考

或用 CLI 命令直接改:

hermes config set display.show_reasoning false

⚠️ 改完需要 /reset(CLI)或重启 gateway 才生效。


四、方法三:启动参数指定

单次启动时通过 --reasoning 参数指定:

hermes chat --reasoning none -q "你的问题"

适合:

  • 一次性问答(用完即弃)
  • CI/CD 流水线中调用 Hermes
  • 脚本化批量任务

五、踩坑提醒

  1. display.show_reasoning: false 只是"不显示",模型仍在思考。要真正省 token 算力,必须用 none 级。
  2. 部分国产模型只支持二值切换(如 medium/high)。遇到 /reasoning none 报错或被忽略时,先用 /reasoning show 查看 provider 实际支持的级别。
  3. 配置改动后没生效?检查是否需要 /reset 或重启 gateway。Tools/skills 改动也需要 /reset
  4. /reasoning hide vs none 的取舍hide 保留内部推理,输出质量更稳;none 真正省算力,但复杂任务可能掉质量。

六、验证是否生效

方法一验证(推荐):

/reasoning show

若终端开始显示 <think> 块,说明已开启;输入 /reasoning none 后回车应看到提示。

方法二验证(配置文件):

cat ~/.hermes/config.yaml | grep show_reasoning

应输出 show_reasoning: false


总结

需求 推荐方案
临时关闭(当前会话) /reasoning none
长期关闭 config.yamlshow_reasoning: false + reasoning_effort: none
一次性任务 hermes chat --reasoning none -q "..."
保留思考但嫌刷屏 /reasoning hide

按场景选用即可——日常开发推荐方法一,自动化脚本推荐方法三,长期偏好推荐方法二。