Hermes Agent 关闭大模型思考模式的 3 种方法

概述

Hermes Agent 默认开启大模型的"思考模式"（reasoning mode），模型会在正式回答前先输出一段 <think> 推理过程。对于简单问答、命令补全等场景，这段思考既消耗 token 又会刷屏。本文记录关闭思考模式的三种方式，从临时到永久覆盖全场景。

方式	命令/位置	生效范围	持久性	推荐场景
斜杠命令	`/reasoning none`	当前会话	临时	临时切换、调试
配置文件	`display.show_reasoning: false`	全局	永久	长期使用偏好
启动参数	`hermes chat --reasoning none`	单次启动	一次性	一次性任务、CI

在当前交互会话中直接输入：

/reasoning none

可选级别：

推荐组合：

编辑 ~/.hermes/config.yaml，在 display 段添加：

display:
  show_reasoning: false        # 关闭思考内容回显

部分 provider（如 OpenRouter）支持更细粒度控制，可在 model 段加：

model:
  reasoning_effort: none       # 直接关闭思考

或用 CLI 命令直接改：

hermes config set display.show_reasoning false

⚠️ 改完需要 /reset（CLI）或重启 gateway 才生效。

单次启动时通过 --reasoning 参数指定：

hermes chat --reasoning none -q "你的问题"

适合：

display.show_reasoning: false 只是"不显示"，模型仍在思考。要真正省 token 算力，必须用 none 级。
部分国产模型只支持二值切换（如 medium/high）。遇到 /reasoning none 报错或被忽略时，先用 /reasoning show 查看 provider 实际支持的级别。
配置改动后没生效？检查是否需要 /reset 或重启 gateway。Tools/skills 改动也需要 /reset。
/reasoning hide vs none 的取舍：hide 保留内部推理，输出质量更稳；none 真正省算力，但复杂任务可能掉质量。

方法一验证（推荐）：

/reasoning show

若终端开始显示 <think> 块，说明已开启；输入 /reasoning none 后回车应看到提示。

方法二验证（配置文件）：

cat ~/.hermes/config.yaml | grep show_reasoning

应输出 show_reasoning: false。

需求	推荐方案
临时关闭（当前会话）	`/reasoning none`
长期关闭	`config.yaml` 改 `show_reasoning: false` + `reasoning_effort: none`
一次性任务	`hermes chat --reasoning none -q "..."`
保留思考但嫌刷屏	`/reasoning hide`

按场景选用即可——日常开发推荐方法一，自动化脚本推荐方法三，长期偏好推荐方法二。