概述
Hermes Agent 默认开启大模型的"思考模式"(reasoning mode),模型会在正式回答前先输出一段 <think> 推理过程。对于简单问答、命令补全等场景,这段思考既消耗 token 又会刷屏。本文记录关闭思考模式的三种方式,从临时到永久覆盖全场景。
一、3 种关闭方式对比
| 方式 | 命令/位置 | 生效范围 | 持久性 | 推荐场景 |
|---|---|---|---|---|
| 斜杠命令 | /reasoning none |
当前会话 | 临时 | 临时切换、调试 |
| 配置文件 | display.show_reasoning: false |
全局 | 永久 | 长期使用偏好 |
| 启动参数 | hermes chat --reasoning none |
单次启动 | 一次性 | 一次性任务、CI |
二、方法一:斜杠命令(最常用)
在当前交互会话中直接输入:
/reasoning none
可选级别:
none—— 完全关闭思考(最省 token、响应最快)minimal—— 最小化思考low/medium/high/xhigh—— 思考强度递增hide—— 思考但不在终端回显(视觉静音)show—— 思考并显示(默认行为)
推荐组合:
- 日常命令补全:
/reasoning none - 既要质量又嫌刷屏:
/reasoning hide
三、方法二:配置文件永久生效
编辑 ~/.hermes/config.yaml,在 display 段添加:
display:
show_reasoning: false # 关闭思考内容回显
部分 provider(如 OpenRouter)支持更细粒度控制,可在 model 段加:
model:
reasoning_effort: none # 直接关闭思考
或用 CLI 命令直接改:
hermes config set display.show_reasoning false
⚠️ 改完需要
/reset(CLI)或重启 gateway 才生效。
四、方法三:启动参数指定
单次启动时通过 --reasoning 参数指定:
hermes chat --reasoning none -q "你的问题"
适合:
- 一次性问答(用完即弃)
- CI/CD 流水线中调用 Hermes
- 脚本化批量任务
五、踩坑提醒
display.show_reasoning: false只是"不显示",模型仍在思考。要真正省 token 算力,必须用none级。- 部分国产模型只支持二值切换(如 medium/high)。遇到
/reasoning none报错或被忽略时,先用/reasoning show查看 provider 实际支持的级别。 - 配置改动后没生效?检查是否需要
/reset或重启 gateway。Tools/skills 改动也需要/reset。 /reasoning hidevsnone的取舍:hide保留内部推理,输出质量更稳;none真正省算力,但复杂任务可能掉质量。
六、验证是否生效
方法一验证(推荐):
/reasoning show
若终端开始显示 <think> 块,说明已开启;输入 /reasoning none 后回车应看到提示。
方法二验证(配置文件):
cat ~/.hermes/config.yaml | grep show_reasoning
应输出 show_reasoning: false。
总结
| 需求 | 推荐方案 |
|---|---|
| 临时关闭(当前会话) | /reasoning none |
| 长期关闭 | config.yaml 改 show_reasoning: false + reasoning_effort: none |
| 一次性任务 | hermes chat --reasoning none -q "..." |
| 保留思考但嫌刷屏 | /reasoning hide |
按场景选用即可——日常开发推荐方法一,自动化脚本推荐方法三,长期偏好推荐方法二。