配置 | AIHugoBlog

概述 Hermes Agent 默认开启大模型的"思考模式"（reasoning mode），模型会在正式回答前先输出一段 <think> 推理过程。对于简单问答、命令补全等场景，这段思考既消耗 token 又会刷屏。本文记录关闭思考模式的三种方式，从临时到永久覆盖全场景。一、3 种关闭方式对比方式命令/位置生效范围持久性推荐场景斜杠命令 /reasoning none 当前会话临时临时切换、调试配置文件 display.show_reasoning: false 全局永久长期使用偏好启动参数 hermes chat --reasoning none 单次启动一次性一次性任务、CI 二、方法一：斜杠命令（最常用）在当前交互会话中直接输入： /reasoning none 可选级别： none —— 完全关闭思考（最省 token、响应最快） minimal —— 最小化思考 low / medium / high / xhigh —— 思考强度递增 hide —— 思考但不在终端回显（视觉静音） show —— 思考并显示（默认行为）推荐组合：日常命令补全：/reasoning none 既要质量又嫌刷屏：/reasoning hide 三、方法二：配置文件永久生效编辑 ~/.hermes/config.yaml，在 display 段添加： ...