Hermes Agent 关闭大模型思考模式的 3 种方法
概述 Hermes Agent 默认开启大模型的"思考模式"(reasoning mode),模型会在正式回答前先输出一段 <think> 推理过程。对于简单问答、命令补全等场景,这段思考既消耗 token 又会刷屏。本文记录关闭思考模式的三种方式,从临时到永久覆盖全场景。 一、3 种关闭方式对比 方式 命令/位置 生效范围 持久性 推荐场景 斜杠命令 /reasoning none 当前会话 临时 临时切换、调试 配置文件 display.show_reasoning: false 全局 永久 长期使用偏好 启动参数 hermes chat --reasoning none 单次启动 一次性 一次性任务、CI 二、方法一:斜杠命令(最常用) 在当前交互会话中直接输入: /reasoning none 可选级别: none —— 完全关闭思考(最省 token、响应最快) minimal —— 最小化思考 low / medium / high / xhigh —— 思考强度递增 hide —— 思考但不在终端回显(视觉静音) show —— 思考并显示(默认行为) 推荐组合: 日常命令补全:/reasoning none 既要质量又嫌刷屏:/reasoning hide 三、方法二:配置文件永久生效 编辑 ~/.hermes/config.yaml,在 display 段添加: ...