教程概述
完成快速开始后,你已经能与 Agent 对话。本节带你深入理解配置体系:从 API 密钥管理、模型切换、温度参数,到偏好设置与系统提示词,让 Agent 的行为更加贴合你的使用场景。
前提条件
开始前请确认满足以下条件
- 已完成「快速开始」教程
- Hermes Agent 已能在本地正常运行
- 对 LLM 的常用参数有基本认识
学习目标
完成本教程后你将能够
- 理解 .env 中各配置项的含义
- 掌握不同模型的切换方式
- 学会调整 temperature、top_p 等核心参数
- 能够编写自定义的系统提示词
详细步骤
- 1
梳理配置文件结构
Hermes Agent 的配置主要分布在 .env 与 config/ 目录。.env 用于敏感信息,config/ 用于行为定义。
textHermes-Agent/ ├── .env # 密钥与连接配置 ├── config/ │ ├── model.json # 模型与参数 │ ├── prompts.json # 系统提示词 │ └── preferences.json # 个性化偏好 - 2
管理 API 密钥
支持 OpenAI、Anthropic、Azure 等多家服务商。可以同时配置多个,再通过 PROVIDER 字段切换。
bashOPENAI_API_KEY=sk-... ANTHROPIC_API_KEY=sk-ant-... PROVIDER=openai # 或 anthropic小贴士:推荐使用密钥管理工具(如 1Password、Doppler)保存生产环境密钥。
- 3
选择并切换模型
在 config/model.json 中维护可用模型列表,运行时通过 MODEL_NAME 选择。
json{ "models": { "gpt-4o": { "provider": "openai", "context": 128000 }, "gpt-4o-mini":{ "provider": "openai", "context": 128000 }, "claude-3-5": { "provider": "anthropic", "context": 200000 } } } - 4
调整核心参数
temperature 控制创造性,top_p 控制采样范围,max_tokens 限制单次回复长度。
json{ "temperature": 0.7, "top_p": 0.9, "max_tokens": 2048, "presence_penalty": 0.1 }小贴士:代码生成场景建议 temperature=0.2;创意写作场景可设到 0.9 以上。
- 5
编写系统提示词
系统提示词决定 Agent 的人格与行为边界。可以为不同任务定义多个提示词。
json{ "default": "你是一名严谨的工程师助理,回答需附带可验证的来源。", "writer": "你是一名创意作家,擅长用比喻和故事讲解复杂概念。" }注意:提示词过长会占用上下文 token,请保持精炼。
- 6
应用并验证配置
重启服务后,向 Agent 询问“当前使用的是哪个模型?”,确认配置已生效。
bashnpm run dev
最佳实践
- 为不同任务维护独立的 prompt 文件,便于版本管理
- 重要参数变更前先 git commit,方便回滚
- 为模型设置每日花费上限,避免账单失控
- 使用 .env.local 保存个人配置,团队配置放 .env
常见问题
Q1.切换模型后回答风格变化很大?
不同模型的训练数据与对齐策略不同,必要时需要为每个模型微调系统提示词。
Q2.如何在多个 API Key 之间负载均衡?
可以在 config/model.json 中配置多个 key 轮询,或接入 LiteLLM 等中间层。
Q3.temperature 和 top_p 哪个更重要?
通常只调整其中一个即可。建议固定 top_p=0.9,再通过 temperature 控制风格。
🎉 教程总结
现在你已经掌握 Hermes Agent 的核心配置。接下来推荐进入「集成聊天平台」教程,把 Agent 接入 QQ、飞书、钉钉,让它真正服务于团队和个人。