本文介绍如何将 Tair 语义缓存网关(OpenAI 兼容模式)接入 OpenClaw Agent,使 AI 对话在语义相似场景下实现毫秒级响应。完成全部步骤约需 3 分钟。
前提条件
条件 | 说明 |
语义缓存实例 | 已完成创建并处于运行中状态。若未创建,请参见语义缓存实例开通说明。 |
接入信息 | 已获取服务地址(Base URL)和 API Key。 |
OpenClaw | 已安装 OpenClaw 并能正常与大模型对话。 |
步骤一:获取语义缓存接入信息
登录 Tair 控制台,在左侧导航栏单击Tair 语义缓存网关实例。
在实例列表中,单击目标实例名称,进入实例详情页。
在接入信息区域,获取以下信息:
信息
用途
格式示例
服务地址(Endpoint/Base URL)
替换 OpenClaw 中的模型服务地址
http://tk-bp1******.redis.rds.aliyuncs.comAPI Key
身份认证
sk-****
若需从公网访问(如本地开发机),在网络访问区域单击公网访问右侧的申请按钮。申请后 Base URL 会变为公网地址,API Key 保持不变。请根据实际网络环境选择匹配的地址。
步骤二:修改 OpenClaw Provider 配置
OpenClaw 的配置文件需要通过终端(命令行)编辑。
打开终端:
macOS:按
Command + 空格打开聚焦搜索,输入终端或Terminal,回车打开。Windows:按
Win + R,输入cmd或powershell,回车打开。
定位配置文件:
OpenClaw 的配置文件通常位于安装目录下的 openclaw.json。不同用户的安装路径可能不同,可通过以下命令查找:
openclaw config file该命令会输出配置文件的完整路径,例如:
macOS/Linux:
~/.openclaw/openclaw.jsonWindows:
C:\Users\<用户名>\.openclaw\openclaw.json
在终端中打开配置文件(请将路径替换为上一步获取的实际路径):
vim ~/.openclaw/openclaw.json在
models.providers中找到目标 Provider(或新增一个),将baseUrl和apiKey替换为语义缓存实例的接入信息:{ "models": { "providers": { "bailian": { "baseUrl": "http://tk-xxxxxx.redis.rds.aliyuncs.com/compatible-mode/v1", "apiKey": "sk-xxxxxx", "api": "openai-completions", "models": [ { "id": "qwen3.6-plus" } ] } } } }
参数说明:
参数 | 说明 |
baseUrl | 语义缓存实例的服务地址,需拼接 |
apiKey | 语义缓存实例的 API Key(非百炼平台的 API Key)。 |
api | 固定为 |
models.id | 公测期间仅支持 |
步骤三:重启 OpenClaw Gateway
配置修改后,执行以下命令重启 Gateway 使配置生效:
openclaw gateway restart验证缓存效果
通过 OpenClaw 对话验证
在 OpenClaw 中发送一个问题,例如:
什么是 Redis Cluster?等待回答完成。首次请求将调用 LLM,响应时间较长(通常数十秒)。
再发送一个语义相似但表述不同的问题:
Redis Cluster 是什么?观察响应速度。若缓存命中,第二次响应将在毫秒级完成,且回答内容与首次一致。
通过 curl 直接验证
您也可以绕过 OpenClaw,直接向语义缓存实例发送请求进行验证。
第一次请求(写入缓存):
curl "http://<Base URL>/compatible-mode/v1/chat/completions" \
-H "Authorization: Bearer <API Key>" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.6-plus",
"messages": [{"role": "user", "content": "什么是Redis Cluster"}]
}'第二次请求(验证命中):
curl "http://<Base URL>/compatible-mode/v1/chat/completions" \
-H "Authorization: Bearer <API Key>" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.6-plus",
"messages": [{"role": "user", "content": "Redis Cluster是什么"}]
}'若缓存命中,第二次请求的响应时间将从数十秒缩短至毫秒级。
注意事项
注意项 | 说明 |
公网与内网 | 公网地址和内网地址不同,请确认使用与网络环境匹配的地址。API Key 不受影响。 |
模型支持 | 公测期间 model 参数仅支持 |
配置生效 | 修改 Provider 配置后,建议手动执行 |
缓存匹配范围 | 语义缓存默认提取最后一条 user message 进行匹配。若请求中包含复杂的多轮对话历史,匹配行为可能与预期不同。 |
更多操作
调整相似度阈值:阈值越低命中率越高但可能出现误匹配,阈值越高越精确但命中率下降。可在控制台插件配置中调整(默认 0.85)。
配置缓存过期时间(TTL):对于答案可能过时的场景,设置合理的过期时间。
配置索引字段(index_from):通过设置索引字段,可以实现缓存数据的过滤和多租户隔离。不同索引值的缓存数据相互隔离,互不干扰。
查看完整 API 能力:参见技术架构与接口说明。