语义缓存接入 OpenClaw

更新时间:
复制 MD 格式

本文介绍如何将 Tair 语义缓存网关(OpenAI 兼容模式)接入 OpenClaw Agent,使 AI 对话在语义相似场景下实现毫秒级响应。完成全部步骤约需 3 分钟。

前提条件

条件

说明

语义缓存实例

已完成创建并处于运行中状态。若未创建,请参见语义缓存实例开通说明

接入信息

已获取服务地址(Base URL)和 API Key。

OpenClaw

已安装 OpenClaw 并能正常与大模型对话。

步骤一:获取语义缓存接入信息

  1. 登录 Tair 控制台,在左侧导航栏单击Tair 语义缓存网关实例

  2. 在实例列表中,单击目标实例名称,进入实例详情页。

  3. 接入信息区域,获取以下信息:

    信息

    用途

    格式示例

    服务地址(Endpoint/Base URL)

    替换 OpenClaw 中的模型服务地址

    http://tk-bp1******.redis.rds.aliyuncs.com

    API Key

    身份认证

    sk-****

说明

若需从公网访问(如本地开发机),在网络访问区域单击公网访问右侧的申请按钮。申请后 Base URL 会变为公网地址,API Key 保持不变。请根据实际网络环境选择匹配的地址。

步骤二:修改 OpenClaw Provider 配置

OpenClaw 的配置文件需要通过终端(命令行)编辑。

打开终端

  • macOS:按 Command + 空格 打开聚焦搜索,输入终端Terminal,回车打开。

  • Windows:按 Win + R,输入 cmdpowershell,回车打开。

定位配置文件

OpenClaw 的配置文件通常位于安装目录下的 openclaw.json。不同用户的安装路径可能不同,可通过以下命令查找:

openclaw config file

该命令会输出配置文件的完整路径,例如:

  • macOS/Linux:~/.openclaw/openclaw.json

  • Windows:C:\Users\<用户名>\.openclaw\openclaw.json

  1. 在终端中打开配置文件(请将路径替换为上一步获取的实际路径):

    vim ~/.openclaw/openclaw.json
  2. models.providers 中找到目标 Provider(或新增一个),将 baseUrlapiKey 替换为语义缓存实例的接入信息:

    {
      "models": {
        "providers": {
          "bailian": {
            "baseUrl": "http://tk-xxxxxx.redis.rds.aliyuncs.com/compatible-mode/v1",
            "apiKey": "sk-xxxxxx",
            "api": "openai-completions",
            "models": [
              { "id": "qwen3.6-plus" }
            ]
          }
        }
      }
    }

参数说明

参数

说明

baseUrl

语义缓存实例的服务地址,需拼接 /compatible-mode/v1 路径。

apiKey

语义缓存实例的 API Key(非百炼平台的 API Key)。

api

固定为 openai-completions,表示使用 OpenAI 兼容协议。

models.id

公测期间仅支持 qwen3.6-plus

步骤三:重启 OpenClaw Gateway

配置修改后,执行以下命令重启 Gateway 使配置生效:

openclaw gateway restart

验证缓存效果

通过 OpenClaw 对话验证

  1. 在 OpenClaw 中发送一个问题,例如:什么是 Redis Cluster?

  2. 等待回答完成。首次请求将调用 LLM,响应时间较长(通常数十秒)。

  3. 再发送一个语义相似但表述不同的问题:Redis Cluster 是什么?

  4. 观察响应速度。若缓存命中,第二次响应将在毫秒级完成,且回答内容与首次一致。

通过 curl 直接验证

您也可以绕过 OpenClaw,直接向语义缓存实例发送请求进行验证。

第一次请求(写入缓存)

curl "http://<Base URL>/compatible-mode/v1/chat/completions" \
  -H "Authorization: Bearer <API Key>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.6-plus",
    "messages": [{"role": "user", "content": "什么是Redis Cluster"}]
  }'

第二次请求(验证命中)

curl "http://<Base URL>/compatible-mode/v1/chat/completions" \
  -H "Authorization: Bearer <API Key>" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3.6-plus",
    "messages": [{"role": "user", "content": "Redis Cluster是什么"}]
  }'

若缓存命中,第二次请求的响应时间将从数十秒缩短至毫秒级。

注意事项

注意项

说明

公网与内网

公网地址和内网地址不同,请确认使用与网络环境匹配的地址。API Key 不受影响。

模型支持

公测期间 model 参数仅支持 qwen3.6-plus

配置生效

修改 Provider 配置后,建议手动执行 openclaw gateway restart 确认生效。

缓存匹配范围

语义缓存默认提取最后一条 user message 进行匹配。若请求中包含复杂的多轮对话历史,匹配行为可能与预期不同。

更多操作

  • 调整相似度阈值:阈值越低命中率越高但可能出现误匹配,阈值越高越精确但命中率下降。可在控制台插件配置中调整(默认 0.85)。

  • 配置缓存过期时间(TTL):对于答案可能过时的场景,设置合理的过期时间。

  • 配置索引字段(index_from):通过设置索引字段,可以实现缓存数据的过滤和多租户隔离。不同索引值的缓存数据相互隔离,互不干扰。

  • 查看完整 API 能力:参见技术架构与接口说明