与PolarDB Agent Express应用集成

更新时间:
复制 MD 格式

模型代理PolarDB Agent Express应用集成,可为多智能体应用提供统一的模型接入、限流、预算管理和可观测能力。本文介绍如何将PolarDB Agent Express应用模型代理进行集成。

集成概述

PolarDB Agent Express应用模型代理集成后,您可以获得以下能力:

  • 限流和预算控制:为PolarDB Agent Express应用中的用户和用户组配置Token限流和费用预算,防止资源过度消耗。

  • 可观测性:通过模型代理监控PolarDB Agent Express应用的模型调用情况,包括调用量、延迟和Token消耗等指标。

  • 集中化模型管理:通过模型代理统一管理模型服务的接入和路由,简化PolarDB Agent Express应用的模型配置。

集成PolarDB Agent Express应用模型代理

  1. 模型代理完成模型服务和模型API的配置。

  2. 模型代理中创建PolarDB Agent Express应用使用的用户和用户组,获取API Key。

  3. PolarDB Agent Express应用配置 > 模型配置中,将模型服务地址设置为模型代理的实例地址与模型API,格式为:http://<模型代理内网地址>:<端口>/<模型代理模型APIBase Path>。例如,http://pg-xxx.polardbaigateway.rds.aliyuncs.com:8000/test_pathhttps://pg-xxx.polardbaigateway.rds.aliyuncs.com:8543/test_path

    说明

    模型代理 默认使用8000端口(HTTP)和8543端口(HTTPS)。请确保PolarDB Agent Express应用模型代理部署在同一VPC中,以实现内网互通。