CreateModelService - 创建模型服务

更新时间:
复制为 MD 格式

创建模型服务。

接口说明

请确保在使用该接口前,已充分了解 AnalyticDB PostgreSQL 版产品的收费方式价格

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

调试

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。

  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。

  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:

    • 对于必选的资源类型,用前面加 * 表示。

    • 对于不支持资源级授权的操作,用全部资源表示。

  • 条件关键字:是指云产品自身定义的条件关键字。

  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。

操作

访问级别

资源类型

条件关键字

关联操作

gpdb:CreateModelService

create

*DBInstance

acs:gpdb::{#accountId}:dbinstance/{#DBInstanceId}

请求参数

名称

类型

必填

描述

示例值

DBInstanceId

string

实例 ID。

说明

您可以调用 DescribeDBInstances 接口查看目标地域下所有的 AnalyticDB PostgreSQL 实例的实例 ID。

gp-xxxxxxxxx

ModelName

string

模型名称。

Qwen3-Embedding-8B

Description

string

描述信息。

test

SecurityIPList

string

IP 白名单。

127.0.0.1 表示禁止任何外部 IP 访问,您可以在实例创建完成后调用 ModifySecurityIps 接口修改 IP 白名单。

127.0.0.1

AiNodes

array

模型部署使用的 AINode 节点列表。

string

AINode 节点名称。

ai-xxxxxx

ModelParams

object

模型参数(待支持)。

暂未开放

ResourceGroupId

string

实例当前所属的资源组 ID。如何获取资源组 ID,请参见查看资源组基本信息

rg-bp67acfmxazb4p****

ClientToken

string

幂等性校验。更多信息,请参见如何保证幂等性

0c593ea1-3bea-11e9-b96b-88**********

Replicas

integer

模型服务副本数。

1

InferenceEngine

string

推理引擎(当前仅支持 vllm)。

vllm

EnablePublicConnection

boolean

是否开启公网

false

返回参数

名称

类型

描述

示例值

object

ModelServiceId

string

模型服务 ID。

ms-xxxxxxxxx

RequestId

string

请求 ID。

ABB39CC3-4488-4857-905D-2E4A051D0521

示例

正常返回示例

JSON格式

{
  "ModelServiceId": "ms-xxxxxxxxx",
  "RequestId": "ABB39CC3-4488-4857-905D-2E4A051D0521"
}

错误码

访问错误中心查看更多错误码。

变更历史

更多信息,参考变更详情