创建模型服务。
接口说明
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action
元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
- 操作:是指具体的权限点。
- 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
- 资源类型:是指操作中支持授权的资源类型。具体说明如下:
- 对于必选的资源类型,用前面加 * 表示。
- 对于不支持资源级授权的操作,用
全部资源
表示。
- 条件关键字:是指云产品自身定义的条件关键字。
- 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作 | 访问级别 | 资源类型 | 条件关键字 | 关联操作 |
---|---|---|---|---|
gpdb:CreateModelService | create | *DBInstance acs:gpdb::{#accountId}:dbinstance/{#DBInstanceId} |
| 无 |
请求参数
名称 | 类型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
DBInstanceId | string | 是 | 实例 ID。 说明
您可以调用 DescribeDBInstances 接口查看目标地域下所有的 AnalyticDB PostgreSQL 实例的实例 ID。
| gp-xxxxxxxxx |
ModelName | string | 是 | 模型名称。 | Qwen3-Embedding-8B |
Description | string | 否 | 描述信息。 | test |
SecurityIPList | string | 否 | IP 白名单。 127.0.0.1 表示禁止任何外部 IP 访问,您可以在实例创建完成后调用 ModifySecurityIps 接口修改 IP 白名单。 | 127.0.0.1 |
AiNodes | array | 是 | 模型部署使用的 AINode 节点列表。 | |
string | 是 | AINode 节点名称。 | ai-xxxxxx | |
ModelParams | object | 否 | 模型参数(待支持)。 | 暂未开放 |
ResourceGroupId | string | 否 | 实例当前所属的资源组 ID。如何获取资源组 ID,请参见查看资源组基本信息。 | rg-bp67acfmxazb4p**** |
ClientToken | string | 否 | 幂等性校验。更多信息,请参见如何保证幂等性。 | 0c593ea1-3bea-11e9-b96b-88********** |
Replicas | integer | 否 | 模型服务副本数。 | 1 |
InferenceEngine | string | 否 | 推理引擎(当前仅支持 vllm)。 | vllm |
返回参数
示例
正常返回示例
JSON
格式
{
"ModelServiceId": "ms-xxxxxxxxx",
"RequestId": "ABB39CC3-4488-4857-905D-2E4A051D0521"
}
错误码
访问错误中心查看更多错误码。