本文为您介绍注册、查询、修改、删除AI模型的DDL数据定义语句。
使用须知
CREATE MODEL
注册模型
在数据查询文本编辑区域,输入以下命令。
CREATE [TEMPORARY] MODEL [catalog_name.][db_name.]model_name
INPUT ( { <physical_column_definition> [, ...n] )
OUTPUT ( { <physical_column_definition> [, ...n] )
WITH (key1=val1, key2=val2, ...)
<physical_column_definition>:
column_name column_type [COMMENT column_comment]
子句 | 描述 | 关键参数 | Schema限制 | 示例 |
INPUT | 定义模型输入数据的字段、类型以及字段的顺序。 |
| 有且仅有一个STRING类型的字段。 |
|
OUTPUT | 定义模型输出数据的字段、类型以及字段顺序。 |
| 不同模型任务类型限制如下:
|
|
WITH | 请参见WITH参数。 |
| 无。 |
|
示例
阿里云百炼
CREATE MODEL model_bailian
INPUT (`input` STRING)
OUTPUT (`content` STRING)
WITH (
'provider'='bailian',
'endpoint'='<Endpoint>',
'api-key'='<bailian-key>',
'model'='qwen3-235b-a22b'
);
百炼平台模型服务端口格式为:<base-url>/compatible-mode/v1/<task>
。例如https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions
。
base-url:
公网:
https://dashscope.aliyuncs.com
。使用公网需要Flink开通公网访问,详情请参见网络连接选型。私网:通过终端节点私网访问阿里云百炼平台。暂时仅支持部署在华北2(北京)地域的实时计算服务。
task:模型任务类型。支持以下取值。
人工智能平台PAI
CREATE MODEL model_pai
INPUT (`input` STRING)
OUTPUT (`embedding` ARRAY<FLOAT>)
WITH (
'provider'='bailian',
'endpoint'='<VPC调用地址>',
'api-key'='<Token>',
'model'='qwen3-235b-a22b'
);
如何获取endpoint和api-key?如果您还没有相关服务,详情请参见一键部署DeepSeek-V3、DeepSeek-R1模型。
登录人工智能平台PAI控制台。
在左侧导航栏选择
,单击对应服务名称。单击查看调用信息。
重要VPC调用地址为http,需修改为https。地址后缀需要添加
/v1/<task>
。task:模型任务类型。支持以下取值:例如
https://************.vpc.cn-hangzhou.pai-eas.aliyuncs.com/api/predict/quickstart_deploy_20250722_7b22/v1/chat/completions
。Token为参数api-key的值。
WITH参数
通用
参数 | 说明 | 数据类型 | 是否必填 | 默认值 | 备注 |
provider | 模型服务类型。 | String | 是 | 无 | 固定值为 说明 支持PAI平台或其他兼容OpenAI API模型服务,固定值不变。 |
endpoint | 模型服务端口,或其他兼容OpenAI API的Embeddings和Chat/Completions模型服务端口。 | String | 是 | 无 |
|
api-key | 用来访问百炼平台接口的密钥。 | String | 无 | 详情请参见获取API Key。 曾用键名:apiKey(vvr 11.1版本) | |
max-context-size | 单个请求的上下文的最大容量 | Integer | 否 | 无 |
|
context-overflow-action | 单个请求的上下文超过最大容量时的处理行为 | String | 否 |
| vvr 11.2及以上版本支持。 可选值如下:
|
chat/completions
Chat/Completions模型任务依赖如下参数:
参数 | 说明 | 数据类型 | 是否必填 | 默认值 | 备注 |
model | 调用的服务端的具体模型。 | String | 是 | 无 | 支持文本生成类别的模型。 说明 根据所选模型、输入内容及输出结果的Token数量进行计算,将产生相应的费用。 |
system-prompt | 请求回答时的系统提示。 | String | 是 | "You are a helpful assistant." | 曾用键名:systemPrompt(vvr 11.1版本) |
temperature | 控制生成文本时对每个候选词概率分布的平滑程度。 | float | 否 | 无 | 取值范围: [0, 2)。不建议取值为0,无意义。 较高的temperature值会降低概率分布的峰值,使得更多的低概率词被选择,生成结果更加多样化;而较低的temperature值则会增强概率分布的峰值,使得高概率词更容易被选择,生成结果更加确定。 |
top-p | 生成过程中核采样方法的概率阈值。 | float | 否 | 无 | 取值越大,生成的随机性越高;取值越小,生成的确定性越高。 曾用键名:topP(vvr 11.1版本) |
stop | 停用词。 | String | 否 | 无 | 在模型生成的内容即将包含指定的字符串时自动停止。 |
max-tokens | 指定模型可生成的最大token个数。 | Integer | 否 | 无 | 曾用键名:maxTokens(vvr 11.1版本) |
embeddings
Embeddings模型任务依赖如下参数:
参数 | 说明 | 数据类型 | 是否必填 | 默认值 | 备注 |
model | 调用的服务端的具体模型。 | String | 是 | 无 | 支持文本向量模型。 说明 根据所选模型、输入内容及输出结果的Token数量进行计算,将产生相应的费用。 |
dimension | 控制输出的向量维度。 | Integer | 否 | 1024 | 可选值:1024, 768, 512。暂不支持其他值,否则会提示错误。 |
查看模型
在数据查询文本编辑区域,输入以下命令。
展示注册的模型名字。
SHOW MODELS [ ( FROM | IN ) [catalog_name.]database_name ];
展示创建模型的语句。
SHOW CREATE MODEL [catalog_name.][db_name.]model_name;
展示模型的输入输出结构。
DESCRIBE MODEL [catalog_name.][db_name.]model_name;
示例
SHOW MODELS;
-- RESULT
--+------------+
--| model name |
--+------------+
--| m |
--+------------+
DESCRIBE MODEL m;
-- RESULT
-- +---------+--------+------+----------+
-- | name | type | null | is input |
-- +---------+--------+------+----------+
-- | content | STRING | TRUE | TRUE |
-- | label | BIGINT | TRUE | FALSE |
-- +---------+--------+------+----------+
修改模型
在数据查询文本编辑区域,输入以下命令。
ALTER MODEL [IF EXISTS] [catalog_name.][db_name.]model_name {
RENAME TO new_table_name
SET (key1=val1, ...)
RESET (key1, ...)
}
示例
重命名已注册的模型。
ALTER MODEL m RENAME TO m1; -- 重命名为 m1;
修改模型参数。
ALTER MODEL m SET ('endpoint' = '<Your_Endpoint>'); -- 调整 endpoint 路径;
重置模型参数,还原为默认参数值。
ALTER MODEL m RESET ('endpoint'); -- 重置 endpoint 路径;
删除模型
在数据查询文本编辑区域,输入以下命令。
DROP [TEMPORARY] MODEL [IF EXISTS] [catalog_name.][db_name.]model_name
示例
DROP MODEL m;