使用DDL注册和管理AI模型-实时计算 Flink版-阿里云

本文为您介绍注册、查询、修改、删除AI模型的DDL数据定义语句。

使用须知

支持阿里云百炼、人工智能平台PAI以及其他OpenAI兼容接口的大模型服务。
人工智能平台PAI部署的大模型服务需与实时计算Flink版服务处于同一地域。
仅实时计算引擎VVR 11.1及以上版本支持。

CREATE MODEL

注册模型

在数据查询文本编辑区域，输入以下命令。

CREATE [TEMPORARY] MODEL [catalog_name.][db_name.]model_name
INPUT ( { <physical_column_definition> [, ...n] )
OUTPUT ( { <physical_column_definition> [, ...n] )
WITH (key1=val1, key2=val2, ...)

<physical_column_definition>:
  column_name column_type [COMMENT column_comment]

子句	描述	关键参数	Schema限制	示例
INPUT	定义模型输入数据的字段、类型以及字段的顺序。	`column_name`（字段名） `column_type`（类型） `COMMENT`（注释）	有且仅有一个STRING类型的字段。	INPUT (`input_text` STRING COMMENT '用户评论')
OUTPUT	定义模型输出数据的字段、类型以及字段顺序。	`column_name`（字段名） `column_type`（类型） `COMMENT`（注释）	不同模型任务类型限制如下： chat/completions：有且仅有一个STRING类型的字段。 embeddings：有且仅有一个ARRAY<FLOAT>类型的字段。	OUTPUT (`sentiment_label` STRING COMMENT '情感标签')
WITH	请参见WITH参数。	`provider`（服务名） `endpoint`（接入地址） `apiKey`（密钥） `model`（模型标识）	无。	`WITH ('provider'='bailian', 'endpoint'='${ENDPOINT}', 'model'='qwen-turbo', 'apiKey'='${KEY}')`

示例

阿里云百炼

CREATE MODEL model_bailian
INPUT (`input` STRING)
OUTPUT (`content` STRING)
WITH (
  'provider'='bailian',
  'endpoint'='<Endpoint>',
  'api-key'='<bailian-key>',
  'model'='qwen3-235b-a22b'
);

百炼平台模型服务端口格式为：<base-url>/compatible-mode/v1/<task>。例如https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions。

base-url：
公网：https://dashscope.aliyuncs.com。使用公网需要Flink开通公网访问，详情请参见网络连接选型。
私网：通过终端节点私网访问阿里云百炼平台。暂时仅支持部署在华北2（北京）地域的实时计算服务。
task：模型任务类型。支持以下取值。
- chat/completions
- embeddings

人工智能平台PAI

CREATE MODEL model_pai
INPUT (`input` STRING)
OUTPUT (`embedding` ARRAY<FLOAT>) 
WITH (
  'provider'='bailian',
  'endpoint'='<VPC调用地址>',
  'api-key'='<Token>',
  'model'='qwen3-235b-a22b'
);

如何获取endpoint和api-key？如果您还没有相关服务，详情请参见一键部署DeepSeek-V3、DeepSeek-R1模型。

登录人工智能平台PAI控制台。
在左侧导航栏选择Model Gallery > 任务管理 > 部署任务，单击对应服务名称。
单击查看调用信息。
重要
- VPC调用地址为http，需修改为https。地址后缀需要添加/v1/<task>。task：模型任务类型。支持以下取值：
  - chat/completions
  - embeddings
  例如https://************.vpc.cn-hangzhou.pai-eas.aliyuncs.com/api/predict/quickstart_deploy_20250722_7b22/v1/chat/completions。
- Token为参数api-key的值。

WITH参数

通用

参数	说明	数据类型	是否必填	默认值	备注
provider	模型服务类型。	String	是	无	固定值为`bailian`。说明支持PAI平台或其他兼容OpenAI API模型服务，固定值不变。
endpoint	模型服务端口，或其他兼容OpenAI API的Embeddings和Chat/Completions模型服务端口。	String	是	无	百炼或PAI平台端口详见示例。其他兼容OpenAI API的Embeddings和Chat/Completions模型服务，可根据相应的API文档填写端口值。
api-key	用来访问百炼平台接口的密钥。	String	是	无	详情请参见获取API Key。曾用键名：apiKey（vvr 11.1版本）
max-context-size	单个请求的上下文的最大容量	Integer	否	无	vvr 11.2及以上版本支持。如果超过了最大容量，会触发context-overflow-action中定义的行为。
context-overflow-action	单个请求的上下文超过最大容量时的处理行为	String	否	`truncated-tail`	vvr 11.2及以上版本支持。可选值如下： `truncated-tail`: 自动从尾部裁剪超出容量的token，保留最近 `max-context-size` 个token。不记录日志。 `truncated-tail-log`: 自动从尾部裁剪超出容量的token，保留最近 `max-context-size` 个token。记录截断日志。 `truncated-head`: 从头部裁剪最早的token，保留最新 `max-context-size` 个token。 `truncated-head-log`: 从头部裁剪最早的token，保留最新 `max-context-size` 个token。记录截断日志。 `skipped`: 直接丢弃该条数据。不记录日志。 `skipped-log`: 直接丢弃该条数据并记录日志。

chat/completions

Chat/Completions模型任务依赖如下参数：

参数	说明	数据类型	是否必填	默认值	备注
model	调用的服务端的具体模型。	String	是	无	支持文本生成类别的模型。说明根据所选模型、输入内容及输出结果的Token数量进行计算，将产生相应的费用。
system-prompt	请求回答时的系统提示。	String	是	"You are a helpful assistant."	曾用键名：systemPrompt（vvr 11.1版本）
temperature	控制生成文本时对每个候选词概率分布的平滑程度。	float	否	无	取值范围： [0, 2)。不建议取值为0，无意义。较高的temperature值会降低概率分布的峰值，使得更多的低概率词被选择，生成结果更加多样化；而较低的temperature值则会增强概率分布的峰值，使得高概率词更容易被选择，生成结果更加确定。
top-p	生成过程中核采样方法的概率阈值。	float	否	无	取值越大，生成的随机性越高；取值越小，生成的确定性越高。曾用键名：topP（vvr 11.1版本）
stop	停用词。	String	否	无	在模型生成的内容即将包含指定的字符串时自动停止。
max-tokens	指定模型可生成的最大token个数。	Integer	否	无	曾用键名：maxTokens（vvr 11.1版本）

embeddings

Embeddings模型任务依赖如下参数：

参数	说明	数据类型	是否必填	默认值	备注
model	调用的服务端的具体模型。	String	是	无	支持文本向量模型。说明根据所选模型、输入内容及输出结果的Token数量进行计算，将产生相应的费用。
dimension	控制输出的向量维度。	Integer	否	1024	可选值：1024, 768, 512。暂不支持其他值，否则会提示错误。

查看模型

在数据查询文本编辑区域，输入以下命令。

展示注册的模型名字。

SHOW MODELS [ ( FROM | IN ) [catalog_name.]database_name ];

展示创建模型的语句。

SHOW CREATE MODEL [catalog_name.][db_name.]model_name;

展示模型的输入输出结构。

DESCRIBE MODEL [catalog_name.][db_name.]model_name;

示例

SHOW MODELS;

-- RESULT
--+------------+
--| model name |
--+------------+
--|          m |
--+------------+

DESCRIBE MODEL m;

-- RESULT
-- +---------+--------+------+----------+
-- |    name |   type | null | is input |
-- +---------+--------+------+----------+
-- | content | STRING | TRUE |     TRUE |
-- |   label | BIGINT | TRUE |    FALSE |
-- +---------+--------+------+----------+

修改模型

在数据查询文本编辑区域，输入以下命令。

ALTER MODEL [IF EXISTS] [catalog_name.][db_name.]model_name {
  RENAME TO new_table_name
  SET (key1=val1, ...)
  RESET (key1, ...)
}

示例

重命名已注册的模型。

ALTER MODEL m RENAME TO m1; -- 重命名为 m1;

修改模型参数。

ALTER MODEL m SET ('endpoint' = '<Your_Endpoint>'); -- 调整 endpoint 路径;

重置模型参数，还原为默认参数值。

ALTER MODEL m RESET ('endpoint'); -- 重置 endpoint 路径;

删除模型

在数据查询文本编辑区域，输入以下命令。

DROP [TEMPORARY] MODEL [IF EXISTS] [catalog_name.][db_name.]model_name

示例

DROP MODEL m;