AI_SUMMARIZE 是 MaxCompute 提供的 AI Function,通过调用模型根据输入的文本,生成一段文本的总结摘要。
命令格式
STRING AI_SUMMARIZE(
STRING <model_name>,
STRING <version_name>,
STRING <input>
[, BIGINT <max_words>]
[, STRING <model_parameters>]
);参数说明
model_name:必填。STRING 类型。待使用的模型名,请参见SQL AI Function。
version_name:必填。STRING 类型。待使用的模型版本名。如果调用默认版本,支持直接输入
DEFAULT_VERSION。input:必填。STRING类型。待处理的文本。
max_words:选填。INT类型。用于指定大模型最多输出的字数,默认值为50。若设置为0,则表示不做任何限制,但会受到模型本身和max_tokens 的限制,超过则会被截断。
model_parameters:选填。STRING 类型。支持指定模型调用相关参数 max_tokens、temperature、top_p,格式为
'{"max_tokens": 500, "temperature": 0.6, "top_p": 0.95}'。参数说明如下:max_tokens:设置模型单次调用输出 token 的最大数量,对于 MaxCompute 公共模型,默认值为 4096。
temperature:介于 0 到 1 之间的值,用于控制模型输出的随机性强度。值越大,输出越具创意和多样性;值越低,输出越确定和保守。
top_p:介于 0 到 1 之间的值,用于限定模型选择的备选标签范围。值越大,备选范围越广,多样性越高;值越小,范围越窄,结果越集中。
返回值说明
返回 STRING 类型,输入文本的总结摘要。返回规则如下:
input 非 STRING 类型,返回报错。
max_words 为 NULL 时,返回报错。
使用示例
示例 1:使用默认字数限制生成摘要
调用 MaxCompute 提供的公共模型 Qwen3-4B-GGUF,以默认的 50 字限制对一段文本生成摘要。
SET odps.sql.ai.treat.as.common.model=true;
SET odps.namespace.schema=true;
SELECT AI_SUMMARIZE(
bigdata_public_modelset.default.`Qwen3-4B-GGUF`,
DEFAULT_VERSION,
'MaxCompute(原ODPS)是一种快速、完全托管的多租户大数据处理平台,可处理TB至PB级数据。MaxCompute提供多种计算模型,包括SQL、MapReduce、Graph和机器学习。它采用Serverless架构,可根据负载自动弹性伸缩计算资源,无需用户管理基础设施。该平台与DataWorks(数据开发)、PAI(机器学习平台)、Quick BI(数据可视化)等阿里云服务深度集成。'
) AS summary;
-- 返回结果
+-------------------------------------------------------------------------------------+
| summary |
+-------------------------------------------------------------------------------------+
| MaxCompute是阿里云的托管大数据平台,支持多种计算模型,集成多个数据分析工具。 |
+-------------------------------------------------------------------------------------+示例 2:指定字数限制生成摘要
调用 MaxCompute 提供的公共模型 Qwen3-4B-GGUF,以 30 字的限制对多篇文章批量生成摘要。
-- 示例数据
CREATE TABLE articles (
article STRING
);
INSERT INTO articles VALUES
('人工智能正在重塑全球经济格局。从医疗到金融,各行各业纷纷采用AI解决方案来实现流程自动化、降低成本并提升决策质量。机器学习模型能够分析海量数据,识别人工难以发现的模式和规律。然而,AI的快速普及也引发了关于就业替代、数据隐私和算法偏见的担忧。各国政府和组织正在积极制定伦理准则和监管框架,以确保AI的健康发展。'),
('云计算已成为现代企业的关键基础设施。通过迁移上云,企业可以减少硬件资本开支,按需弹性扩缩资源,并以较低的前期投入使用前沿技术。阿里云、AWS、Azure等主流云服务商提供了涵盖计算、存储、数据库和AI能力的丰富服务。云原生架构的兴起还推动了微服务、容器和Serverless等技术的广泛应用。');
-- 对表中文章批量生成摘要
SET odps.sql.ai.treat.as.common.model=true;
SET odps.namespace.schema=true;
SELECT
AI_SUMMARIZE(
bigdata_public_modelset.default.`Qwen3-4B-GGUF`,
DEFAULT_VERSION,
article,
30
) AS summary,
article
FROM articles;
-- 返回结果
+------------------------------------------------------+--------------------------------------------------------------------+
|summary |article |
+------------------------------------------------------+--------------------------------------------------------------------+
| AI正在各行业推动自动化和数据分析,但也引发伦理和监管方面的关注。|人工智能正在重塑全球经济格局。从医疗到金融,各行各业纷纷采用AI解决方案来实现流程自动化、降低成本并提升决策质量。机器学习模型能够分析海量数据,识别人工难以发现的模式和规律。然而,AI的快速普及也引发了关于就业替代、数据隐私和算法偏见的担忧。各国政府和组织正在积极制定伦理准则和监管框架,以确保AI的健康发展。 |
| 云计算降低企业成本,提供弹性资源与前沿技术的便捷接入。 |云计算已成为现代企业的关键基础设施。通过迁移上云,企业可以减少硬件资本开支,按需弹性扩缩资源,并以较低的前期投入使用前沿技术。阿里云、AWS、Azure等主流云服务商提供了涵盖计算、存储、数据库和AI能力的丰富服务。云原生架构的兴起还推动了微服务、容器和Serverless等技术的广泛应用。 |
+-------------------------------------------------------+--------------------------------------------------------------------+