AI_SUMMARIZE

更新时间:
复制为 MD 格式

AI_SUMMARIZE 是 MaxCompute 提供的 AI Function,通过调用模型根据输入的文本,生成一段文本的总结摘要。

命令格式

STRING AI_SUMMARIZE(
  STRING <model_name>,
  STRING <version_name>,
  STRING <input>
  [, BIGINT <max_words>]
  [, STRING <model_parameters>]
);

参数说明

  • model_name:必填。STRING 类型。待使用的模型名,请参见SQL AI Function

  • version_name:必填。STRING 类型。待使用的模型版本名。如果调用默认版本,支持直接输入DEFAULT_VERSION

  • input:必填。STRING类型。待处理的文本。

  • max_words:选填。INT类型。用于指定大模型最多输出的字数,默认值为50。若设置为0,则表示不做任何限制,但会受到模型本身和max_tokens 的限制,超过则会被截断。

  • model_parameters:选填。STRING 类型。支持指定模型调用相关参数 max_tokens、temperature、top_p,格式为

    '{"max_tokens": 500, "temperature": 0.6, "top_p": 0.95}' 。参数说明如下:

    • max_tokens:设置模型单次调用输出 token 的最大数量,对于 MaxCompute 公共模型,默认值为 4096。

    • temperature:介于 0 到 1 之间的值,用于控制模型输出的随机性强度。值越大,输出越具创意和多样性;值越低,输出越确定和保守。

    • top_p:介于 0 到 1 之间的值,用于限定模型选择的备选标签范围。值越大,备选范围越广,多样性越高;值越小,范围越窄,结果越集中。

返回值说明

返回 STRING 类型,输入文本的总结摘要。返回规则如下:

  • input 非 STRING 类型,返回报错。

  • max_words 为 NULL 时,返回报错。

使用示例

示例 1:使用默认字数限制生成摘要

调用 MaxCompute 提供的公共模型 Qwen3-4B-GGUF,以默认的 50 字限制对一段文本生成摘要。

SET odps.sql.ai.treat.as.common.model=true;
SET odps.namespace.schema=true;

SELECT AI_SUMMARIZE(
    bigdata_public_modelset.default.`Qwen3-4B-GGUF`,
    DEFAULT_VERSION,
    'MaxCompute(原ODPS)是一种快速、完全托管的多租户大数据处理平台,可处理TB至PB级数据。MaxCompute提供多种计算模型,包括SQL、MapReduce、Graph和机器学习。它采用Serverless架构,可根据负载自动弹性伸缩计算资源,无需用户管理基础设施。该平台与DataWorks(数据开发)、PAI(机器学习平台)、Quick BI(数据可视化)等阿里云服务深度集成。'
) AS summary;

-- 返回结果
+-------------------------------------------------------------------------------------+
| summary                                                                             |
+-------------------------------------------------------------------------------------+
| MaxCompute是阿里云的托管大数据平台,支持多种计算模型,集成多个数据分析工具。             |
+-------------------------------------------------------------------------------------+

示例 2:指定字数限制生成摘要

调用 MaxCompute 提供的公共模型 Qwen3-4B-GGUF,以 30 字的限制对多篇文章批量生成摘要。

-- 示例数据
CREATE TABLE articles (
    article STRING
);

INSERT INTO articles VALUES
    ('人工智能正在重塑全球经济格局。从医疗到金融,各行各业纷纷采用AI解决方案来实现流程自动化、降低成本并提升决策质量。机器学习模型能够分析海量数据,识别人工难以发现的模式和规律。然而,AI的快速普及也引发了关于就业替代、数据隐私和算法偏见的担忧。各国政府和组织正在积极制定伦理准则和监管框架,以确保AI的健康发展。'),
    ('云计算已成为现代企业的关键基础设施。通过迁移上云,企业可以减少硬件资本开支,按需弹性扩缩资源,并以较低的前期投入使用前沿技术。阿里云、AWS、Azure等主流云服务商提供了涵盖计算、存储、数据库和AI能力的丰富服务。云原生架构的兴起还推动了微服务、容器和Serverless等技术的广泛应用。');

-- 对表中文章批量生成摘要
SET odps.sql.ai.treat.as.common.model=true;
SET odps.namespace.schema=true;

SELECT
    AI_SUMMARIZE(
        bigdata_public_modelset.default.`Qwen3-4B-GGUF`,
        DEFAULT_VERSION,
        article,
        30
    ) AS summary,
    article
FROM articles;


-- 返回结果
+------------------------------------------------------+--------------------------------------------------------------------+
|summary                                               |article                                                        |
+------------------------------------------------------+--------------------------------------------------------------------+
| AI正在各行业推动自动化和数据分析,但也引发伦理和监管方面的关注。|人工智能正在重塑全球经济格局。从医疗到金融,各行各业纷纷采用AI解决方案来实现流程自动化、降低成本并提升决策质量。机器学习模型能够分析海量数据,识别人工难以发现的模式和规律。然而,AI的快速普及也引发了关于就业替代、数据隐私和算法偏见的担忧。各国政府和组织正在积极制定伦理准则和监管框架,以确保AI的健康发展。    |
| 云计算降低企业成本,提供弹性资源与前沿技术的便捷接入。        |云计算已成为现代企业的关键基础设施。通过迁移上云,企业可以减少硬件资本开支,按需弹性扩缩资源,并以较低的前期投入使用前沿技术。阿里云、AWS、Azure等主流云服务商提供了涵盖计算、存储、数据库和AI能力的丰富服务。云原生架构的兴起还推动了微服务、容器和Serverless等技术的广泛应用。              |
+-------------------------------------------------------+--------------------------------------------------------------------+