服务定制

模型定制支持通过用户业务数据对文本向量化模型进行效果强化训练,同时支持结合用户提供的向量数据,定制训练向量降维模型。实际业务场景中,先通过向量化模型对文本或者Query向量化,然后结合向量降维模型降低向量维度。

背景信息

在智能搜索和RAG场景中,向量模型的效果对业务效果至关重要。但通用向量模型在垂直领域的效果常受限于训练数据覆盖度。为提升业务检索效果,可结合业务数据对通用模型进行定向微调。同时,向量模型的维度不断增大,导致大规模数据向量化存储和计算成本显著增加。为此,AI搜索开放平台提供向量降维服务,通过定制模型将高维向量转化为较低维度的向量,在不明显降低向量化效果的前提下,节省用户成本。

费用说明

按照训练实际消耗的计算资源CU数计费,每CU价格为3.87元,实际消耗的CU数取决于训练的数据量和维度。按照最小化训练10万条1024维数据,需消耗约250CU,产生费用为250*3.87=967.5元。

向量降维服务定制

  1. AI搜索开放平台选择模型服务>模型定制,然后单击创建

    如通过RAM账号进行模型创建、变更配置、查看模型详情等操作时,需要提前授予RAM账号模型服务相关的操作权限。

  2. 模型定制页面,配置以下参数信息。

    参数

    说明

    模型名称

    后续调用向量降维服务时的模型名称。

    模型类型

    训练模型的类型,选择向量降维(embedding-dim-reduction)

    模型服务

    用于训练的基础模型,如ops-embedding-dim-reduction-001。

    训练数据来源

    MaxComputeOSS

    MaxCompute数据源

    参数

    说明

    训练数据来源

    MaxCompute。

    所在区域

    MaxCompute所属地域。

    项目名

    MaxCompute中的项目名称。

    AccessKeyId

    拥有读写MaxCompute权限的阿里云账号或RAM账号的AccessKey ID。

    您可以进入AccessKey管理页面获取AccessKeyId。

    Secret

    AccessKeyId对应的Secret。

    表名

    MaxCompute中存储训练数据的表的名称。

    表分区

    表的分区信息。

    训练字段

    需要提前为读写MaxCompute表结构的RAM账号授予GetTableFields(获取MaxCompute表结构)权限,此处才能选择主键字段和String类型的向量字段,向量字段维度范围为1024~4096维。

    OSS数据源

    参数

    说明

    训练数据来源

    OSS

    所在地域

    OSS所属地域。

    OSS存储空间(Bucket)

    OSSBucket名称。

    doc数据

    OSS中用于训练的数据。

    OSS访问域名(Endpoint)

    完成以上配置后生成。

  3. 单击确定,二次弹窗选择创建并训练后模型进入预处理状态,预处理完成后开始训练。

    选择确认创建后您可以在模型定制列表,找到待训练的模型进行训练。

    模型列表中,状态为可用的模型,表示训练完成且模型可被调用,单击体验,体验向量微调模型效果

文本向量化服务定制

  1. AI搜索开放平台选择模型服务>模型定制,然后单击创建

    如通过RAM账号进行模型创建、变更配置、查看模型详情等操作时,需要提前授予RAM账号模型服务相关的操作权限。

  2. 模型定制页面,配置以下参数信息。

    参数

    说明

    模型名称

    可自定义。

    模型类型

    训练模型的类型,选择文本向量化(text-embedding)

    基础模型

    用于训练的基础模型,如ops-text-embedding-001。

    向量降维

    开启后可以同时进行向量降维训练。

    降维基础模型

    向量降维选择开启时,用以降维的模型。

    训练数据来源

    MaxComputeOSS。

    MaxCompute数据源

    参数

    说明

    训练数据来源

    MaxCompute。

    所在区域

    MaxCompute所属地域。

    项目名

    MaxCompute中的项目名称。

    AccessKeyId

    拥有读写MaxCompute权限的阿里云账号或RAM账号的AccessKey ID。

    您可以进入AccessKey管理页面获取AccessKeyId。

    Secret

    AccessKeyId对应的Secret。

    表名

    MaxCompute中存储训练数据的表的名称。

    表分区

    表的分区信息。

    训练字段

    需要提前为读写MaxCompute表结构的RAM账号授予GetTableFields(获取MaxCompute表结构)权限,此处才能选择主键字段和String类型的文本数据。

    query-doc

    请参考控制台的示例数据。

    OSS数据源

    参数

    说明

    训练数据来源

    OSS

    所在地域

    OSS所属地域。

    OSS存储空间(Bucket)

    OSSBucket名称。

    doc数据

    OSS中用于训练的数据。

    query-doc

    请参考控制台的示例数据。

    OSS访问域名(Endpoint)

    完成以上配置后系统生成。

  3. 单击确定,二次弹窗选择创建并训练后模型进入预处理状态,预处理完成后开始训练。

    选择确认创建后您可以在模型定制列表,找到待训练的模型进行训练。

    模型列表中,状态为可用的模型,表示训练完成且可被部署

服务调用

模型服务效果符合预期时,可以通过API调用服务,请参见向量降维服务API自定义部署服务API