配置融合向量

更新时间:
复制为 MD 格式

在电商、多模态搜索等场景中,单一字段(如商品标题或图片)的向量化往往无法同时满足语义意图和视觉风格的双重匹配需求。融合向量功能支持选择多个字段(如文本字段和图片字段),通过多模态模型将这些字段的内容编码为单一向量值,从而实现"以文搜图"、"以图搜文"等跨模态检索能力。

使用须知

融合向量功能仅支持引擎版本 1.5.8 及以上。若当前版本较低,请联系技术支持申请升级引擎。

支持的模型

融合向量功能通过调用多模态模型服务对字段内容进行向量化编码。不同模型对输入字段的数量和类型有不同的限制:

模型来源

模型名称

输出维度

输入限制

百炼平台

qwen3-vl-embedding

支持维度:

  • 256

  • 512

  • 768

  • 1024

  • 1536

  • 2048

  • 2560

单个请求最多支持20个内容输入,其中图片内容不超过5

AI搜索开放平台

ops-gme-qwen2-vl-2b-instruct

1536

单个请求支持1个图片与1个文本作为输入内容

ops-mm-embedding-v1-2b

1536

单个请求支持1个图片与1个文本作为输入内容

ops-mm-embedding-v1-7b

3584

单个请求支持1个图片与1个文本作为输入内容

ops-mm-embedding-ecom-001

128

单个请求支持1个图片与1个文本作为输入内容

配置融合向量

融合向量在添加表字段配置步骤中进行配置。

  1. 进入字段配置页面,在字段列表中添加参与融合向量的字段。融合向量至少需要2个参与字段。

    如果参与字段涉及图片内容,需先为该字段配置图片数据源。在字段列表的数据源列中,选择对应的数据类型(文本或图片),并根据数据存储方式配置数据来源。图片类型支持以下数据来源:URL地址、Base64编码、OSS对象存储和DLF-Object Table。

  2. 单击页面底部的数据处理按钮,在数据处理模板下拉框中选择融合向量

  3. 参与字段区域,选择需要参与融合向量编码的字段(至少2个)。

  4. 服务列表中配置模型服务:

    • 模型:从下拉列表中选择多模态模型。默认模型为百炼平台qwen3-vl-embedding。

    • 字段名:系统自动生成融合向量的输出字段名(如 _fused_vector),无需手动修改。

  5. API Key 处填写对应模型服务的API Key。

  6. 阅读并勾选风险提示和计费提示。

  7. 点击确定,完成融合向量配置。

配置完成后,系统将自动生成的融合向量字段回填至字段列表中。回填的字段具有以下特征:

  • 数据源列显示参与融合向量编码的源字段名称。

  • 字段类型列带有融合标识,表示该字段经过融合向量处理。

  • 操作列支持编辑操作,将重新打开数据处理配置面板,并回显已配置的信息。

其他数据处理模板

除融合向量外,数据处理功能还支持以下模板:

模板名称

说明

稠密向量化

将文本字段转换为稠密向量

稠密+稀疏向量化

同时生成稠密向量和稀疏向量,用于混合检索

图片向量化

将图片字段转换为向量

图片内容解析

解析图片中的文字和内容信息

图片内容解析+图片向量化

先解析图片内容,再进行向量化

视频处理

处理视频字段数据

字段数据源配置

在字段配置页面中,数据源作为独立列显示。

  • 场景模板默认字段:数据类型不可修改,保持模板预置的配置。

  • 用户新增字段:可选择数据类型为文本或图片。

    图片类型支持的数据来源:URL地址、Base64编码、OSS对象存储、DLF-Object Table。