在电商、多模态搜索等场景中,单一字段(如商品标题或图片)的向量化往往无法同时满足语义意图和视觉风格的双重匹配需求。融合向量功能支持选择多个字段(如文本字段和图片字段),通过多模态模型将这些字段的内容编码为单一向量值,从而实现"以文搜图"、"以图搜文"等跨模态检索能力。
使用须知
融合向量功能仅支持引擎版本 1.5.8 及以上。若当前版本较低,请联系技术支持申请升级引擎。
支持的模型
融合向量功能通过调用多模态模型服务对字段内容进行向量化编码。不同模型对输入字段的数量和类型有不同的限制:
模型来源 | 模型名称 | 输出维度 | 输入限制 |
百炼平台 | qwen3-vl-embedding | 支持维度:
| 单个请求最多支持20个内容输入,其中图片内容不超过5个 |
AI搜索开放平台 | ops-gme-qwen2-vl-2b-instruct | 1536维 | 单个请求支持1个图片与1个文本作为输入内容 |
ops-mm-embedding-v1-2b | 1536维 | 单个请求支持1个图片与1个文本作为输入内容 | |
ops-mm-embedding-v1-7b | 3584维 | 单个请求支持1个图片与1个文本作为输入内容 | |
ops-mm-embedding-ecom-001 | 128维 | 单个请求支持1个图片与1个文本作为输入内容 |
配置融合向量
融合向量在添加表字段配置步骤中进行配置。
进入字段配置页面,在字段列表中添加参与融合向量的字段。融合向量至少需要2个参与字段。
如果参与字段涉及图片内容,需先为该字段配置图片数据源。在字段列表的数据源列中,选择对应的数据类型(文本或图片),并根据数据存储方式配置数据来源。图片类型支持以下数据来源:URL地址、Base64编码、OSS对象存储和DLF-Object Table。
单击页面底部的数据处理按钮,在数据处理模板下拉框中选择融合向量。
在参与字段区域,选择需要参与融合向量编码的字段(至少2个)。
在服务列表中配置模型服务:
模型:从下拉列表中选择多模态模型。默认模型为百炼平台qwen3-vl-embedding。
字段名:系统自动生成融合向量的输出字段名(如
_fused_vector),无需手动修改。
在 API Key 处填写对应模型服务的API Key。
阅读并勾选风险提示和计费提示。
点击确定,完成融合向量配置。
配置完成后,系统将自动生成的融合向量字段回填至字段列表中。回填的字段具有以下特征:
数据源列显示参与融合向量编码的源字段名称。
字段类型列带有融合标识,表示该字段经过融合向量处理。
操作列支持编辑操作,将重新打开数据处理配置面板,并回显已配置的信息。
其他数据处理模板
除融合向量外,数据处理功能还支持以下模板:
模板名称 | 说明 |
稠密向量化 | 将文本字段转换为稠密向量 |
稠密+稀疏向量化 | 同时生成稠密向量和稀疏向量,用于混合检索 |
图片向量化 | 将图片字段转换为向量 |
图片内容解析 | 解析图片中的文字和内容信息 |
图片内容解析+图片向量化 | 先解析图片内容,再进行向量化 |
视频处理 | 处理视频字段数据 |
字段数据源配置
在字段配置页面中,数据源作为独立列显示。
场景模板默认字段:数据类型不可修改,保持模板预置的配置。
用户新增字段:可选择数据类型为文本或图片。
图片类型支持的数据来源:URL地址、Base64编码、OSS对象存储、DLF-Object Table。