LVM图像处理算法提供了图像清洗、图像内容清理、图像基本信息的提取、图像caption生成的功能。您可以根据实际需求组合不同的算法,从而过滤出合适的图像数据并生成相应的文本描述,方便为后续的图像生成模型训练提供优质的图像数据。本文为您介绍Designer中图像-文本对过滤预置模板的使用说明。
使用限制
图像-文本对过滤预置模板仅支持华东1(杭州)、华东2(上海)、华北2(北京)、华南1(深圳)地域使用。
准备图像数据
PAI为您提供示例数据可作参考:
下载图像元数据文件和图像文件。
图像元数据文件:image_meta.jsonl,可作为图像文本算法输入项。
图像文件:data.zip,可作为一般图像处理算法的输入项。
解压并上传图像文件至OSS。具体操作,请参见简单上传至OSS。
修改图像元数据文件。
将图像元数据文件中的字段
your_oss_path
替换为上传图片的OSS Bucket目录。例如,将图片上传至OSS Bucket的image_algorithm_test/image_data目录下,则your_oss_path
需替换成image_algorithm_test/image_data
。上传图像元数据文件至步骤 2同一OSS Bucket中。具体操作,请参见简单上传至OSS。
创建并运行工作流
进入Designer页面。
登录PAI控制台。
在顶部左上角根据实际情况选择地域。
在左侧导航栏选择工作空间列表,单击指定工作空间名称,进入对应工作空间。
在左侧导航栏选择模型开发与训练 > 可视化建模(Designer),进入Designer页面。
创建工作流。
在预置模板页签下,选择业务领域 > 多模态大模型,单击图像-文本对过滤模板卡片上的创建。
配置工作流参数(或保持默认),单击确定。
在工作流列表,选择已创建的工作流,单击进入工作流。
配置工作流。
分别配置LVM图像预处理算法组件,详情请参见图像预处理算子。
运行工作流。运行结束后,查看生成的文件:
meta.jsonl文件:运行时会在图像数据OSS路径的上一级目录下生成图像元数据文件meta.jsonl。
结果文件:在输出文件的OSS路径中查看结果文件。
关于结果文件详细说明,请参见图像预处理算子中输出文件的OSS路径参数介绍。