LVM图像处理算法示例模板-人工智能平台 PAI(PAI)-阿里云帮助中心

LVM图像处理算法提供了图像清洗、图像内容清理、图像基本信息提取和图像caption生成功能。您可以根据实际需求组合算法，过滤出合适的图像数据并生成文本描述，为图像生成模型训练提供优质数据。

使用限制

图像-文本对过滤预置模板仅支持华东1（杭州）、华东2（上海）、华北2（北京）、华南1（深圳）地域使用。

PAI为您提供示例数据可作参考：

下载图像元数据文件和图像文件。
- 图像元数据文件：image_meta.jsonl，可作为图像文本算法输入项。
- 图像文件：data.zip，可作为一般图像处理算法的输入项。
解压并上传图像文件至OSS。具体操作，请参见简单上传至OSS。
修改图像元数据文件。
将图像元数据文件中的配置oss://bucket_name.oss-cn-hangzhou.aliyuncs.com/image_algorithm_test/image_data/替换为上传图片的OSS Bucket目录。
上传图像元数据文件至步骤 2同一OSS Bucket中。具体操作，请参见简单上传至OSS。

进入Designer页面。
1. 登录PAI控制台。
2. 在顶部左上角根据实际情况选择地域。
3. 在左侧导航栏选择工作空间列表，单击指定工作空间名称，进入对应工作空间。
4. 在左侧导航栏选择模型开发与训练 > 可视化建模（Designer），进入Designer页面。
创建工作流。
1. 在预置模板页签下，选择业务领域 > 多模态大模型，单击图像-文本对过滤模板卡片上的创建。
2. 配置工作流参数（或保持默认），单击确定。
3. 在工作流列表，选择已创建的工作流，单击进入工作流。
配置工作流。
- 配置读OSS数据组件：单击读OSS数据组件，在右侧字段设置页签，配置OSS数据路径为图像数据文件所在的OSS Bucket目录。
- 配置LLMDataProcessGroup1组：单击设置按钮，配置数据输出OSS目录，后续运行工作流生成的结果文件将保存至该目录中。LVM图像预处理算法组件的配置说明，请参见图像预处理算子。
运行工作流。运行结束后，查看生成的文件：
- meta.jsonl文件：运行时会在图像数据OSS路径的上一级目录下生成图像元数据文件meta.jsonl。
- 结果文件：在输出文件的OSS路径中查看结果文件。
关于结果文件详细说明，请参见图像预处理算子中输出文件的OSS路径参数介绍。