基本概念

本文将向您介绍智能媒体管理IMM产品中涉及的几个基本概念,以便于您更好地理解IMM产品。

元数据

智能媒体管理提供的元数据管理功能可以帮助用户对存储在对象存储(OSS)、相册与网盘服务(PDS)等产品中的文件的元数据进行采集、分析、查询等。

元数据管理支持的文件元数据包括:

  • 文件大小、文件格式、创建时间等文件的基础信息。

  • 文档类文件的全文和压缩包内的所有文件信息。

  • 利用智能媒体管理服务的人工智能(AI)引擎对图片、视频、音频等媒体文件进行分析得到的标签、人物、文本等丰富的元数据信息。

项目

开发者使用智能媒体管理服务的基本单元。开发者通过创建项目来使用IMM的功能,为数据集配置限额。

数据集

数据集是由元数据所组成的集合,是智能媒体管理存放元数据的容器。例如开发者开发网盘APP时,文件存储在OSS或PDS中,在IMM中创建数据集,将用户上传的文件OSS或PDS地址提交给IMM进行索引,IMM会自动解析文件的基础信息,对图片、视频、音频等媒体文件进行人工智能分析,提取标签、人物等信息。

工作流

在创建IMM项目或数据集时,可以为项目或数据集设置工作流模板(Template),模板定义了提取文件元信息时所需要执行的工作流。

IMM提供的工作流模板如下:

  • Official:DefaultEmptyId:在建立元数据索引时,所有算子都不操作,不会产生元数据信息。

  • Official:OSSBasicMeta:在建立元数据索引时,执行OSSMeta算子,采集OSS基本元数据。

  • Official:AllFunction:在建立元数据索引时,执行所有算子,采集OSS基本元数据、MIME信息、人脸信息、标签检测、图片打分、地址位置信息、视频信息、图片EXIF信息等数据。

算子

工作流执行的基本单元。IMM处理引擎将根据配置的工作流模板来决定要执行的算子操作,算子对元数据进行采集并将元数据索引到数据集中。

请求类型

  • 同步请求

    客户端发出请求后阻塞等待结果返回,通常在几百毫秒内返回。例如图片实例中的人脸检测、内容识别等。

  • 异步请求

    为了解决同步任务执行时间太长,导致客户端阻塞太久的问题,例如超过10秒客户端可能会连接断开,因此智能媒体管理引入了异步请求机制。

    客户端发出请求后,系统会快速返回ID,基于此ID,可以查询异步请求的状态。例如大文件的格式转换请求可能几十秒,甚至分钟级才能完成。

任务

单个数据处理异步请求的执行实体,调用异步请求API返回的ID,即任务ID。例如执行单个文档的异步转换,它的执行实体就是一个任务。

任务创建后,支持查询任务状态,删除任务,遍历任务请求。