全部产品
阿里云办公

产品架构

更新时间:2018-08-21 17:53:21

智能媒体管理服务(IMM)围绕 6 个关键点:海量数据端云拉通标准统一智能分析场景结合一键处理 设计,采用如下的分层架构。

智能媒体管理架构图

产品架构

基于架构图的描述,IMM 服务有依赖的上下文,架构包含 3 层:处理引擎、元数据管理、场景化封装。

智能媒体管理架构依赖上下文

  • 对下依赖阿里云的对象存储、文件存储等服务,通过安全的机制访问里面存储的非结构化数据(例如图片、视频),提取价值信息。
  • 对上基于场景理解,进行封装,支撑视频网盘、手机相册、社交图库、家庭监控等图片、视频应用场景,为它们产生新的价值。

处理引擎层

基于阿里云存储,提供就近构建计算框架,该框架支持批量异步处理、准实时同步处理,在一键关联云存储(例如,指定 OSS Bucket 的目录前缀、指定 OSS Bucket 的某个对象)后,实现快速的自动数据处理,通过整合业界领先的数据处理算法,目前处理引擎提供如下功能:

  • 文档格式转换。支持将包括 OFFICE 在内的 48 种文档转换为 JPGPNGPDFVECTOR 格式,从而更好的支持文档预览功能。
  • 内容识别。通过 AI 技术,识别图片中的物品标签,从而实现机器的制动打标,更好的支撑推荐应用。
  • 人脸识别。通过 AI 技术,识别图片中的人脸,检测出人脸框,判断人脸姿势、年龄、性别等属性。

元数据管理层

基于处理引擎提供的功能,通过对场景的深入理解和梳理,IMM 封装了场景的元数据设计,对外提供场景的元数据访问接口,简化场景应用的设计难度、无须关注元数据索引数据库的运维工作,目前支持如下的元数据索引:

  • 人脸聚类索引。构建元数据集合,然后调用人脸分组的接口分析图片,把得到的元数据加入到该元数据集合中,从而可以得到该集合中相似的人脸。通过该索引,可以快速的支撑网盘的人脸相册、家庭监控的陌生人检测、甚至新零售的顾客管理等场景。
  • 标签分组索引。构建元数据集合,然后调用标签分组的索引接口分析图片,把得到的元数据加入到该元数据集合中,从而可以根据标签搜索图片。通过该索引,可以快速的支撑网盘的场景相册、家庭监控的宠物跟踪、甚至暴力、恐怖、色情图片等标签的搜索。

场景封装层

通过阿里云对场景的支撑,把 处理引擎层元数据管理层 的功能进行包装,并按照资源包方式提供出来,从而简化使用,方便应用快速的接入,实现 AI 和场景的紧密结合,目前支持如下的场景实例:

  • 文档标准型。把文档相关的格式转换、预览整合,让你快速实现文档的智能管理能力。
  • 图片标准型。把内容识别(标签检测)、人脸检测的 AI 功能整合,让你快速实现图片的智能管理能力。
  • 图片专业型。把内容识别(标签检测)、人脸检测、内容搜索、人脸聚类的 AI 功能整合,让你快速实现图片的智能管理能力。