功能特性

智能媒体管理(IMM)是阿里云提供的场景化封装数据智能分析管理服务。本文列举了IMM的常见应用场景以及对应的功能特性,请结合您的业务需求选用合适的场景。

新版IMM

新版IMM支持以下功能:

功能分类

功能子分类

功能应用

功能说明

数据处理

媒体处理

媒体转码

针对海量媒资提供了高效、智能、稳定的媒体处理服务。并结合对象存储OSS、内容分发网络CDN,提供了音视频的存储、处理、分发、播放的全流程服务,满足多终端流畅高清播放。

获取媒体元信息

获取媒体文件元信息,如分辨率、码率、帧率、编码标准等。用于媒体检索、播放展示、智能管理等,提升媒体的运营与管理效率。

视频标签检测

对视频智能分析,输出基于视频的标签。

文档处理

WebOffice

支持多人实时在线预览或编辑同一个文档,文档多人协作,效率更高。

文档格式转换

将输入的文档类型转换为指定的输出文档类型,并保存在请求中指定的OSS路径中,便于上层应用更好地使用文档内容。

文件处理

压缩解压

对OSS中的文件进行在线压缩和解压缩。

点云压缩

对点云数据的时空信息进行分析处理,大幅降低数据量与储存成本,实现高质量且实时的点云数据编码解码方案。

图片智能

图片标签检测

识别图片中的场景、物体和事件等内容,实现图片的自动打标。

图片裁剪建议

根据指定比例返回图片的裁剪建议框和裁剪方案的美学分数。

图片质量评分

从多个方面评估输入图片在视觉上的质量,并给出综合的评分。

二维码识别

识别图片(包括照片、截图等多种图片)中多个有效二维码的位置及内容,输出图像中二维码的位置框和其包含的文本信息。

人脸检测

基于图片AI技术,可以检测图片中的人脸以及人脸信息。

图片模糊处理

对一张图片的特定区域进行马赛克、高斯模糊或纯色块填充操作,用于隐私保护。

图片转换为PDF文件

将多张图片转换为单个PDF文件,为用户提供方便的文件查找服务。

图片拼接

将多张图片以宽对齐或高对齐的方式拼接成一张大图。

人脸相似度对比

比较两张图片实现两个人脸的相似度比较,适用于身份核查及验证等场景。

数据管理与索引

数据集

创建数据集

数据集是由元数据所组成的集合,是元数据管理存放元数据的容器。通常将有关联的媒体文件存放到同一个数据集中,便于查询。

建立元数据索引

在创建数据集后,您可以为存储在对象存储(OSS)、相册与网盘服务(PDS)等产品中的文件建立元数据索引。

查询文件信息

建立元数据索引后,您可以调用相关接口查询单个或多个指定文件的元数据信息,也可以通过字段搜索、关键字模糊搜索、自然语言关键字搜索的方式进行查询。本文介绍如何查询文件信息。

人脸聚类

将数据集中存在相似人脸的多张图片进行分组,适用于网盘的人脸相册、家庭监控的陌生人检测、甚至新零售的顾客管理等场景。

时空聚类

基于照片的拍摄时间、地理位置等元数据信息,将满足分组条件的照片分到同一组。

故事

将数据集中的照片使用AI算法按照时间或人物来生成一组照片故事集,并选取一张较好的照片作为封面。

任务与工作流

工作流模板

工作流模板与算子

在创建IMM项目或数据集时,可以为项目或数据集设置工作流模板(Template),模板定义了部分接口所需要执行的工作流。在为存储在对象存储(OSS)、相册与网盘服务(PDS)等产品中的文件建立元数据索引时,引擎将根据配置的工作流模板来决定要执行的算子操作,算子对元数据进行采集并将元数据索引到元数据存储引擎中。

内容安全

内容安全

文本违规检测

检测文本是否包含违规信息,通常用于内容安全审核。

图片违规检测

检测图片是否违规,帮助用户提高审核效率,降低安全风险

视频违规检测

检测视频是否违规,用于视频智能鉴黄、视频暴恐、视频不良场景、视频Logo识别、视频图文违规等基本场景。

旧版IMM

旧版IMM支持以下功能:

功能分类

功能应用

功能说明

文档管理

文档格式转换

将PPTX、PPT、XLS、DOC、PDF、HTML、HTM等48种文档格式转换为JPG、PNG、PDF、TXT和VECTOR向量格式。

文档预览

取文档的预览地址和AccessToken后,无需指定iframe元素,JS文件会自动在自定块元素下生成iframe,并通过JS文件设置 AccessToken即可快捷的实现文档预览。

文档在线协作

文档在线协作支持多人实时在线预览或编辑同一个文档,和文档预览的接入方式以及前端使用的JS-SDK均相同。后端接口获取AccessToken和编辑URL的方式不同。

图片管理

内容识别

识别图片中的场景、物体和事件等内容,实现图片的自动打标。

二维码识别

检测图中的二维码以及二维码中存储的内容。

图片裁剪建议

根据指定比例返回图片的裁剪建议框和裁剪方案的美学分数。

图片质量评分

检测图片的综合质量分数

人脸检测

检测图片中的人脸以及人脸信息。

人脸搜索

搜索与指定图片最相似的前N张图片。

人脸比对

比较媒体集中的两个人脸ID或者两张图片的OSS URI实现两个人脸的相似度比较。

人脸聚类

将媒体集中存在相似人脸的多张图片进行分组。

人体检测

检测图片中的人体区域和置信度。

阿里云首页 智能媒体管理 相关技术圈