功能特性

数据管理

数据处理包括创建和管理项目、操作数据集、设置自动触发器、执行批量任务以及查询任务状态等功能,满足从文件元数据的提取分析到任务创建和管理的一系列需求。

功能集

功能

功能描述

参考文档

基础操作

项目操作

开通 IMM 后,用户需要创建项目(Project)来承载相应的数据处理操作。项目是划分众多数据处理能力的逻辑单元,用户可以根据自身业务需求,创建不同的项目来承载不同的数据处理操作。

数据集操作

数据集是由元数据所组成的集合,是元数据管理存放元数据的容器。通常将有关联的媒体文件存放到同一个数据集中,便于查询。创建数据集后,您可以为存储在对象存储(OSS)、相册与网盘服务(PDS)等产品中的文件建立元数据索引。建立元数据索引时智能媒体管理服务将采集文件元数据并将元数据索引到元数据存储引擎中,为您提供强大的文件查询、统计和管理能力。

任务管理

触发器

使用触发器可以对存储空间(Bucket)中的增量文件进行批量处理。例如将Bucket某个目录中新增的后缀为.docx的文件转换成.pdf格式、将新增的.mov格式的文件转码为.mp4等。和批处理的不同的是,触发器只会对创建触发器之后OSS内新增的文件进行处理,对存量文件则不会处理。

触发器 API

批量操作

使用批处理对存储空间(Bucket)中存量文件进行批量处理。例如将Bucket某个目录中后缀为.docx的文件转换成PDF格式、将所有MOV格式的文件转码为MP4等。

批量操作 API

查询任务信息

可以对异步处理任务的进度进行查询,也可以列举查看当前的全部任务。

图片数据处理

图片数据处理功能支持图片的自动识别、标签检测,格式转换,图片处理以及人脸识别技术,提供一站式的图片管理和应用需求。

功能集

功能

功能描述

参考文档

图片检测识别

图片标签检测

图片标签检测可以识别图片中的场景、物体和事件等内容,实现图片的自动打标。目前支持的标签种类包含三十多个分类、数千个标签。

图片人脸检测

人脸检测指的是计算机视觉技术中用于识别和定位图片或视频中人脸的功能。这种技术可以用于多种应用,比如身份验证、监控系统、智能相册以及客户行为分析等。

图片人体检测

检测图片中所有的人体以及人体位置框和置信度。这项技术可以应用于安全监控、人流统计等多个领域。

图片车辆信息检测

车辆信息检测功能可以检测图片中的车辆信息,该技术广泛应用于交通监控、智能停车系统、自动驾驶辅助、城市流量管理、电子收费系统以及安全与救援服务中。

人脸相似度对比

人脸相似度对比功能用于身份验证、身份核实、人脸识别等场景中,通过将采集的人脸图片与系统中存储的人物图片进行比较,返回相似度评分,以确认是否是同一人,该功能可以提高身份识别的准确性和便捷性。

二维码识别

可以识别图片(包括照片、截图等多种图片)中多个有效二维码或者条形码的位置及内容,输出图像中二维码或者条形码的位置框和其包含的文本信息。

图片编辑与分析

图片模糊处理

图片模糊处理可以对一张图片的特定区域进行马赛克、高斯模糊或纯色块填充操作,用于隐私保护。

图片转 PDF

图片转换为PDF文件可以将多张图片转换为单个PDF文件,为用户提供方便的文件查找服务。

图片拼接

图片拼接采用图像拼接技术,即将普通相机拍摄的两幅或多幅来自不同视点、视角和时间拍摄的具有一定空间重叠的图像拼接起来,形成一幅宽视角的高质量图像。

图片裁剪建议

图片裁剪建议功能可以根据指定比例返回图片的裁剪建议框和裁剪方案的美学分数。如果指定了多个裁剪比例,该接口会按照不同的裁剪比例分别给出图片的裁剪建议。

图片质量评分

图片质量评分功能可以从清晰度、噪声和失真、色彩饱和度、曝光度等多个方面评估输入图片在视觉上的质量,并给出综合的评分。通常用于文章封面、视频封面、低质量图片过滤等场景。

图片盲水印

为图片添加图片或文字类型的盲水印。盲水印添加后,用户不能直接看到图片中的水印信息,如果需要恢复图片中的水印信息,请使用解析图片盲水印功能,通常用于图片版权追溯等场景。

图片盲水印介绍

媒体数据处理

媒体数据处理提供全面的服务,包括视频标签检测、视频转码、获取媒体文件元信息等功能,助力用户高效管理和深度挖掘媒体资产。

功能集

功能

功能描述

参考文档

媒体识别检测

视频标签检测

使用视频标签检测,可以对视频智能分析,输出基于视频的标签。标签结果丰富全面,同时具有高准确率、高有效性、高价值等特点。通过获取视频的标签进行分类,检索,可以更精准高效的管理视频。

逆地理编码

可以检测媒体信息中包含的地理信息。

逆地理编码

媒体编辑处理

媒体转码

媒体转码是为多媒体数据提供的媒体处理服务。它以经济、易用、弹性和高可扩展的音视频转换方法,帮助您将存储于OSS的音视频转码成适合在PC、TV以及移动终端上播放的格式。

获取媒体元信息

获取媒体文件元信息,如分辨率、码率、帧率、编码标准等。用于媒体检索、播放展示、智能管理等,提升媒体的运营与管理效率。

边转边播

不同于媒体转码需要在视频上传完成后等待整个视频转码完成才能播放,边转边播作为实时转码功能,可以实现原视频文件上传完成后立即开始播放,并在播放时仅对需要播放的视频片段进行转码。

边转边播

文档数据处理

文档数据处理功能使用户能够自动化地识别、查看、转换和检索文档内容,提升文档管理效率并简化文档处理流程。

功能集

功能

功能描述

参考文档

文档在线服务

文档在线编辑

对 OSS 或者 PDS 中的文档进行在线编辑。

文档在线预览

对 OSS 或者 PDS 中的文档进行在线预览。

文档格式转换

对文档的格式进行转换,如从 .doc 转为 .pdf。

文档内容处理

文档正文提取

文档内容提取服务可以从多种格式的文档中自动提取文字,将目标文档内容转换为纯文本格式,支持多种语言和文档类型。

文件数据处理

文件数据处理功能支持高效的文件压缩、解压以及点云数据的专业压缩技术,全方位满足文件存储与传输的性能优化需求。

功能集

功能

功能描述

参考文档

文件基础处理

文件压缩

云上资源的压缩功能可以帮助用户高效、便捷地进行云上文件管理,可以根据需要使用该功能对OSS中的文件进行在线压缩,将您的多个文件打包为 zip 等压缩包。

文件解压

创建解压缩任务可以将您压缩包内的指定文件解压缩到特定位置,也可以将压缩包完整解压。目前支持的压缩格式包括Zip、RAR7z。

特殊场景处理

点云压缩

点云是海量点的集合,存储点云数据不仅会消耗大量内存,而且也会对传输带宽造成很大的挑战。IMM 提供的点云压缩功能可以对点云数据的时空信息进行分析处理,大幅降低数据量与储存成本,实现高质量且实时的点云数据编码解码方案。

智能数据处理

智能数据处理集成了语义检索、人脸聚类与搜索、时空聚类、图片聚类及故事生成等先进技术,实现内容的深度理解和智能组织,为用户提供多维度的数据洞察和内容创造工具。

功能集

功能

功能描述

参考文档

检索式处理

语义检索

语义检索采用向量检索的方式,可以根据文件内容进行检索,例如“俯瞰森林”、“雪中城市”、“去年夏天的草原”等文件内容。您可以利用 IMM 语义检索能力对您对象存储 OSS 中的文件进行检索,也可以对网盘与相册服务 PDS 中的文件进行检索。

人脸聚类

使用人脸聚类功能,您可以将数据集中存在相似人脸的多张图片进行分组,适用于网盘的人脸相册、家庭监控的陌生人检测、甚至新零售的顾客管理等场景。人脸聚类后,您可以根据人脸分组查询对应人员的所有图片信息。

人脸搜索

创建媒体集并将图片索引到媒体集后,您可以使用人脸搜索功能从媒体集中搜索与指定图片或人脸 ID 最相似的前 N 张图片,可用于业务的用户识别等场景。

时空聚类

基于照片的拍摄时间、地理位置等元数据信息,将满足分组条件的照片分到同一组。

图片聚类

图片聚类基于照片的相似度将满足分组条件的照片分到同一组,您可以使用该功能筛选相册中连拍的照片,对其进行分组操作。

生成式处理

故事生成

故事功能可以将数据集中的照片使用AI算法按照时间或人物来生成一组照片故事集,并选取一张较好的照片作为封面。使用故事功能,您可以轻松实现故事相册功能,感受生活中的美好时刻。

内容安全审核

内容安全审核功能利用人工智能技术对上传的媒体文件进行实时检测,以识别和过滤不合规内容,确保平台内容的合法性和安全性。

功能集

功能

功能描述

参考文档

违规检测

文本违规检测

文本违规检测用于检测文本是否违规,帮助用户提高审核效率,降低安全风险。

文本违规检测介绍

图片违规检测

图片违规检测用于检测图片是否违规,帮助用户提高审核效率,降低安全风险。

图片违规检测介绍

视频违规检测

视频违规检测用于检测视频是否违规,帮助用户提高审核效率,降低安全风险。

视频违规检测介绍