功能特性_智能媒体管理(IMM)-阿里云帮助中心

数据管理

数据处理包括创建和管理项目、操作数据集、设置自动触发器、执行批量任务以及查询任务状态等功能，满足从文件元数据的提取分析到任务创建和管理的一系列需求。

功能集	功能	功能描述	参考文档
基础操作	项目操作	开通 IMM 后，用户需要创建项目（Project）来承载相应的数据处理操作。项目是划分众多数据处理能力的逻辑单元，用户可以根据自身业务需求，创建不同的项目来承载不同的数据处理操作。	创建项目项目操作 API
基础操作	数据集操作	数据集是由元数据所组成的集合，是元数据管理存放元数据的容器。通常将有关联的媒体文件存放到同一个数据集中，便于查询。创建数据集后，您可以为存储在对象存储（OSS）、相册与网盘服务（PDS）等产品中的文件建立元数据索引。建立元数据索引时智能媒体管理服务将采集文件元数据并将元数据索引到元数据存储引擎中，为您提供强大的文件查询、统计和管理能力。	数据集介绍及操作数据集管控相关 API 数据集索引相关 API 数据集绑定相关 API 数据集查询相关 API
任务管理	触发器	使用触发器可以对存储空间（Bucket）中的增量文件进行批量处理。例如将Bucket某个目录中新增的后缀为.docx的文件转换成.pdf格式、将新增的.mov格式的文件转码为.mp4等。和批处理的不同的是，触发器只会对创建触发器之后OSS内新增的文件进行处理，对存量文件则不会处理。	触发器 API
	批量操作	使用批处理对存储空间（Bucket）中存量文件进行批量处理。例如将Bucket某个目录中后缀为.docx的文件转换成PDF格式、将所有MOV格式的文件转码为MP4等。	批量操作 API
	查询任务信息	可以对异步处理任务的进度进行查询，也可以列举查看当前的全部任务。	获取任务信息查询任务列表

图片数据处理

图片数据处理功能支持图片的自动识别、标签检测，格式转换，图片处理以及人脸识别技术，提供一站式的图片管理和应用需求。

功能集	功能	功能描述	参考文档
图片检测识别	图片标签检测	图片标签检测可以识别图片中的场景、物体和事件等内容，实现图片的自动打标。目前支持的标签种类包含三十多个分类、数千个标签。	图片标签检测介绍图片标签检测 API
	图片人脸检测	人脸检测指的是计算机视觉技术中用于识别和定位图片或视频中人脸的功能。这种技术可以用于多种应用，比如身份验证、监控系统、智能相册以及客户行为分析等。	图片人脸检测介绍图片人脸检测 API
	图片人体检测	检测图片中所有的人体以及人体位置框和置信度。这项技术可以应用于安全监控、人流统计等多个领域。	图片人体检测介绍图片人体检测 API
	图片车辆信息检测	车辆信息检测功能可以检测图片中的车辆信息，该技术广泛应用于交通监控、智能停车系统、自动驾驶辅助、城市流量管理、电子收费系统以及安全与救援服务中。	图片车辆信息检测介绍图片车辆信息检测 API
	人脸相似度对比	人脸相似度对比功能用于身份验证、身份核实、人脸识别等场景中，通过将采集的人脸图片与系统中存储的人物图片进行比较，返回相似度评分，以确认是否是同一人，该功能可以提高身份识别的准确性和便捷性。	人脸相似度对比介绍人脸相似度对比 API
	二维码识别	可以识别图片（包括照片、截图等多种图片）中多个有效二维码或者条形码的位置及内容，输出图像中二维码或者条形码的位置框和其包含的文本信息。	二维码识别介绍二维码识别 API
图片编辑与分析	图片模糊处理	图片模糊处理可以对一张图片的特定区域进行马赛克、高斯模糊或纯色块填充操作，用于隐私保护。	图片模糊处理介绍图片模糊处理 API
	图片转 PDF	图片转换为PDF文件可以将多张图片转换为单个PDF文件，为用户提供方便的文件查找服务。	图片转 PDF 介绍图片转 PDF API
	图片拼接	图片拼接采用图像拼接技术，即将普通相机拍摄的两幅或多幅来自不同视点、视角和时间拍摄的具有一定空间重叠的图像拼接起来，形成一幅宽视角的高质量图像。	图片拼接介绍图片拼接 API
	图片裁剪建议	图片裁剪建议功能可以根据指定比例返回图片的裁剪建议框和裁剪方案的美学分数。如果指定了多个裁剪比例，该接口会按照不同的裁剪比例分别给出图片的裁剪建议。	图片裁剪建议介绍图片裁剪建议 API
	图片质量评分	图片质量评分功能可以从清晰度、噪声和失真、色彩饱和度、曝光度等多个方面评估输入图片在视觉上的质量，并给出综合的评分。通常用于文章封面、视频封面、低质量图片过滤等场景。	图片质量评分介绍图片质量评分 API
	图片盲水印	为图片添加图片或文字类型的盲水印。盲水印添加后，用户不能直接看到图片中的水印信息，如果需要恢复图片中的水印信息，请使用解析图片盲水印功能，通常用于图片版权追溯等场景。	图片盲水印介绍

媒体数据处理

媒体数据处理提供全面的服务，包括视频标签检测、视频转码、获取媒体文件元信息等功能，助力用户高效管理和深度挖掘媒体资产。

功能集	功能	功能描述	参考文档
媒体识别检测	视频标签检测	使用视频标签检测，可以对视频智能分析，输出基于视频的标签。标签结果丰富全面，同时具有高准确率、高有效性、高价值等特点。通过获取视频的标签进行分类，检索，可以更精准高效的管理视频。	视频标签检测介绍视频标签检测 API
媒体识别检测	逆地理编码	可以检测媒体信息中包含的地理信息。	逆地理编码
媒体编辑处理	媒体转码	媒体转码是为多媒体数据提供的媒体处理服务。它以经济、易用、弹性和高可扩展的音视频转换方法，帮助您将存储于OSS的音视频转码成适合在PC、TV以及移动终端上播放的格式。	媒体转码介绍媒体转码 API
	获取媒体元信息	获取媒体文件元信息，如分辨率、码率、帧率、编码标准等。用于媒体检索、播放展示、智能管理等，提升媒体的运营与管理效率。	获取媒体元信息介绍获取媒体元信息 API
	边转边播	不同于媒体转码需要在视频上传完成后等待整个视频转码完成才能播放，边转边播作为实时转码功能，可以实现原视频文件上传完成后立即开始播放，并在播放时仅对需要播放的视频片段进行转码。	边转边播

文档数据处理

文档数据处理功能使用户能够自动化地识别、查看、转换和检索文档内容，提升文档管理效率并简化文档处理流程。

功能集	功能	功能描述	参考文档
文档在线服务	文档在线编辑	对 OSS 或者 PDS 中的文档进行在线编辑。	文档处理介绍文档处理 API
	文档在线预览	对 OSS 或者 PDS 中的文档进行在线预览。	文档处理介绍文档处理 API
	文档格式转换	对文档的格式进行转换，如从 .doc 转为 .pdf。	文档格式转换介绍文档格式转换 API
文档内容处理	文档正文提取	文档内容提取服务可以从多种格式的文档中自动提取文字，将目标文档内容转换为纯文本格式，支持多种语言和文档类型。	文档正文提取介绍文档正文提取 API

文件数据处理

文件数据处理功能支持高效的文件压缩、解压以及点云数据的专业压缩技术，全方位满足文件存储与传输的性能优化需求。

功能集	功能	功能描述	参考文档
文件基础处理	文件压缩	云上资源的压缩功能可以帮助用户高效、便捷地进行云上文件管理，可以根据需要使用该功能对OSS中的文件进行在线压缩，将您的多个文件打包为 zip 等压缩包。	压缩解压介绍压缩 API
文件基础处理	文件解压	创建解压缩任务可以将您压缩包内的指定文件解压缩到特定位置，也可以将压缩包完整解压。目前支持的压缩格式包括Zip、RAR和7z。	压缩解压介绍解压 API
特殊场景处理	点云压缩	点云是海量点的集合，存储点云数据不仅会消耗大量内存，而且也会对传输带宽造成很大的挑战。IMM 提供的点云压缩功能可以对点云数据的时空信息进行分析处理，大幅降低数据量与储存成本，实现高质量且实时的点云数据编码解码方案。	点云压缩介绍点云压缩API

智能数据处理

智能数据处理集成了语义检索、人脸聚类与搜索、时空聚类、图片聚类及故事生成等先进技术，实现内容的深度理解和智能组织，为用户提供多维度的数据洞察和内容创造工具。

功能集	功能	功能描述	参考文档
检索式处理	语义检索	语义检索采用向量检索的方式，可以根据文件内容进行检索，例如“俯瞰森林”、“雪中城市”、“去年夏天的草原”等文件内容。您可以利用 IMM 语义检索能力对您对象存储 OSS 中的文件进行检索，也可以对网盘与相册服务 PDS 中的文件进行检索。	语义检索介绍语义检索（自然语言查询）API
	人脸聚类	使用人脸聚类功能，您可以将数据集中存在相似人脸的多张图片进行分组，适用于网盘的人脸相册、家庭监控的陌生人检测、甚至新零售的顾客管理等场景。人脸聚类后，您可以根据人脸分组查询对应人员的所有图片信息。	人脸聚类介绍人脸聚类API
	人脸搜索	创建媒体集并将图片索引到媒体集后，您可以使用人脸搜索功能从媒体集中搜索与指定图片或人脸 ID 最相似的前 N 张图片，可用于业务的用户识别等场景。	人脸搜索介绍人脸搜索 API
	时空聚类	基于照片的拍摄时间、地理位置等元数据信息，将满足分组条件的照片分到同一组。	时空聚类介绍时空聚类API
	图片聚类	图片聚类基于照片的相似度将满足分组条件的照片分到同一组，您可以使用该功能筛选相册中连拍的照片，对其进行分组操作。	图片聚类介绍图片聚类 API
生成式处理	故事生成	故事功能可以将数据集中的照片使用AI算法按照时间或人物来生成一组照片故事集，并选取一张较好的照片作为封面。使用故事功能，您可以轻松实现故事相册功能，感受生活中的美好时刻。	故事生成介绍故事生成API

内容安全审核

内容安全审核功能利用人工智能技术对上传的媒体文件进行实时检测，以识别和过滤不合规内容，确保平台内容的合法性和安全性。

功能集	功能	功能描述	参考文档
违规检测	文本违规检测	文本违规检测用于检测文本是否违规，帮助用户提高审核效率，降低安全风险。	文本违规检测介绍
	图片违规检测	图片违规检测用于检测图片是否违规，帮助用户提高审核效率，降低安全风险。	图片违规检测介绍
	视频违规检测	视频违规检测用于检测视频是否违规，帮助用户提高审核效率，降低安全风险。	视频违规检测介绍