多媒体分析
多媒体分析为您提供多媒体领域内的算法识别服务,包括基础模型服务和高级模型服务,为您提供开箱即用的算法服务能力。本文为您介绍多媒体分析相关计费说明和使用指导。
背景信息
多媒体分析支持的算法服务如下:
基础模型服务:提供图像领域内开箱即用的算法服务能力,包括图像多标签、图像质量分评定、人脸属性分析(颜值、脸型、发型、发色等信息)、年龄分析、人像身材修改(瘦身/大码)、图像去水印等模型服务。
高级模型服务:提供视频领域内开箱即用的算法服务能力,包括视频分类打标、视频质量分评定、图文视频动态分类打标(用于动态、帖子类的多模态内容打标)、AI绘图打标(打标结果用于提升AI绘图模型训练效果)等模型服务。
计费说明
多媒体分析提供按量付费后付费和资源包预付费两种计费方式,具体计费说明,详情请参见多媒体分析计费说明。
使用指导
开通多媒体分析服务和购买资源包
新用户首先需要在人工智能平台PAI的场景化解决方案的多媒体分析中开通服务,具体操作步骤如下。
登录PAI控制台。
按照下图操作指引,开通多媒体分析服务。
默认使用按量付费(后付费)方式,按调用量计费。
您也可以选择购买资源包,一次性付费购买,享受更优惠的价格。
在多媒体分析页面的基础模型服务页签,单击购买次数包。
在模型服务预付费页面,配置购买数量、场景规格和API调用次数,并单击立即购买。
其中:场景规格支持选择多媒体分析-基础模型服务或多媒体分析-高级模型服务;其他参数根据使用场景进行选择。
Python SDK使用说明
开通多媒体分析服务后,您可以使用Python SDK调用各项算法服务,详情请参见多媒体分析:Python SDK使用说明。
Java SDK使用说明
开通多媒体分析服务后,使用Java SDK调用各项算法服务API接口的操作详情,请参见Java SDK GitHub。Java SDK和Python SDK的参数基本一致。若需了解具体参数说明,请参考多媒体分析:Python SDK使用说明。
多媒体分析能力矩阵
规格 | 模型服务名称 | 每次服务消耗 | 描述 | 示例 |
基础模型服务 | 图像质量评分 | 1次基础模型服务 | 提供图像质量评估能力,返回 [0, 100] 的浮点数分值。 |
|
人脸属性分析 | 1次基础模型服务 |
|
| |
年龄分析 | 1次基础模型服务 |
| 年龄区间包含: | |
图像多标签 | 1次基础模型服务 | 提供图像多标签打标能力,可以输出概率最高的Top K个标签以及对应的概率,也可以输出图像的高维特征。 | 高频标签举例:女生、自拍、男生、生活随拍、截屏、食物、车、美食、游戏、卡通、动物、韩系穿搭等。 | |
人像身材修改 | 1次基础模型服务 | 提供人像身材修改功能,您可以上传人像照片,并通过调整degree参数来控制人像的身材,包括胖身或瘦身,其中 | 接口返回修改后图像的Base64编码。 | |
图像去水印 | 1次基础模型服务 | 去除图像中包含的水印。 | 接口返回去除水印后图像的Base64编码。 | |
AI绘图打标 | 1次基础模型服务 | 提供AI绘图(Stable-Diffusion)训练所需的多种图像多标签打标能力,更好的标签能提升训练模型的生图效果。 |
| |
定制模型服务 | N次基础模型服务,具体N的值根据定制模型复杂度有所差异 | 提供图像、视频相关的定制模型服务。 | 根据实际定制模型类型确定。 | |
高级模型服务 | 图文视频动态分类打标 | 1次高级模型服务 | 为包含多模态内容的动态或帖子提供分类打标服务,支持使用文本+图片或文本+视频的组合进行分类打标,并支持返回高维特征Embedding。 |
|
视频质量评分 | 1次高级模型服务 | 提供短视频质量评估能力,返回[0-100]的浮点质量分。 |
| |
视频分类打标 | 1次高级模型服务 | 提供短视频分类打标能力,返回短视频类别和概率较高的Top K个标签及对应概率,也支持输出视频的高维特征。 |
|
测试与服务
如果您需要做进一步的测试和服务,请工单联系我们获取技术支持。