全部产品
阿里云办公

使用流程简介

更新时间:2018-08-21 20:48:54

建议使用子账户来访问智能媒体管理服务,便于做更好的权限控制。需要授予子账户 AliyunIMMFullAccess 权限,并为子账户创建对应的 AccessKey,然后使用AccessKey IDAccessKey Secret 调用场景对应的 API

文档管理场景

文档格式转换

本场景实现将 48 种文档格式转换为 JPGPNGPDFVECTOR 4 种格式,从而可以在应用中更好的展示,场景使用步骤如下:

  • 第一步,调用 PutProject 接口创建项目,指定类型为 <文档标准型>
  • 第二步,调用 CreateOfficeConversionTask 接口进行格式转换,该接口为异步请求,可以通过调用 GetOfficeConversionTask 来轮询任务状态,或者使用 消息队列 得到转换结果的通知(Notification)。

转换成功后,可以在 OSS 的指定位置得到对应的输出结果。也可以在第二步调用 ConvertOfficeFormat 同步请求,它和 CreateOfficeConversionTask 异步请求参数类似,不同点在于同步请求需要在 5 秒的时间内完成;如果同步请求失败,则需要使用异步请求。

文档预览

本场景在文档格式转换基础上,您自己搭建智能媒体管理服务提供的 前端渲染引擎 实现预览功能。转换时,需要使用 vector 模式,该模式下可以复制其中的文字、并且缩放不失真、自定义广告等功能,从而实现更好的体验,场景使用步骤如下:

  • 第一步,调用 PutProject 接口创建项目,指定采用 <文档标准型>
  • 第二步,调用 CreateOfficeConversionTask 接口进行格式转换,该接口为异步请求,可以通过调用 GetOfficeConversionTask 来轮询任务状态,或者使用 消息队列 得到转换结果的通知(Notification)。
  • 第三步,对接 前端渲染引擎,把生成到 OSS 的转换文件作为参数传递给渲染引擎,实现在浏览器中的预览。

注意,如果预览服务的域名和 OSS 桶域名不同,需要设置 OSS 的 CORS 功能,允许预览服务器访问。

图片社交场景

本场景通常使用图片 AI 功能,通过调用 DetectTag 接口返回标签信息,或者调用 DetectFace 接口返回人脸信息,基于这些 AI 处理得到的元数据,应用可以做更多增值功能。

为了让应用能够更方便的对元数据进行查询,服务也提供了元数据索引能力,使用步骤如下:

  • 第一步,调用 PutProject 接口创建项目,指定采用 <图片专业型>
  • 第二步,调用 CreateTagSet 接口创建标签数据集,返回数据集 ID(SetId)
  • 第三步,调用 IndexTag 接口为图片构建索引,需要指定第一步中返回的 SetId;应用可以多次调用本接口索引多张图片。
  • 第四步,调用 ListTagNames 接口返回指定 SetId 包含的标签。
  • 第五步,调用 ListTagPhotos 接口返回具有指定标签的图片。

通过上述步骤,可以帮助应用快速构建标签搜索能力,例如在图片社区应用中加入搜索栏,查询具有猫的图片。

家庭设备使用流程

本场景通常使用图片人脸 AI 功能,应用将视频截帧生成多张图片,然后调用图片人脸聚类功能,实现对家庭成员的识别,使用步骤如下:

  • 第一步,调用 PutProject 接口创建项目,指定采用 <图片专业型>
  • 第二步,调用 CreateFaceSet 接口创建人脸数据集,返回数据集 ID(SetId)
  • 第三步,调用 IndexFace 接口为图片中的人脸构建索引,需要指定第二步中返回的 SetId;应用需要多次调用本接口索引多张图片。
  • 第四步,调用 GroupFaces 接口为指定的人脸数据集进行人脸聚类。
  • 第五步,调用 GetFaceSetDetail 接口返回人脸分组的详细信息。

从而,可以帮助应用构建标签搜索能力,例如在图片社区应用中加入搜索栏,查询具有猫的图片,可以快速的查找出来。

在调用过人脸分组 GroupFaces 接口后,还可以继续往数据集索引相片的人脸 IndexFace ,然后再次调用 GroupFaces 进行增量的处理。

注意:未来 智能媒体管理 服务还会提供进一步的优化设计,应用只需提共视频的 OSS 地址,服务会自动实现截帧和人脸聚类。