全部产品
云市场

概述

更新时间:2019-02-25 10:21:34

概述

阿里云视频AI服务可以对音视频内容进行识别、分析和理解。通过对该服务的使用,您可以检测违规的视频内容,识别并搜索重复或相似的音视频片段,识别视频中的人物、文字、实体、场景和动作,分析理解视频以推荐封面、生成动图及视频摘要,也支持将语音识别为文本等。

准备工作

  • 确保您已 注册 阿里云账号,完成 实名认证,并开通了 点播服务

  • 准备好访问点播服务使用的Access Key。可以在阿里云 Access Key管理 创建主账号Access Key,也可以在 RAM访问控制台 创建子账号,并授予VOD权限(如AliyunVODFullAccess)后进行相应操作。具体参考 RAM子账号访问

  • 点击全局设置,进入 回调设置,设置回调地址, 勾选开启视频AI处理完成,所有AI处理都共用此开关,接收相应AI作业完成的事件通知回调。AI回调通知

  • 视频AI处理的音视频文件需要存到 点播媒资库,音视频文件的格式要求与点播 上传格式 要求一致。

主要功能

智能审核

智能审核服务支持对点播视频资源的视频文件、封面图片及标题文本中涉黄、性感、暴恐、特殊装束、特殊标识、武器、渉政等内容进行识别,并给出建议结果。点此 详细了解。

智能审核服务相关开发文档如下

媒体DNA

媒体DNA可以唯一标记一个视频/音频/图片,具有稳定性,不会随音视频文件的格式转换、剪辑拼接、压缩旋转等变换而发生变化。媒体DNA服务实现对视频中的图像、音频等指纹特征的提取和比对,解决重复视频查找、视频片段查源、原创识别等问题。点此 详细了解。媒体DNA服务相关开发文档如下

多模态内容理解

多模态内容理解服务通过分析视频中视觉、文字、语音、行为等多模态信息,自动输出视频的多维度内容标签,将非结构化信息转化为结构化信息。更多详情参考 视频多模态内容理解

智能封面

智能封面服务支持对视频内容进行分析和理解,提取最能代表视频内容的5张截图作为封面备选图;也支持将视频内容的关键画面进行抽取,自动合成Gif作为动图封面。更多详情参考 智能封面

名人识别

名人识别服务可以将视频画面中出现的名人进行面部识别与分析,除了返回人名及置信度外,还将返回人物出现的时间点及人脸在视频画面区域的位置信息。

语音识别

语音识别服务支持将纯音频资源,或提取视频资源中的音频部分,进行识别并返回文本。

文本识别

文本识别服务可以识别视频中的字幕信息以及其他文字信息,可应用于各类视频场景中。

视频摘要

视频摘要服务通过对视频内容的理解,返回整个视频中最精彩的时间区间。

服务体验

视频AI体验馆Retina支持您零门槛上传自己的视频,并查看AI服务对音视频内容识别、分析和理解的结果。 可访问 视频AI-视网膜 开始体验。

服务开通

智能审核服务可在控制台开通。其它服务请访问 视频AI开通 提交开通。

调用方式

调用方式1: 流程自动触发

视频AI服务支持自动触发的模式,您只需要将视频上传到点播媒体库,视频AI服务会自动检测视频状态,并发起相应的AI作业。您可以通过 接收回调 或根据MediaId主动查询的方式获取AI结果数据。如下图:AI处理流程_自动处理

调用方式2: API/SDK提交

视频AI服务也支持用户主动发起AI作业请求,并可通过三种方式获取AI结果数据。如下图:AI处理流程_OpenAPI注意:该接口调用之前视频需上传到点播媒资库,且 音视频已分析完毕