视频理解介绍

视频理解是基于阿里云深度学习技术,对视频内容进行视频镜头分析,抓取视频中的精彩片段或单张画面作为视频封面,提升视频的点击率和用户体验。

服务开通

请单击立即开通在对应产品页面开通该服务,具体开通方式请参见新手指南

能力介绍

目前阿里云视觉智能开放平台上线的视频理解能力包括:

类别

能力

说明

视频理解

视频封面

输入一段视频通过算法解析视频,把具有吸引力的内容进行输出,可输出多个视频封面。

视频镜头解析

对输入的视频按镜头切分,返回切分点。

视频内容理解

可以分析出视频中的明星、素人、游戏画面等各种元素。

视频OCR

可以识别视频中的文本,可涵盖新闻、影视剧、娱乐、体育等多场景的中英文、繁简体、比分等识别,支持普通字幕、定常字幕、滚动字幕、部分自然场景文字、竖排文字及艺术字等多种类型。

视频拆条

可以多维度对视频进行分析理解,将视频拆解为多个片段并返回每个片段的边界时间点(不返回具体视频片段),并对片段进行摘要描述,拆分维度包含镜头和主题等。

视频画质评估

可以评估输入视频的质量,包含基础质量评估和瑕疵质量评估两种模式,并输出质量评估综合报告和详细报告。

应用场景

视频理解的应用场景如下:

  • 精彩视频推荐

    使用智能视频封面选图服务,快速为长/短视频选出最具代表性的高质封面,提升用户的视觉体验,便于快速筛选视频,提升用户留存。

  • 视频精彩封面图

    为视频内容生成最精彩的封面,把最具吸引力的内容呈现出来,有效帮助提升视频内容的点击率,提高用户停留时长。

更多产品动态,请您持续关注阿里云视觉智能开放平台