视频理解是基于阿里云深度学习技术,对视频内容进行视频镜头分析,抓取视频中的精彩片段或单张画面作为视频封面,提升视频的点击率和用户体验。
服务开通
能力介绍
目前阿里云视觉智能开放平台上线的视频理解能力包括:
类别 | 能力 | 说明 |
视频理解 | 输入一段视频通过算法解析视频,把具有吸引力的内容进行输出,可输出多个视频封面。 | |
对输入的视频按镜头切分,返回切分点。 | ||
可以分析出视频中的明星、素人、游戏画面等各种元素。 | ||
可以识别视频中的文本,可涵盖新闻、影视剧、娱乐、体育等多场景的中英文、繁简体、比分等识别,支持普通字幕、定常字幕、滚动字幕、部分自然场景文字、竖排文字及艺术字等多种类型。 | ||
可以多维度对视频进行分析理解,将视频拆解为多个片段并返回每个片段的边界时间点(不返回具体视频片段),并对片段进行摘要描述,拆分维度包含镜头和主题等。 | ||
可以评估输入视频的质量,包含基础质量评估和瑕疵质量评估两种模式,并输出质量评估综合报告和详细报告。 |
应用场景
视频理解的应用场景如下:
精彩视频推荐
使用智能视频封面选图服务,快速为长/短视频选出最具代表性的高质封面,提升用户的视觉体验,便于快速筛选视频,提升用户留存。
视频精彩封面图
为视频内容生成最精彩的封面,把最具吸引力的内容呈现出来,有效帮助提升视频内容的点击率,提高用户停留时长。
更多产品动态,请您持续关注阿里云视觉智能开放平台。
文档内容是否对您有帮助?