文档

功能特性

更新时间:

智能媒体服务

功能集

功能

功能描述

参考文档

媒资管理

音视频资产管理

将音视频资产数字化、结构化存储,提供全面的管理服务。

媒资上传

内容信息编目

提供标题、分类、封面、字幕、点位信息等编目能力。

分类管理

检索查询

支持基于音视频编目字段的强大搜索排序服务;支持基于视频内容分析的智能检索,支持AI分类、视频文字检测、视频人物检索等。

智能媒资分析

播放服务

提供标准的全平台播放SDK,满足百万用户同时在线的吞吐能力,且通过全网加速带来优质体验。

-

智能生产制作

视频剪辑

针对自动化、智能化剪辑,以及多人协作视频制作需求,提供基于时间线的云端剪辑参数,支持OpenAPI、WebSDK和控制台可视化多种应用方式。

提交剪辑合成作业

直播剪辑

针对时效性内容边直播边剪辑的需求,提供20倍速以上剪辑合成速度、普通剪辑跳转以及缩短直播中精彩片段的拆剪时间,重塑工作流程。支持OpenAPI、WebSDK和控制台可视化多种应用方式。

提交直播剪辑任务

模板生产

针对视频制作中重复性内容和定制美化需求,提供基础模板和高级模板,方便用户通过自定义模板和素材替换,实现批量化视频生产能力。支持OpenAPI、WebSDK和控制台可视化多种应用方式。

云剪辑模板

智能生成

针对视频生产中的智能化制作需求,提供智能字幕、智能语音、绿幕抠像、实景抠像、动态图表等功能,提高视频制作效率。

提交智能任务API

数字人

支持进行真人形象模型生成,高度还原表情、动作、口型等形象特征,并可基于文字或语音驱动形象模型实现数字人拟真播报,同时可添加动态视觉内容(视频、图片、动态图表等)和补充字幕信息的自动化视频成片服务。

数字人

人声克隆

支持进行真人音色模型生成,提供基础版和大众版(轻量定制)两档服务能力, 高度还原训练人音色特质,基于文本驱动人声模型生成音频。支持与数字人、视频剪辑等服务关联应用。

人声克隆

智能一键成片

面向营销混剪场景,提供脚本化一键成片和智能图文一键成片的智能化产品服务,满足快速、批量化、非重复的生产制片需求。

批量智能一键成片

点播媒体处理

音视频转码

支持H.264、H.265等主流格式编码,同时支持转封装、字幕、水印等功能。

-

窄带高清

在同等画质下更省流,同等带宽下更高清的观看体验。

-

音画增强

通过画质重生技术,将已有的标清或受损的资源生成超高清版本或修复重制版,支持杜比全景声、杜比音频转码、虚拟环绕声、悦声音效等适配各类播放设备的音效增强方案,提供更优的视听体验。

-

视频加密

支持“阿里云私有加密”、“HLS-AES128标准加密”两种加密方式,可有效的保护视频内容,防止非法下载。

-

切片打包

支持对源视频进行切片,实现并行转码,大幅提升转码效率;支持将多字幕、多音轨、多码率视频流打包为一个文件,满足不同场景的播放需求。

-

视频AI

提供智能审核、视频DNA、多模态标签、智能封面等服务,大幅提高人员效率和流量效率。

-

实时媒体处理

实时转码

解决推流端码率较高或较低导致播放效果不佳的问题;支持H.264、H.265等主流格式编码,同时支持窄带高清转码、RTS转码、原画转码等功能。

-

实时录制

提供对直播流进行录制的功能,录制文件支持HLS(包含TS切片、M3U8索引文件)、MP4、FLV封装格式;并且支持将录制文件存储至VOD或OSS中,存储至VOD时可以使用视频点播的云剪辑、媒资管理、播控管理等功能。

-

实时截图

支持在直播过程中实时截图,并将截图文件存储在OSS Bucket中。

-

  • 本页导读 (1)
文档反馈