四大功能集全部特性详解-智能媒体服务-阿里云

智能媒体服务

功能集	功能	功能描述	参考文档
媒资管理	音视频资产管理	将音视频资产数字化、结构化存储，提供全面的管理服务。	媒资上传
	内容信息编目	提供标题、分类、封面、字幕、点位信息等编目能力。	分类管理
	检索查询	支持基于音视频编目字段的强大搜索排序服务；支持基于视频内容分析的智能检索，支持AI分类、视频文字检测、视频人物检索等。	智能媒资分析
	播放服务	提供标准的全平台播放SDK，满足百万用户同时在线的吞吐能力，且通过全网加速带来优质体验。	-
智能生产制作	视频剪辑	针对自动化、智能化剪辑，以及多人协作视频制作需求，提供基于时间线的云端剪辑参数，支持OpenAPI、WebSDK和控制台可视化多种应用方式。	提交剪辑合成作业
	直播剪辑	针对时效性内容边直播边剪辑的需求，提供20倍速以上剪辑合成速度、普通剪辑跳转以及缩短直播中精彩片段的拆剪时间，重塑工作流程。支持OpenAPI、WebSDK和控制台可视化多种应用方式。	提交直播剪辑任务
	模板生产	针对视频制作中重复性内容和定制美化需求，提供基础模板和高级模板，方便用户通过自定义模板和素材替换，实现批量化视频生产能力。支持OpenAPI、WebSDK和控制台可视化多种应用方式。	云剪辑模板
	智能生成	针对视频生产中的智能化制作需求，提供智能字幕、智能语音、绿幕抠像、实景抠像、动态图表等功能，提高视频制作效率。	提交智能任务API
	数字人	支持进行真人形象模型生成，高度还原表情、动作、口型等形象特征，并可基于文字或语音驱动形象模型实现数字人拟真播报，同时可添加动态视觉内容（视频、图片、动态图表等）和补充字幕信息的自动化视频成片服务。	数字人
	人声克隆	支持进行真人音色模型生成，提供基础版和大众版（轻量定制）两档服务能力，高度还原训练人音色特质，基于文本驱动人声模型生成音频。支持与数字人、视频剪辑等服务关联应用。	人声克隆
	智能一键成片	面向营销混剪场景，提供脚本化一键成片和智能图文一键成片的智能化产品服务，满足快速、批量化、非重复的生产制片需求。	批量智能一键成片
点播媒体处理	音视频转码	支持H.264、H.265等主流格式编码，同时支持转封装、字幕、水印等功能。	-
	窄带高清	在同等画质下更省流，同等带宽下更高清的观看体验。	-
	音画增强	通过画质重生技术，将已有的标清或受损的资源生成超高清版本或修复重制版，支持杜比全景声、杜比音频转码、虚拟环绕声、悦声音效等适配各类播放设备的音效增强方案，提供更优的视听体验。	-
	视频加密	支持“阿里云私有加密”、“HLS-AES128标准加密”两种加密方式，可有效的保护视频内容，防止非法下载。	-
	切片打包	支持对源视频进行切片，实现并行转码，大幅提升转码效率；支持将多字幕、多音轨、多码率视频流打包为一个文件，满足不同场景的播放需求。	-
	视频AI	提供智能审核、视频DNA、多模态标签、智能封面等服务，大幅提高人员效率和流量效率。	-
实时媒体处理	实时转码	解决推流端码率较高或较低导致播放效果不佳的问题；支持H.264、H.265等主流格式编码，同时支持窄带高清转码、RTS转码、原画转码等功能。	-
	实时录制	提供对直播流进行录制的功能，录制文件支持HLS（包含TS切片、M3U8索引文件）、MP4、FLV封装格式；并且支持将录制文件存储至VOD或OSS中，存储至VOD时可以使用视频点播的云剪辑、媒资管理、播控管理等功能。	-
	实时截图	支持在直播过程中实时截图，并将截图文件存储在OSS Bucket中。	-