视频理解产品介绍
影视传媒视频理解轻应用通过整合视频处理、自动语音识别(ASR)、视觉语言模型(VLM)和大语言模型(LLM)等算法能力,构建了一套通用视频理解方案,支持视频描述、结构解析、标签分类、视频问答、内容挖掘、视频检索、分析场景和营销场景等8大常见应用,并内置了24个对应子任务模板。用户可以参照模板修改调试来适配或自定义自己的业务场景。整体来说,在基础模型基础上,支持更细粒度理解和更复杂任务;在功能上,支持1次VL视觉理解便可复用并完成多个下游子任务。
更多信息可参见:影视传媒视频理解。
产品入口:立即前往。