使用LVM-帧文本生成（DLC）为视频帧生成文本-人工智能平台 PAI-阿里云

文档备案控制台

LVM-帧文本生成（DLC）组件主要用于生成视频（仅支持处理MP4格式的视频）文本。

支持的计算资源

算法说明

通过采样若干视频帧，由BLIP模型基于视频帧生成视频文本。

输入/输出

输入桩

通过读OSS数据组件，读取训练数据所在的OSS路径。
配置此算法参数视频数据OSS路径，选择视频数据所在的OSS目录，或视频元数据文件。详情请参见下文中的参数说明。
使用任意LVM数据处理（DLC）组件作为输入。

输出桩

输出结果。详情请参见下文中的参数说明。

配置组件

在Designer工作流页面添加LVM-帧文本生成（DLC）组件，并在界面右侧配置相关参数：

参数类型	参数		是否必选	描述	默认值
字段设置	视频数据OSS路径		否	首次运行时，若无上游组件，需手动选择视频数据所在的OSS目录。运行时会在该路径的上一级目录下生成视频元数据文件video_meta.jsonl。后续处理此视频数据时，也可以直接选择之前生成的video_meta.jsonl文件。	无
	输出文件的OSS路径		是	生成结果的存储目录。包含以下文件： {name}.jsonl：结果文件，即下面参数输出的文件名。 dj_run_yaml.yaml：算法运行时的参数配置文件。	无
	输出的文件名		是	生成结果的文件名。	result.jsonl
参数设置	生成候选文本数目		是	每帧生成的候选文本数。	1
参数设置	均匀采样帧数目		是	采样的视频帧数。系统会在视频中根据视频时长均匀地采集帧画面进行分析。	3
执行调优	选择资源组	公共资源组	否	选择节点规格（CPU或GPU实例规格）、专有网络。该算法需使用GPU规格实例。	无
	选择资源组	专有资源组	否	选择CPU核数、内存、共享内存、GPU卡数。	无
	最大运行时长		否	组件最大运行时长，超过这个时间，作业会被终止。	无

上一篇：LVM-标签生成（DLC）下一篇：LVM-视频文本生成（DLC）

该文章对您有帮助吗？