视频OCR模板可以在视频中框选出含文字部分时,自动对框内文字进行识别。
数据格式示例
CSV及XLSX格式中每一列数据;Manifest格式中data字段的下一级字段均对应一个数据集字段,字段名可自定义,在配置数据集字段名时选择对应的字段名即可。
CSV及XLSX格式
video_url |
oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/1.mp4 |
oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/2.mp4 |
文件Demo参考:视频数据demo.csv
Manifest格式(JSONL格式)
{"data":{"video_url":"oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/1.mp4"}}
{"data":{"video_url":"oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/10.mp4"}}
文件Demo参考:视频数据demo.manifest
使用限制
模板支持的视频格式:MP4、WebM、OGG。
视频长度:建议在5分钟。
配置说明
标注区(必选)
待标注视频用于配置视频字段。
单击选中待标注视频,并选择相应的数据集后,在右侧配置区域配置具体参数。参数说明如下:
参数 | 说明 |
标题 | 默认标题区域无需修改。 |
数据集字段 | 在数据集字段中选择视频URL字段。(字段名称可自定义) |
提示 | 默认提示区域无需修改。 |
卡片样式配置 | 无需配置,不生效。 |
全局配置
全局配置用于配置模板中会使用到的UDF(User Defined Function),此处可以选择配置获取视频fps的UDF。
单击,在右侧可以进行问答机器人的配置。参数说明如下:
参数 | 说明 |
标题 | 默认标题区域无需修改。 |
组件版本 | 无需配置,不生效。 |
预标注 | 在此处配置获取视频fps的UDF,需要严格按照图示进行配置。 |
数据校验 | 无需配置,不生效。 |
其他
单击返回,即可返回到模板选择页面。
单击智能化配置,可配置预标注、UDF等服务。
单击废弃配置,可设置是否允许废弃样本。
单击导入数据集,可以更改需要导入的数据集。
单击导出模板,可以导出并复制JSON格式的模板。
单击保存模板,可以保存当前配置完成的模板。
单击创建任务,可以保存当前配置完成的模板并创建相应任务。
操作演示
在视频中框选出含文字的部分后,双击框会出现弹窗,弹窗内的内容为OCR自动识别出的文字内容。新建ID并保存后,数据会同步展示在视频、右侧答题区及下侧时间轴区域中。
找到该ID内容出现的几个关键帧,进行框选并选择相同ID进行保存后,三个区域内的数据展示会同步进行更新。
双击视频中的框,可对该ID对应的内容进行编辑/删除操作。悬停于右侧答题区数据操作列的,可查看该ID内容的几个关键帧,单击可跳转到对应的关键帧处。单击数据操作列的,可删除该ID对应数据。
悬停于时间轴处的数据条上,可以查看该数据的全文本内容。双击数据条,可跳转到该数据起始帧处。