视频OCR

视频OCR模板可以在视频中框选出含文字部分时,自动对框内文字进行识别。

数据格式示例

说明

CSVXLSX格式中每一列数据;Manifest格式中data字段的下一级字段均对应一个数据集字段,字段名可自定义,在配置数据集字段名时选择对应的字段名即可。

CSVXLSX格式

video_url

oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/1.mp4
oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/2.mp4

文件Demo参考:视频数据demo.csv

Manifest格式(JSONL格式)

{"data":{"video_url":"oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/1.mp4"}}
{"data":{"video_url":"oss://****.oss-cn-hangzhou.aliyuncs.com/iTAG/mov/10.mp4"}}

文件Demo参考:视频数据demo.manifest

使用限制

  • 模板支持的视频格式:MP4、WebM、OGG。

  • 视频长度:建议在5分钟。

配置说明

标注区(必选)

待标注视频用于配置视频字段。

image

单击选中待标注视频,并选择相应的数据集后,在右侧配置区域配置具体参数。参数说明如下:

参数

说明

标题

默认标题区域无需修改。

数据集字段

在数据集字段中选择视频URL字段。(字段名称可自定义)

提示

默认提示区域无需修改。

卡片样式配置

无需配置,不生效。

全局配置

全局配置用于配置模板中会使用到的UDF(User Defined Function),此处可以选择配置获取视频fpsUDF。

image

单击image,在右侧可以进行问答机器人的配置。参数说明如下:

参数

说明

标题

默认标题区域无需修改。

组件版本

无需配置,不生效。

预标注

在此处配置获取视频fpsUDF,需要严格按照图示进行配置。

数据校验

无需配置,不生效。

其他

  • 单击返回,即可返回到模板选择页面。

  • 单击智能化配置,可配置预标注、UDF等服务。

  • 单击废弃配置,可设置是否允许废弃样本。

  • 单击导入数据集,可以更改需要导入的数据集。

  • 单击导出模板,可以导出并复制JSON格式的模板。

  • 单击保存模板,可以保存当前配置完成的模板。

  • 单击创建任务,可以保存当前配置完成的模板并创建相应任务。

操作演示

  1. 在视频中框选出含文字的部分后,双击框会出现弹窗,弹窗内的内容为OCR自动识别出的文字内容。新建ID并保存后,数据会同步展示在视频、右侧答题区及下侧时间轴区域中。

    image

  2. 找到该ID内容出现的几个关键帧,进行框选并选择相同ID进行保存后,三个区域内的数据展示会同步进行更新。

    image

  3. 双击视频中的框,可对该ID对应的内容进行编辑/删除操作。悬停于右侧答题区数据操作列的image,可查看该ID内容的几个关键帧,单击可跳转到对应的关键帧处。单击数据操作列的image,可删除该ID对应数据。

  4. 悬停于时间轴处的数据条上,可以查看该数据的全文本内容。双击数据条,可跳转到该数据起始帧处。