更新时间:2020-08-04 15:29
光学字符识别OCR(Optical Character Recognition)将输入图像中的文字转换为文本格式,并根据文字信息类别对输入图像进行分组。您可以通过PAI智能标注预置的OCR模板,快速完成数据标注任务。
OCR模板的数据结构请参见标注模板。
参数 | 描述 |
---|---|
任务名称 | 输入ocr_tag。 |
任务描述 | 输入OCR模板标注演示。 |
输入数据集 | 选择导入数据时已注册的数据集。 |
输出数据集位置 | 选择OSS路径,例如oss://****.oss-cn-shanghai.aliyuncs.com/testData/。 |
参数 | 描述 |
---|---|
选择模板 | 选择OCR模板。 |
标注整图方向 | 打开是否需要标注整图方向和标注时可选文字方向开关。 |
文字类别 | 添加姓名、电话、地址、公司及其他类别。 |
添加自定义标签 | 添加区域字段及对应的南方和北方字段值。 |
参数 | 描述 |
---|---|
发题策略 | 系统默认标注员按次领取固定数量,不支持修改。 |
每次领取 | 输入100。 |
添加标注员 | 选择全选。 |
{
"data": {
"picUrl":"oss://****/img/ocr_card/img0.jpeg"
},
"label-****(标注任务ID)": {
"results":[{
"data":[{
"direction_of_picture":"downward",
"type":"ocr/meta"
},
{
"id":"Y4ZFoC-****",
"direction_of_text":"downward",
"text":"北京海淀上地七街国际创业园2好楼4层403室",
"type":"ocr/polygonLabel",
"value":{
"points":[[325.08789110183716,397.47582054138184], ...]
},
"labelColor":"#67bd3a",
"labels":"地址"
}],
"id":"24****",
"type":"ocr"
}]
}
}
在文档使用中是否遇到以下问题
更多建议
匿名提交