内容检测API的OCR卡证内容识别功能支持自定义OCR模板,帮助您提取自定义图片中的结构化文字信息。您可以在内容安全控制台自定义OCR模板,根据需要配置要识别的图片模板和待识别的文字信息,实现对各种类型的票据、证件等图片进行文字识别。
背景信息
如果您需要识别的图片类型不在已有的结构化OCR支持范围内,您可以使用自定义OCR模板。
进行本文操作前,请先熟悉以下概念:
- 模板:格式和包含信息完全相同的一类图片生成的一种规范版式。进行图片文字识别前,您需要在内容安全控制台手动创建模板。创建成功的模板将获得一个唯一的ID作为其标识。在调用OCR检测接口时,您需要传入要应用的模板ID作为请求参数。
创建模板时,您需要上传一张待识别的图片作为样本。样本图片需要满足以下要求:
- 使用.png、.jpg、.jepg、.bmp、.gif格式。
- 大小在1 KB到10 MB之间,分辨率在320*320像素到4096*4096像素之间。
- 尽量摆放端正平整,不存在模糊、过度曝光、阴影等不良情况。
- 尽量突出需要识别的部分。建议您手动剪裁掉不需要部分,以提高识别准确率。
- 至少存在四个模板参考字段,且尽量分散在图片的边缘(越分散越好),用于准确定位模板。
- 选取的模板参考字段、待识别字段的高度不小于20像素。
- 参考字段:用于定位模板位置的固定字段。参考字段的选取会影响图片的识别准确率。参考字段务必选取位置和内容都不会变化的文字内容。单个参考字段内的文字不可以换行,建议您选取四个以上的参考字段。
- 识别字段:需要识别的内容字段。设置识别字段时,需要给字段设置key值,最终识别结果会以
key:识别内容
格式返回。