内容检测API的OCR卡证内容识别功能支持自定义OCR模板,帮助您提取自定义图片中的结构化文字信息。您可以在内容安全控制台自定义OCR模板,根据需要配置要识别的图片模板和待识别的文字信息,实现对各种类型的票据、证件等图片进行文字识别。

背景信息

如果您需要识别的图片类型不在已有的结构化OCR支持范围内,您可以使用自定义OCR模板。

进行本文操作前,请先熟悉以下概念:
  • 模板:格式和包含信息完全相同的一类图片生成的一种规范版式。进行图片文字识别前,您需要在内容安全控制台手动创建模板。创建成功的模板将获得一个唯一的ID作为其标识。在调用OCR检测接口时,您需要传入要应用的模板ID作为请求参数。
    创建模板时,您需要上传一张待识别的图片作为样本。样本图片需要满足以下要求:
    • 使用.png、.jpg、.jepg、.bmp、.gif格式。
    • 大小在1 KB到10 MB之间,分辨率在320*320像素到4096*4096像素之间。
    • 尽量摆放端正平整,不存在模糊、过度曝光、阴影等不良情况。
    • 尽量突出需要识别的部分。建议您手动剪裁掉不需要部分,以提高识别准确率。
    • 至少存在四个模板参考字段,且尽量分散在图片的边缘(越分散越好),用于准确定位模板。
    • 选取的模板参考字段、待识别字段的高度不小于20像素。
  • 参考字段:用于定位模板位置的固定字段。参考字段的选取会影响图片的识别准确率。参考字段务必选取位置和内容都不会变化的文字内容。单个参考字段内的文字不可以换行,建议您选取四个以上的参考字段。
  • 识别字段:需要识别的内容字段。设置识别字段时,需要给字段设置key值,最终识别结果会以key:识别内容格式返回。

操作步骤

  1. 登录内容安全控制台
  2. 在左侧导航栏,选择设置 > 机器审核
  3. 机器审核页面,单击OCR模板
  4. OCR模板页签,单击创建模板
  5. 创建模板面板,设置模板名称,并单击选择图片,选择一张待识别的图片作为样本上传。
    成功创建模板。新建的模板显示在左侧模板列表中,选择新建的模板进行后续的模板配置。
  6. 设置参考字段。
    1. 单击设置参考字段
    2. 模板编辑页面,单击新增字段并用绿色矩形框框选图片上位置固定不变的单行参考字段。
      说明 参考字段区域务必框选单行文字,且尽量将文字包裹完整。
    3. 重复上一步,设置至少四个不同的参考文字区域后,单击保存
  7. 设置识别字段。
    1. 单击设置识别字段
    2. 模板编辑页面,单击新增字段并用绿色矩形框框选待识别的单行文字,为框选中的内容设置一个Key值,作为识别结果的标识。
      说明 如果要识别的字段分多行显示,建议您分别框选单行文字,并为它们设置相同的Key值。算法会将多行Key值相同的字段以框选顺序组合返回。
    3. 重复上一步,添加完所有待识别内容,并单击保存
  8. 完成模板创建后,选择要应用的模板,单击复制模板ID
  9. 参见OCR同步检测,调用检测接口进行图片OCR识别,并将复制的模板ID作为请求参数extras结构体中的templateId传入,应用自定义OCR模板。