全部产品
云市场

自定义模板使用介绍

更新时间:2019-09-30 16:38:13

自定义模板OCR使用手册

基本概念

  1. OCR:对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。我们目前已有一系列定制化的阿里云OCR产品列表,详情见https://ai.aliyun.com/ocr,可以解决身份证信息提取、银行卡信息提取等一系列通用问题,但是各类自定义结构化提取的需求逐一完全满足。
  2. 自定义模板OCR识别:https://ai.aliyun.com/ocr/template,支持用户通过简单的标注创建专属自己的模板,生成识别规则。模板创建后,用户可通过API接口批量识别同类图片内容信息,获得定义好的输出结果,满足用户的个性化OCR需求。
  3. 模板:每个经过配置锚点和识别内容框选后的图片都可以作为模板,用来指导算法做到同一类图片的结构化信息提取,不同模板之间通过加密的id作为请求参数来区分。
  4. 锚点:在需要识别的所有图片中都存在的固定文字(支持中英文,不支持换行)。作用是根据相对位置用于定位要识别的内容在图片上的位置。
  5. 模板保存:暂存修改,此时可以进行模板试用,但是修改还未在线上生效
  6. 模板发布:推送至EAS服务,只有发布后的修改才可以通过API请求到

适用范围

自定义模板可以用来识别并得到结构化输出的图片内容包括但不限于

证件类


票据类


文书类

【重点】如何创建模板

上面的所有自定义模板案例图片中,红色部分都是图片中不会变化的文字,我们称之为「锚点」,蓝色部分就是对您业务来说比较重要的需要结构化提取的「识别内容」,接下来我们以常见的大学四六级证书介绍一下如何创建一个自定义模板。

1. 新建模板

在模板管理页面上点击「新建模板」

2. 上传图片

上传一张平整、无遮挡、文字清晰且方向尽量水平的图片作为模板图片

3. 调整图片

设置完模板名称之后,我们进入模板编辑页面,在编辑页面最上方是我们的工具栏,分别对应的功能如果发现图片拍的不太正,可以点击右上角的「旋转」按钮,进行角度调整,(调整的标准是使得图片上的文字均与页面水平线平行),然后可以点击确认保存,旋转后的图片就会被保存下来,后续的标注就都是在旋转过的图片上进行了(不要在已经有了锚点或内容圈选之后再进行旋转哦,会导致已标注的内容位置不准确)。

4. 标注锚点区域

我们在主功能操作栏中选择「框选锚点」,然后圈选出图片上尽可能多的固定不变的文字作为锚点,用来定位,这一步是识别成功的关键。每次圈选,屏幕右侧都会自动识别出圈选的文字内容,自动识别的锚点内容如果有错误,可能是当前图片相关区域不太清晰,您可以手动修改正确

5. 标注识别内容区域

接下来,我们圈选图片上需要识别的内容
a) 识别普通文本
依次圈选之后,在右侧列表中将系统给的默认字段名改为有意义的名称。注意相同名称的内容,在实际识别的时候会被合并到同一个字段(合并后的先后顺序按照右侧排列的顺序,顺序可以拖拽调整哦),常用于文字内容有多行的情况,后面的小贴士中会有介绍。

b) 识别表格内容
本例中的表格比较简单,只有一行内容,因此用普通文本识别也是可以逐一圈选并得到结果的,当然我们也可以用表格内容识别来进行处理,插入一个4列表格

所有的标注都完成后,点击左上角保存,一个模板就制作完成了!

6. 测试效果

接下来我们再找一张四六级证书,点击左上角的「试一试」检测一下模板配置,结构化输出的结果如图,我们发现在这张图片中对应的字段已经全部识别正确

  1. 模板配置可以多次修改并试用,调整至最优后,点击左上角的「发布」,成功后就可以通过模板的唯一标识id去进行接口调用了,具体可以查看API调试方式

【*】小贴士

1. 锚点标注

a. 锚点必须是不变的文字,且中间没有大片空白
b. 锚点需要尽可能靠近需要提取的内容项目,如位于同一行或者相邻行
c. 锚点越多越好,建议在4个以上
d. 请尽量用最小面积的四边形圈选锚点文字
e. 表格中的表头通常也是不变的文字内容,建议也都设置为锚点,如上述例子中的六级成绩单中的分科目成绩表中设置

2. 识别区标注

a.换行字段配置
image.png

  • 如图红色粗实线框所示,图中的收件地址可能会换行
  • 需要在send_addr后面增加(cr)(图中有两个send_addr,其中一个加就可以),系统就会知道当前字段会有换行的内容,如图image.png
  • 如果模板中只有一行,那么:
    • 如果在全部需要识别的图片中存在换行的可能,那么也需要加上(cr)
    • 如果不存在换行的可能,不要添加(cr)

3. 表格内容标注

  • 请将标注的框线和表格本身的边框尽量重合
  • 对于复杂的表格类型,比如包含合并单元格,返回结果中的表格内容暂时无法支持,可以将表格识别可以和普通识别配合使用
  • 暂时不支持只返回部分表格行内容
  • 在表格上下,最好有贴近的锚点
  • 【新功能】我们增强了对于表格框线不全的表格识别的支持
    • image.png如果表格有横线,没有竖线(如上图所示),那么标注时需要在表格名称后面增加(hl),如下图配置image.png
    • 如果表格有竖线,没有横线,那么表格名称后面增加(vl)
    • 如果表格既没有竖线也没有横线,那么表格名称后面增加(nl)

4. 关于试一试

试用后如果发现准确率不符合要求,可以重新尝试调整模板,建议的调整方案包括:
(1).增加锚点数量
(2).扩大识别内容圈选区域
(3).锚点中空白区域大可以拆分成多个锚点
(4).降低锚点标注区域重合

总结

只要您需要大量提取的图片文字内容有固定的排版样式,都可以来试一试自定义模板,用DIY的方式解决业务需求!