OCR文档结构化识别

1. 组件介绍

说明

必要前置组件:无

建议后置组件:条件分支(可通过分支条件判断OCR能力是否调用成功并设计后续对应流程)

利用本组件可以使用OCR技术对文档信息进行结构化识别(示例)。

2. 输入项

说明

请参照可视化编辑器内组件面板中各输入项的帮助信息

3. 输出项

说明

请参照可视化编辑器内组件面板中各输出项的帮助信息

3.1. 接口关键返回结果

该输出项以字典形式返回接口中的关键识别结果字典,字典中包含的键值说明如下

key

key含义

value数据类型

content

识别出图片的文字块汇总

字符串

3.2. 错误信息

该输出项以字符串的形式返回错误码与错误信息,详细说明请参照读光OCR错误中心

https://next.api.aliyun.com/document/ocr-api/2021-07-07/errorCode

4. 组件使用示例

4.1. 组件配置示例

  1. 在“AI引擎”中,选择“阿里云文字识别(OCR)”

  2. 在“待识别图片文件路径”中,填写您希望识别图片的文件路径(本例中以下图为例)

    image
  3. 高级选项保持默认值

4.2. 示例执行结果

image

5. 流程示例

5.1. 搭建流程

  1. 利用OCR文档结构化识别组件,选取待识别图片文件路径

  2. 利用条件分支组件,通过分支条件(v_documents_tructure_success_1 等于值(布尔值) True)判断该OCR能力是否调用成功

  3. 利用获取指定key的值组件,在调用成功的条件分支中,获取接口关键返回结果字典中v_documents_tructure_data_1的指定key(content)

  4. 利用记录日志组件,打印获取到的关键识别结果

  5. 利用记录日志组件,在调用失败的条件分支中,打印错误信息 image

5.2. 执行结果

如下图所示,该OCR能力成功被调用后,在日志面板中打印识别结果。

image