如何在RPA中使用阿里云文字识别(OCR)能力

1. 概述

为方便用户在RPA流程中结合AI技术识别图文证照,阿里云RPA在公共云环境下内置了阿里云文字识别(OCR)的产品能力。用户完成服务开通与授权后,可以在RPA编辑器中以组件的形式直接调用相关能力。目前,RPA在公共云环境中已接入的OCR能力如下表所示:

能力大类

对应可视化组件

对应编码SDK

通用文字类

OCR全文高精识别

recognize_advanced

OCR通用手写体识别

recognize_handwriting

OCR表格识别

recognize_table_ocr

OCR电商图片文字识别

recognize_basic

OCR通用文字识别

recognize_general

OCR文档结构化识别

recognize_document_structure

个人证照类

OCR身份证识别

recognize_id_card

OCR银行卡识别

recognize_bank_card

票据凭证类

OCR混贴发票识别

recognize_mixed_invoices

OCR增值税发票识别

recognize_invoices

OCR定额发票识别

recognize_quota_invoice

OCR航空行程单识别

recognize_air_itinerary

OCR火车票识别

recognize_train_invoice

OCR出租车发票识别

recognize_taxi_invoice

OCR增值税发票卷票识别

recognize_roll_ticket

车辆物流类

OCR网约车行程单识别

recognize_ride_hailing_itinerary

OCR车辆vin识别

recognize_car_vin_code

OCR车牌识别

recognize_car_number

OCR驾驶证识别

recognize_driving_license

OCR行驶证识别

recognize_vehicle_license

若您希望在您的公共云RPA流程中调用上述能力,请参照下文进行配置。

2. 开通OCR服务

在调用阿里云文字识别(OCR)的相关能力前,需要您先根据业务需要,进行对应类别的服务开通。

  1. 前往OCR-服务管理与开通页面

  2. 参照上表,选择对应的能力大类,点击开通服务,按照提示完成服务开通即可。

截屏2023-02-03 下午5

3. 配置鉴权方式

  1. 通过阿里云主账号登录RPA控制台,进入资产管理-OCR能力页面。

  2. 阿里云RPA支持两种调用OCR服务的鉴权方式:

    1. 服务端鉴权(推荐方式):安全性更高,无需额外维护AK/SK,但开通OCR服务的账号与使用RPA的账号须属同一主账号

    2. 客户端鉴权: 您需要在流程内自行配置AK/SK,适用于开通OCR服务的账号与使用RPA的账号不属于同一主账号的情况

  3. 若您选择基于服务端的鉴权方式,请点击立即授权,跟随弹窗指引,完成授权后界面如下图所示即为成功授权:截屏2023-02-03 下午6

  4. 若您选择基于客户端的鉴权方式,则无需在RPA控制台进行鉴权配置。

4. 开发RPA流程

完成上述OCR服务的开通和鉴权配置后,您可以在RPA编辑器中直接使用OCR相关的可视化组件/编码SDK进行您的流程开发。

说明

上述功能仅在阿里云RPA 4.7.5.499及更高版本中支持