文档

AliyunOCR

更新时间:

set_public_auth

set_public_auth (access_key_id, access_key_secret)

方法描述

授权信息,在阿里云官网,用户->AccessKey管理中查看

参数说明

access_key_id<str>访问key

access_key_secret<str>key对应密钥

调用样例- rpa.ai.aliyun_ocr.set_public_auth-

说明

内置SDK所使用的能力基于阿里云OCR,调用前请先前往OCR侧开通相关服务(详见阿里云RPA控制台-资产管理-OCR能力);开通后推荐选择服务端鉴权方式,安全性更高;否则需要在代码内自行配置ak/sk信息,一般适用于开通OCR服务的账号与使用RPA的账号不属于同一主账号的情况。

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
ak = 'LT******XH'
ak_secret = 'YI******M3'
rpa.ai.aliyun_ocr.set_public_auth(ak ,ak_secret )

recognize_advanced

recognize_advanced (image_path, output_char_info=False, need_rotate=False, output_table=False, need_sort_page=False, output_figure=False, no_stamp=False, paragraph=False, row=False)

方法描述

OCR全文高精识别高精版

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

output_char_info<bool>是否输出单字识别结果

need_rotate<bool>是否需要自动旋转功能

output_table<bool>是否输出表格识别结果,包含单元格信息

need_sort_page<bool>是否按顺序输出文字块

output_figure<bool>是否需要图案检测功能

no_stamp<bool>是否需要去除印章功能

paragraph<bool>是否需要分段功能

row<bool>是否需要成行返回功能

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442247.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_advanced-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/1845565761/p551695.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_advanced(image_url)
# 获取OCR识别的文本内容
# content = json.loads(output_result_dict["Data"])['content']
# print(content)

recognize_handwriting

recognize_handwriting (image_path, output_char_info=False, need_rotate=False, output_table=False, need_sort_page=False)

方法描述

OCR通用手写体识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

output_char_info<bool>是否输出单字识别结果

need_rotate<bool>是否需要自动旋转功能

output_table<bool>是否输出表格识别结果,包含单元格信息

need_sort_page<bool>是否按顺序输出文字块

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442248.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_handwriting-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/3733380861/p623828.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_handwriting(image_url)
# 获取OCR识别的文本内容
# content = json.loads(output_result_dict["Data"])['content']
# print(content)

recognize_general

recognize_general (image_path)

方法描述

OCR通用文字识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442250.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_general-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9845565761/p555969.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_general(image_url)
# 获取OCR识别的文本内容
# content = json.loads(output_result_dict["Data"])['content']
# print(content)

recognize_document_structure

recognize_document_structure (image_path, output_char_info=False, need_rotate=False, output_table=False, need_sort_page=False, page=False, no_stamp=False, paragraph=False, row=False, use_new_style_output=False)

方法描述

OCR文档结构化识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

output_char_info<bool>是否输出单字识别结果

need_rotate<bool>是否需要自动旋转功能

output_table<bool>是否输出表格识别结果,包含单元格信息

need_sort_page<bool>是否按顺序输出文字块

page<bool>是否需要分页功能

no_stamp<bool>是否需要去除印章功能

paragraph<bool>是否需要分段功能

row<bool>是否需要成行返回功能

use_new_style_output<bool>是否返回新版格式输出

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/469431.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_document_structure-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/1443380861/p623845.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_document_structure(image_url)
# 获取OCR识别的文本内容
# content = json.loads(output_result_dict["Data"])['content']
# print(content)

recognize_table_ocr

recognize_table_ocr (image_path, need_rotate=False, lineless=False, skip_detection=False)

方法描述

OCR表格识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

need_rotate<bool>是否需要自动旋转功能

lineless<bool>是否无线条

skip_detection<bool> 是否跳过检测

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442251.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_table_ocr-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9833380861/p623831.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_table_ocr(image_url)
# 获取OCR识别的表格内容
# content = json.loads(output_result_dict["Data"])['content']
# print(content)

recognize_id_card

recognize_id_card (image_path, output_figure=False, output_quality_info=False)

方法描述

OCR身份证识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

output_figure<str>是否需要图案检测功能

output_quality_info<str>是否需要身份证质量检测功能

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442255.html

<Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_id_card-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/8543380861/p623850.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_id_card(image_url)
# 获取OCR识别的身份证内容
# data = json.loads(output_result_dict["Data"])['data']['face']['data']
# print(data)

recognize_bank_card

recognize_bank_card (image_path)

方法描述

OCR银行卡识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442259.html

<Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_bank_card-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/6743380861/p623853.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_bank_card(image_url)
# 获取OCR识别的银行卡内容
# data = json.loads(output_result_dict["Data"])['data']
# print(data)

recognize_mixed_invoices

recognize_mixed_invoices (image_path)

方法描述

OCR混贴发票识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442266.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_mixed_invoices-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/4153380861/p623855.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_mixed_invoices(image_url)
# 获取OCR识别混贴发票的内容
# Data = json.loads(output_result_dict["Data"])
# print(Data)

recognize_invoices

recognize_invoices (image_path)

方法描述

OCR增值税发票识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442267.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_invoices-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/0653380861/p623862.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_invoices(image_url)
# 获取OCR识别增值税发票的内容
# data = json.loads(output_result_dict["Data"])['data']
# print(data)

recognize_air_itinerary

recognize_air_itinerary (image_path)

方法描述

OCR航空行程单识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442270.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_air_itinerary-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/8263380861/p623872.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_air_itinerary(image_url)
# 获取OCR识别航空行程单的内容
# data = json.loads(output_result_dict["Data"])['data']
# print(data)

recognize_car_vin_code

recognize_car_vin_code (image_path)

方法描述

OCR车辆vin码识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442302.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_car_vin_code-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/8893380861/p623904.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_car_vin_code(image_url)
# 获取OCR识别车辆vin码的内容
# content = json.loads(output_result_dict["Data"])['content']
# print(content)

recognize_train_invoice

recognize_train_invoice (image_path)

方法描述

OCR火车票识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442271.html

<Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_train_invoice-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/1563380861/p623876.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_train_invoice(image_url)
# 获取OCR识别火车票的内容
# data = json.loads(output_result_dict["Data"])['data']
# print(data)

recognize_taxi_invoice

recognize_taxi_invoice (image_path)

方法描述

OCR出租车发票识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442272.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_taxi_invoice-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9663380861/p623886.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_taxi_invoice(image_url)
# 获取OCR识别出租车发票的内容
# data = json.loads(output_result_dict["Data"])['data']
# print(data)

recognize_roll_ticket

recognize_roll_ticket (image_path)

方法描述

OCR增值税发票卷票识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442273.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_roll_ticket-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/3073380861/p623889.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_roll_ticket(image_url)
# 获取OCR识别增值税发票卷票的内容
# data = json.loads(output_result_dict["Data"])['data']
# print(data)

recognize_ride_hailing_itinerary

recognize_ride_hailing_itinerary (image_path)

方法描述

OCR网约车行程单识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442281.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_ride_hailing_itinerary-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/2083380861/p623894.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_ride_hailing_itinerary(image_url)
# 获取OCR识别网约车行程单的内容
# data = json.loads(output_result_dict["Data"])['data']
# print(data)

recognize_car_number

recognize_car_number (image_path)

方法描述

OCR车牌识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442301.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_car_number-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/1704380861/p623916.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_car_number(image_url)
# 获取OCR识别车牌的内容
# data = json.loads(output_result_dict["Data"])['data']['data']
# print(data)

recognize_vehicle_license

recognize_vehicle_license (image_path)

方法描述

OCR行驶证识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442298.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_vehicle_license-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/7619580861/p625352.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_vehicle_license(image_url)
# 获取OCR识别行驶证的内容
# data = json.loads(output_result_dict["Data"])['data']['face']['data']
# print(data)

recognize_driving_license

recognize_driving_license (image_path)

方法描述

OCR驾驶证识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442299.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_driving_license-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/9714380861/p623946.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_driving_license(image_url)
# 获取OCR识别驾驶证的内容
# data = json.loads(output_result_dict["Data"])['data']['face']['data']
# print(data)

recognize_basic

recognize_basic (image_path)

方法描述

OCR电商图片文字识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442249.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_basic-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/7043380861/p623838.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_basic(image_url)
# 获取OCR识别电商图片文字的内容
# content = json.loads(output_result_dict["Data"])['content']
# print(content)

recognize_quota_invoice

recognize_quota_invoice (image_path)

方法描述

OCR定额发票识别

参数说明

image_path<str>待识别图像路径,支持本地路径或url路径

返回值说明

OCR接口原始返回结果字典,具体解析方式请参照https://help.aliyun.com/document_detail/442269.html <Dict>

调用样例- rpa.ai.aliyun_ocr.recognize_quota_invoice-

# 服务获取可参考阿里云OCR服务官网:https://ai.aliyun.com/ocr
# 代码调用样例如下:
image_url = 'https://help-static-aliyun-doc.aliyuncs.com/assets/img/zh-CN/3853380861/p623867.png'
output_result_dict = rpa.ai.aliyun_ocr.recognize_quota_invoice(image_url)
# 获取OCR识别定额发票的内容
# data = json.loads(output_result_dict["Data"])['data']
# print(data)