支持包括发票代码、发票号码、日期、发票金额等关键字段结构化识别输出。
接口说明
本接口适用场景
- 阿里云出租车发票识别,是阿里云官方自研 OCR 文字识别产品,适用于识别出租车发票所包含的发票代码、发票号码、金额、里程等关键信息的场景。
- 阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。
- 本接口图片示例

本接口核心能力
| 分类 | 概述 | 
|---|---|
| 图像增强 | 默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。 | 
| 多类型覆盖 | 支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。 | 
| 高精度识别 | 总体识别准确率可达 97%。 | 
如何使用本接口
| 步骤 | 概述 | 
|---|---|
| 1 | 开通 票据凭证识别 服务。开通服务前后,您可以通过体验馆免费体验本功能识别效果。 | 
| 2 | 购买票据凭证识别资源包。本 API 会赠送免费额度,可使用免费额度测试。您也可以不购买资源包,系统会通过“按量付费”方式按实际调用量自动扣款。 | 
| 3 | 可以参照调试页面提供的代码示例完成 API 接入开发。接入完成后,调用 API 获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对 RAM 账号进行授权。创建 RAM 用户的具体操作,请参考:创建 RAM 用户。文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见在用户页面为 RAM 用户授权。 | 
重要提示
| 类型 | 概述 | 
|---|---|
| 图片格式 | 
 | 
| 图片尺寸 | 
 | 
| 图片大小 | 
 | 
| 其他提示 | 
 | 
调试
您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。
授权信息
下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:
- 操作:是指具体的权限点。
- 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
- 资源类型:是指操作中支持授权的资源类型。具体说明如下:- 对于必选的资源类型,用前面加 * 表示。
- 对于不支持资源级授权的操作,用全部资源表示。
 
- 条件关键字:是指云产品自身定义的条件关键字。
- 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
| 操作 | 访问级别 | 资源类型 | 条件关键字 | 关联操作 | 
|---|---|---|---|---|
| ocr:RecognizeTaxiInvoice | *全部资源 * | 
 | 无 | 
请求参数
| 名称 | 类型 | 必填 | 描述 | 示例值 | 
|---|---|---|---|---|
| Url | string | 否 | 
 | https://img.alicdn.com/tfs/TB1.OicXebviK0jSZFNXXaApXXa-364-982.jpg | 
| body | byte | 否 | 
 | 图片二进制文件 | 
返回参数
返回参数说明
| 字段 | 类型 | 说明 | 
|---|---|---|
| data | object | 结构化信息。 | 
| angle | int | 图片的角度,0 表示正向,90 表示图片朝右,180 朝下,270 朝左。 | 
| prism_keyValueInfo | list | 结构化信息的坐标信息。 | 
| ftype | int | 是否为复印件(1:是,0:否)。 | 
| height | int | 算法矫正图片后的高度。 | 
| width | int | 算法矫正图片后的宽度。 | 
| orgHeight | int | 原图的高度。 | 
| orgWidth | int | 原图的宽度。 | 
| sliceRect | list | 检测出的子图坐标信息。 | 
结构化信息(data 字段)
| 字段 | 类型 | 说明 | 
|---|---|---|
| date | string | 乘车日期。 | 
| dropOffTime | string | 下车时间。 | 
| fare | string | 金额。 | 
| invoiceCode | string | 发票代码。 | 
| invoiceNumber | string | 发票号码。 | 
| licensePlateNumber | string | 车牌号。 | 
| mileage | string | 里程。 | 
| pickUpTime | string | 上车时间。 | 
结构化坐标信息(prism_keyValueInfo 字段)
| 字段 | 类型 | 说明 | 
|---|---|---|
| key | string | 识别出的字段名称。 | 
| keyProb | int | 字段名称置信度。 | 
| value | string | 识别出的字段名称对应的值。 | 
| valueProb | int | 字段名称对应值的置信度。 | 
| valuePos | list | 字段在原图中的四个点坐标(左上、右上、右下、左下)。 | 
示例
正常返回示例
JSON格式
{
  "RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
  "Data": "{ \t\"data\": { \t\t\"licensePlateNumber\": \"B-30T76\", \t\t\"date\": \"2018-09-28\", \t\t\"invoiceCode\": \"150001583910\", \t\t\"invoiceNumber\": \"22566685\", \t\t\"mileage\": \"22.8\", \t\t\"fare\": \"¥57.00\", \t\t\"dropOffTime\": \"01:40\", \t\t\"pickUpTime\": \"01:19\" \t}, \t\"ftype\": 0, \t\"height\": 982, \t\"orgHeight\": 982, \t\"orgWidth\": 364,  \t\"width\": 364 }",
  "Code": "noPermission",
  "Message": "You are not authorized to perform this operation."
}错误码
访问错误中心查看更多错误码。
变更历史
| 变更时间 | 变更内容概要 | 操作 | 
|---|---|---|
| 2021-08-17 | OpenAPI 入参发生变更 | 查看变更详情 | 
