本文介绍了调用图片异步检测接口(/green/image/asyncscan)进行卡证票据混贴OCR识别的方法。卡证票据混贴OCR能够自动识别出图片中混贴的多个卡证或票据内容,以及其中的文字信息,并支持以结构化的方式返回文字信息。如果您需要识别票据报销类图片中的文字内容,推荐您使用该场景。

卡证票据混贴OCR识别目前支持识别以下类型的混贴图片:
  • 混贴发票:表示包含火车票、机票行程单、出租车票、定额发票、增值税发票、卷票、银行卡、驾驶证正面、户口簿户主页、户口簿常住人口页中一项或多项内容的图片
  • 混贴身份证:表示包含身份证正面、身份证反面中一项或多项内容的图片
  • 混贴行驶证:表示包含行驶证、行驶证副页中一项或多项内容的图片

图片异步检测接口说明

业务接口:/green/image/asyncscan,表示图片异步检测。

您可以调用该接口创建图片异步检测任务。关于如何构造HTTP请求,请参见请求结构;您也可以直接选用已构造好的HTTP请求,具体请参见SDK概览

  • 计费信息

    该接口为收费接口,具体计费方式请参见内容安全产品定价

  • 检测超时

    同步检测允许的最长检测时间是6秒,如果检测在该时间限制内没有完成,系统会强制返回超时错误码。如果您对实时性要求不高,可以选择异步检测,其他情况下请选择同步检测,同步检测接口的调用相对简单些。对于同步检测接口的调用,建议您将超时时间设置为6秒。

  • 返回结果

    异步检测任务不会实时返回检测结果,您需要通过callback或者轮询的方式获取检测结果。检测结果最长保留一小时。

    • callback获取检测结果:提交异步检测任务时,在请求参数中传入callback参数,用来自动接收检测结果,具体请参见(异步检测)请求参数
    • 轮询获取检测结果:提交异步检测任务时,无需传入callback参数;提交异步检测任务后,调用结果查询接口获取检测结果,具体请参见图片异步检测结果查询接口说明
  • 图片要求
    • 图片链接支持以下协议:HTTP和HTTPS。
    • 图片支持以下格式:PNG、JPG、JPEG、BMP、GIF、WEBP。
    • 图片大小限制为10 MB以内(适用于同步和异步调用)。如您有特殊需求(大图片),可以提交工单进行调整。
    • 图片下载时间限制为3秒内,如果下载时间超过3秒,返回下载超时。
    • 图片像素建议不低于256*256,像素过低可能会影响识别效果。
    • 图片检测接口响应时间依赖图片的下载时间。请保证被检测图片所在的存储服务稳定可靠,建议您使用阿里云OSS存储或者CDN缓存等。

(异步检测)请求参数

名称 类型 是否必须 描述
bizType 字符串 该字段用于标识您的业务场景。您可以通过内容安全控制台创建业务场景(具体操作请参见自定义机审标准),或者提交工单联系我们帮助您创建业务场景。
scenes 字符串数组 指定检测场景,取值:ocr
callback 字符串 异步检测结果回调通知您的URL,支持使用HTTP和HTTPS协议的地址。该字段为空时,您必须定时轮询检测结果。
callback接口必须支持POST方法、UTF-8编码的传输数据,以及表单参数checksumcontent。内容安全按照以下规则和格式设置checksumcontent,调用您的callback接口返回检测结果。
  • checksum:字符串格式,由用户uid + seed + content拼成字符串,通过SHA256算法生成。用户UID即阿里云账号ID,可以在阿里云控制台查询。为防篡改,您可以在获取到推送结果时,按上述算法生成字符串,与checksum做一次校验。
    说明 用户UID必须是阿里云主账号UID,而非子账号UID。
  • content:JSON字符串格式,请自行解析反转成JSON对象。content结果的示例请参见查询异步检测结果的返回示例。
说明 您的服务端callback接口收到内容安全推送的结果后,如果返回的HTTP状态码为200,则表示接收成功,其他的HTTP状态码均视为接收失败。接收失败时,内容安全将最多重复推送16次检测结果,直到接收成功。重复推送16次后仍未接收成功,则不再推送,建议您检查callback接口的状态。
seed 字符串 随机字符串,该值用于回调通知请求中的签名。当使用callback时,该字段必须提供。
tasks JSON数组 指定检测对象,JSON数组中的每个元素是一个OCR图文检测任务结构体。最多支持10个元素,即对10张图片进行识别。每个元素的具体结构描述请参见task
extras JSON结构体 指定要识别的混贴票据的类型,格式为{"card":"${CardType}"}CardType表示票据类型,取值:
  • multi-invoice:混贴发票,表示包含火车票、机票行程单、出租车票、定额发票、增值税发票、卷票、银行卡、驾驶证正面、户口簿户主页、户口簿常住人口页中一项或多项内容的图片
  • multi-idcard:混贴身份证,表示包含身份证正面、身份证反面中一项或多项内容的图片
  • multi-vehicle-license:混贴行驶证,表示包含行驶证、行驶证副页中一项或多项内容的图片
表 1. task
名称 类型 是否必须 描述
dataId 字符串 数据ID。需要保证在一次请求中所有的ID不重复。
url 字符串 待检测图片的URL。

(异步检测)返回数据

名称 类型 描述
code 整型 错误码,和HTTP状态码一致。
msg 字符串 错误描述信息。
dataId 字符串 检测对象对应的数据ID。
说明 如果在检测请求参数中传入了dataId,则此处返回对应的dataId
taskId 字符串 检测任务的ID。
url 字符串 检测对象的URL。
extras JSON结构体 额外调用参数,对应检测请求参数中的extras
说明 该参数可能会被调整,目前请勿依赖该参数的返回值。

(异步检测)示例

请求示例
说明 以混贴发票识别为例(extras传入{"card": "multi-invoice"})。如果需要识别其他类型的票据,传入对应的卡证或票据类型即可,具体请参见(异步检测)请求参数
{
    "scenes": [
        "ocr"
    ],
    "extras": {
        "card": "multi-invoice"
    },
    "tasks": [
        {
            "dataId": "test_data_xxxx",
            "url": "https://test_image_xxxx.png"
        }
    ]
}
正常返回示例
{
    "code": 200,
    "msg": "OK",
    "requestId": "92AD868A-F5D2-4AEA-96D4-E1273B8E074C",
    "data": [
        {
            "code": 200,
            "msg": "OK",
            "dataId": "test_data_xxxx",
            "taskId": "img5A@k7a@B4q@6K@d9nfKgOs-1sWeLu",
            "url": "https://test_image_xxxx.png"
        }
    ]
}

图片异步检测结果查询接口说明

业务接口:/green/image/results,表示查询图片异步检测结果。

您可以调用该接口查询图片异步检测任务的结果。关于如何构造HTTP请求,请参见请求结构;您也可以直接选用已构造好的HTTP请求,具体请参见SDK概览

  • 计费信息

    该接口不计费。

  • 查询超时

    建议您将查询间隔设置为30秒(即在提交异步检测任务30秒后查询结果),最长不能超出4个小时,否则结果将会丢失。

(结果查询)请求参数

名称 类型 是否必须 描述
body JSON数组 要查询的异步检测任务的taskId列表。数组长度不超过1000。

(结果查询)返回数据

名称 类型 描述
code 整型 错误码,和HTTP的status code一致。
msg 字符串 错误描述信息。
dataId 字符串 检测对象对应的数据ID。
说明 如果在检测请求参数中传入了dataId,则此处返回对应的dataId
taskId 字符串 检测任务的ID。
url 字符串 检测对象的URL。
extras JSON结构体 额外调用参数,对应检测请求参数中的extras
说明 该参数可能会被调整,目前请勿依赖该参数的返回值。
results 数组 返回结果。调用成功时(code=200),返回结果中包含一个或多个元素。每个元素是个结构体,具体结构描述请参见result
表 2. result
名称 类型 描述
scene 字符串 检测场景,取值:ocr
label 字符串 检测结果的分类。取值:
  • normal:图片中未识别出文字信息。
  • ocr:图片中包含文字信息。
suggestion 字符串 建议用户执行的操作,取值:
  • pass:无需关注返回结果。
  • review:关注识别出的文字信息。
rate 浮点数 在OCR图文识别场景中,可以不用关注该返回值。
multiCardInfo 结构体列表 识别出来的卡证或票据信息,包含火车票、机票行程单、出租车票、定额发票、增值税发票、卷票、银行卡、驾驶证、户口簿户主页、户口簿常住人口页、身份证正面、身份证反面、行驶证、行驶证副页。具体结构描述请参见multiCardInfo
multiCardInfo
  • 火车票信息
    名称 类型 描述
    price 字符串 票价。
    ticketNumber 字符串 票号。
    departureTime 字符串 开车时间。
    seatType 字符串 座位类型。
    trainNumber 字符串 车次。
    departure 字符串 出发站。
    departurePhonics 字符串 出发站拼音。
    seatNumber 字符串 座位号。
    destination 字符串 到达站。
    destinationPhonics 字符串 到达站拼音。
    passengerInfo 字符串 旅客信息。
    type 字符串 票据的类型,取值固定为train-ticket,表示火车票。
  • 机票行程单信息
    名称 类型 描述
    fare 字符串 票价。
    fuelSurcharge 字符串 燃油附加费。
    serialNo 字符串 印刷序号。
    flight 字符串 航班号。
    agentCode 字符串 销售单位代号。
    eTicketNo 字符串 电子客票号码。
    depart 字符串 出发地。
    issueOrg 字符串 填开单位。
    id 字符串 有效身份证号码。
    fund 字符串 明航发展基金。
    passenger 字符串 旅客姓名。
    insurance 字符串 保险费。
    total 字符串 合计。
    date 字符串 日期。
    arrive 字符串 目的地。
    ck 字符串 校验码。
  • 出租车票信息
    名称 类型 描述
    actualCollection 字符串 实收金额。
    carNumber 字符串 车号。
    date 字符串 日期。
    invoiceCode 字符串 发票代码。
    invoiceNumbe 字符串 发票号码。
    mileage 字符串 里程。
    amount 字符串 金额。
    getOffTime 字符串 下车时间。
    boardingTime 字符串 上车时间。
    totalAmount 字符串 合计。
    type 字符串 票据的类型,取值固定为taxi-ticket,表示出租车票。
  • 定额发票信息
    名称 类型 描述
    amountInWords 字符串 大写金额。
    invoiceSerial 字符串 发票代码解析。
    amountInFigures 字符串 小写金额。
    invoiceNumber 字符串 发票号码。
    invoiceCode 字符串 发票代码。
    batchNumber 字符串 批次号。
    year 字符串 年份。
    taxBureauCode 字符串 税务局代码。
    invoiceIndustryCode 字符串 发票行业代码。
    amountVersion 字符串 金额版。
    regionalismCode 字符串 行政区划代码。
    invoiceCategoryCode 字符串 发票类别代码。
    type 字符串 票据的类型,取值固定为quota-invoice,表示定额发票。
  • 增值税发票信息
    名称 类型 描述
    invoice_name 字符串 发票名称。
    invoice_id 整型 发票代码。
    invoice_number 整型 发票号码。
    invoice_date 整型 开票日期。
    invoice_bcompany 字符串 购买方名称。
    invoice_bcode 字符串 购买方纳税人识别号。
    invoice_baddress 字符串 购买方地址、电话。
    invoice_baccount 字符串 购买方开户行及账号。
    invoice_password 字符串 发票密码。
    invoice_detail 数组 发票明细。具体结构描述请参见invoice_detail
    invoice_totalamount 浮点型 合计金额。
    invoice_totaltax 浮点型 合计税额。
    invoice_totalamountupper 字符串 价税合计(大写)。
    invoice_totalamountlower 字符串 价税合计(小写)。
    invoice_scompany 字符串 销售方名称。
    invoice_scode 字符串 销售方纳税人识别号。
    invoice_saddress 字符串 销售方地址、电话。
    invoice_saccount 字符串 销售方开户行及账号。
    invoice_remark 字符串 备注。
    invoice_payee 字符串 收款人。
    invoice_reviewer 字符串 复核。
    invoice_drawer 字符串 开票人。
    表 3. invoice_detail
    名称 类型 描述
    detail_name 字符串 货物或应税劳务、服务名称。
    detail_type 字符串 规格型号。
    detail_unit 字符串 单位。
    detail_count 浮点型 数量。
    detail_unitprice 浮点型 单价。
    detail_amount 浮点型 金额。
    detail_rate 字符串 税率。
    detail_tax 浮点型 税额。
  • 卷票信息
    名称 类型 描述
    date 字符串 开票日期。
    seller 字符串 销售方名称。
    buyer 字符串 购买方名称。
    taxNo 字符串 销售方税号。
    total 字符串 总价。
    ck 字符串 校验码。
    invoiceNo 字符串 发票号码。
    invoiceCode 字符串 发票代码。
    buyerTaxCode 字符串 购买方税号。
  • 银行卡信息
    名称 类型 描述
    bankCardNum 字符串 银行卡号。
  • 驾驶证信息
    名称 类型 描述
    name 字符串 姓名。
    number 字符串 驾驶证号。
    sex 字符串 性别。取值:
    address 字符串 住址。
    vehicleType 字符串 准驾车型。
    validStartDate 字符串 有效期开始时间,格式:yyyy-MM-dd。
    validEndDate 字符串 有效期截止时间,格式:yyyy-MM-dd。
  • 户口簿户主页信息
    名称 类型 描述
    locationNumber 字符串 地段号。
    issueDate 字符串 签发日期。
    householdType 字符串 户别。
    houseHolder 字符串 户主姓名。
    address 字符串 住址。
    community 字符串 户主社区。
    householdNumber 字符串 户号。
    undertaker 字符串 承办人签章。
    type 字符串 卡证的类型,取值固定为household-head,表示户口簿户主页。
  • 户口簿常住人口页信息
    名称 类型 描述
    occupation 字符串 职业。
    migrationDate1 字符串 何时由何地迁来本址。
    idNumber 字符串 身份证编号。
    education 字符串 文化程度。
    birthPlace 字符串 出生地。
    servicePremises 字符串 服务处所。
    householdNumber 字符串 户号。
    hometown 字符串 籍贯。
    gender 字符串 性别。
    name 字符串 姓名。
    formerName 字符串 曾用名。
    maritalStatus 字符串 婚姻状况。
    ation 字符串 民族。
    otherAddress 字符串 本市其他住址。
    birthday 字符串 出生日期。
    militaryService 字符串 兵役状况。
    relationTo 字符串 与户主关系。
    religion 字符串 宗教信仰。
    bloodType 字符串 血型。
    registerDate 字符串 登记日期。
    height 字符串 身高。
    migrationDate2 字符串 何时何地迁来本市。
    undertaker 字符串 承办人签章。
    type 字符串 卡证的类型,取值固定为household-resident,表示户口簿常住人口页。
  • 身份证信息
    名称 类型 描述
    name 字符串 姓名。
    sex 字符串 性别。取值:
    nationality 字符串 民族。
    number 字符串 身份证号。
    birth 字符串 出生日期。格式:yyyy-MM-dd。
    address 字符串 住址。
    authority 字符串 签发机构。
    startDate 字符串 有效期开始日期。格式:yyyy-MM-dd。
    endDate 字符串 有效期结束日期。格式:yyyy-MM-dd。
    说明 该字段可能返回以下值:长期
    angle 浮点数 证件顺时针旋转的角度。
    copy 布尔型 身份证照片是否是复印件。取值:
    • true:是
    • false:否
    说明 默认不返回该字段。如果需要返回,请提交工单联系我们。
    remake 布尔型 身份证照片是否是翻拍。取值:
    • true:是
    • false:否
    说明 默认不返回该字段。如果需要返回,请提交工单联系我们。
    type 字符串 证件类型。取值:
    • front:身份证正面(人像面)
    • back:身份证背面(国徽面)
    • front_back:正常身份证正反同页
    • interim_front:临时身份证正面(人像面)
    • interim_back:临时身份证背面(国徽面)
    • interim_front_back:临时身份证正反同页
    numberValid 布尔型 证件号码是否合法。取值:
    • true:是
    • false:否
      说明 如果长度不正确或者号码不符合国家规范,会返回false
  • 行驶证信息
    名称 类型 描述
    plateNum 字符串 车牌号。
    vehicleType 字符串 车辆类型。
    owner 字符串 所有者名字。
    useCharacter 字符串 车辆使用性质。
    address 字符串 住址。
    model 字符串 车辆品牌。
    vin 字符串 车辆识别代号。
    engineNum 字符串 发动机号码。
    registerDate 字符串 注册日期,格式:yyyy-MM-dd。
    issueDate 字符串 发证日期,格式:yyyy-MM-dd。
  • 行驶证副页信息
    名称 类型 描述
    plateNum 字符串 车牌号。
    fileNum 字符串 档案编号。
    appprovedPassengerCapacity 整型 核定载人数。
    grossMass 字符串 总质量。
    unladenMass 字符串 整备质量。
    approvedLoad 字符串 核定载质量。
    tractionMass 字符串 准牵引总质量。
    inspectionRecord 字符串 检验记录。
    overallDimension 结构体 车辆轮廓尺寸信息,具体结构描述请参见overallDimension
    表 4. overallDimension
    名称 类型 描述
    length 整型 车辆长度,单位:毫米。
    width 整型 车辆宽度,单位:毫米。
    height 整型 车辆高度,单位:毫米。

(结果查询)示例

请求示例
[
    "img5A@k7a@B4q@6K@d9nfKgOs-1sWeLu"
]
正常返回示例
说明 以只包含卷票或机票行程单为例。其他类型的卡证或票据结果示例,请参见结构化卡证OCR示例结构化票据OCR示例
  • 卷票信息
    {
        "msg": "OK",
        "code": 200,
        "data": [
            {
                "msg": "OK",
                "code": 200,
                "dataId": "test_data_xxxx",
                "extras": {
                    "md5": "d38999af9b6b2111568eda095029b768"
                },
                "results": [
                    {
                        "multiCardInfo": [
                            {
                                "date": "",
                                "seller": "",
                                "total": "",
                                "ck": "",
                                "buyerTaxCode": "",
                                "taxNo": "",
                                "invoiceNo": "00000000",
                                "type": "roll-ticket",
                                "invoiceCode": "000000000000",
                                "buyer": ""
                            }
                        ],
                        "rate": 99.91,
                        "suggestion": "review",
                        "label": "ocr",
                        "scene": "ocr"
                    }
                ],
                "taskId": "img5A@k7a@B4q@6K@d9nfKgOs-1sWeLu",
                "url": "https://test_image_xxxx.png"
            }
        ],
        "requestId": "3DC92A4B-2346-4519-B1C5-DD277AB3A5F8"
    }
  • 机票行程单信息
    {
        "msg": "OK",
        "code": 200,
        "data": [
            {
                "msg": "OK",
                "code": 200,
                "dataId": "test_data_xxxx",
                "extras": {
                    "md5": "1f22c383a8b83479e91182def3ff1489"
                },
                "results": [
                    {
                        "multiCardInfo": [
                            {
                                "insurance": "XXX",
                                "date": "",
                                "fare": "50.00",
                                "flight": "",
                                "agentCode": "CGO2750**",
                                "eTicketNo": "7R469550**",
                                "ck": "",
                                "type": "flight-itinerary",
                                "issueOrg": "xxxx航空服务公司",
                                "serialNo": "706229**",
                                "total": "CNY630.00",
                                "fund": "",
                                "passenger": "张三",
                                "arrive": "成都",
                                "id": "41010519651**",
                                "fuelSurcharge": "",
                                "depart": "郑州"
                            }
                        ],
                        "rate": 99.91,
                        "suggestion": "review",
                        "label": "ocr",
                        "scene": "ocr"
                    }
                ],
                "taskId": "test_image_xxxx.png",
                "url": "https://img5A@k7a@B4q@6K@d9nfKgOs-1sWeLu"
            }
        ],
        "requestId": "FE52C03C-1BAA-4D16-B29C-750A45C65E26"
    }